Bioestatística

Moda, Mediana e Média

As medidas de tendência central são ferramentas estatísticas que ajudam a descrever um conjunto de dados, identificando valores que representam o "centro" ou ponto de equilíbrio dos dados. As três medidas mais comuns são a média aritmética, a mediana e a moda. Vamos explorar cada uma delas com exemplos práticos.

Moda

A moda é o valor que mais se repete em um conjunto de dados. Um conjunto de dados pode ter uma ou mais modas, ou até mesmo não ter nenhuma, se todos os valores aparecerem com a mesma frequência.

Exemplo 1: Considere o seguinte conjunto de dados:
4,2,5,8,6,4,7,4,3

Exemplo 2: Outro conjunto de dados:
1,2,2,3,4,4,5

Mediana

A mediana é o valor que separa a metade superior da metade inferior de um conjunto de dados ordenado. Se o número de observações for ímpar, a mediana é o valor do meio. Se for par, a mediana é a média dos dois valores do meio.

Exemplo 1: Conjunto de dados (número ímpar de elementos):
7,3,1,5,9

Exemplo 2:Conjunto de dados (número par de elementos):
10,3,6,2

Média Aritmética

A média aritmética (\( \bar{x} \)) é a soma de todos os valores (\(x_i\)) dividida pelo número total de valores (\(n\)) e pode ser escrito através da relação abaixo:

\[ \bar{x} = \frac{\sum_{i=0}^n x_i}{n} \]

Exemplo 1: Conjunto de dados:
2,4,6,8,10

Exemplo 2: Outro conjunto de dados:
5,15,25

Medida de dispersão: desvio padrão

Enquanto as medidas de tendência central (como a média, mediana e moda) nos ajudam a entender o "centro" dos dados, o desvio-padrão é uma medida de dispersão que nos informa o quão dispersos ou concentrados estão os dados em torno da média. Em outras palavras, ele nos mostra o quão distante os dados estão, em média, da média aritmética.

O desvio-padrão quantifica a variação ou dispersão de um conjunto de dados. Um desvio-padrão baixo indica que os dados tendem a estar próximos da média, enquanto um desvio-padrão alto indica que os dados estão espalhados em uma ampla gama de valores.

Existem duas fórmulas principais para calcular o desvio-padrão:

Exemplo Prático: Vamos calcular o desvio-padrão de um conjunto de dados para entender melhor o conceito. Conjunto de dados:
2,4,4,4,5,5,7,9

Conclusão: O desvio-padrão da amostra é aproximadamente 2,14, enquanto o da população é 2.

Tabela de frequências

A tabela de frequências é uma ferramenta estatística que organiza os dados em categorias ou intervalos, facilitando a visualização e interpretação de como os dados se distribuem. Ela é muito útil quando temos um grande conjunto de dados e queremos entender a frequência com que certos valores ocorrem.

...continua...

Probabilidade

A probabilidade de um evento ocorrer pode ser determinada através da fórmula abaixo: \[ P(A) = \frac{n(A)}{n(E)} \] onde:

Ao efetuarmos os cálculo de probabilidade é possível representar os resultados na forma unitária ou através de porcentagem.
É importante frisar que a menor probabilidade de um evento acontecer é igual a zero (0) e a máxima probabilidade é igual a 1, então: \[ 0 \le P(A) \le 1 \] ou, na forma de porcentagem: \[ 0 \% \le P(A) \le 100\% \] Exemplo: Ao jogar um dado comum (6 faces) uma vez, qual a probabilidade de aparecer a face 4?

Função Densidade de Probabilidade e Distribuição Normal

A função densidade de probabilidade (FDP) descreve como a probabilidade é distribuída sobre os possíveis valores de uma variável aleatória contínua. Para uma variável aleatória \(X\), a função densidade de probabilidade \(f(x)\) é dada por:

$$ P(a \leq X \leq b) = \int_a^b f(x)\,dx $$

Distribuição Normal e Score-Z

A distribuição normal é uma das distribuições de probabilidade mais utilizadas em estatística. Sua forma característica de sino é simétrica em torno da média \( \mu \), e a maior parte dos dados está concentrada próximo dessa média. Ela é descrita pela seguinte função densidade de probabilidade (FDP):

\[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \]

Aqui, \( \mu \) é a média da distribuição, \( \sigma \) é o desvio padrão, e \( x \) é o valor da variável aleatória. Na distribuição normal padrão, temos \( \mu = 0 \) e \( \sigma = 1 \), simplificando a fórmula.

O gráfico da função acima pode ser visto abaixo:

O que é o Score-Z?

O score-z é uma medida de quantos desvios padrão um determinado valor \(X\) está distante da média \( \mu \). Ele é calculado usando a fórmula:

\[ z = \frac{X - \mu}{\sigma} \]

O valor \( z \) padroniza a variável \( X \), convertendo-a em termos de desvios padrão. Isso nos permite utilizar a tabela de distribuição normal para calcular probabilidades.

Usando a Tabela de Distribuição Normal

A tabela de distribuição normal acumulada a partir da média mostra a probabilidade de a variável \( Z \), com distribuição normal padrão, estar entre a média \( \mu = 0 \) e um valor específico de \( z \). Ou seja, a tabela fornece:

\[ P(0 \leq Z \leq z) \]

Por exemplo, para \( z = 1.23 \), a tabela pode indicar:

\[ P(0 \leq Z \leq 1.23) = 0.3907 \]

Isso significa que há uma probabilidade de 39,07% de que a variável \( Z \) esteja entre 0 e 1.23 desvios padrão da média.

Simetria da Distribuição

Devido à simetria da distribuição normal, a probabilidade de \( Z \) estar entre \( 0 \) e um valor negativo de \( z \) é a mesma de \( 0 \) até o valor positivo correspondente:

\[ P(0 \leq Z \leq z) = P(0 \leq Z \leq -z) \]

Por exemplo, \( P(0 \leq Z \leq -1.23) = P(0 \leq Z \leq 1.23) = 0.3907 \).

Cálculo de Probabilidades

Com essa tabela, podemos calcular várias probabilidades. Por exemplo, para calcular a probabilidade de \( Z \) estar entre dois valores \( z_1 \) e \( z_2 \) (ambos positivos), podemos subtrair as probabilidades:

\[ P(z_1 \leq Z \leq z_2) = P(0 \leq Z \leq z_2) - P(0 \leq Z \leq z_1) \]

Essas fórmulas e tabelas são amplamente usadas em estatística para determinar probabilidades e para realizar testes de hipóteses baseados em distribuições normais.

Exemplo: Calcule a probabilidade \(P(0,23 \le z \le 0,57) \)

O primeiro passo é fazer o desenho da situação. Logo:

Olhando para a tabela os valores de 0,23 e 0,57 temos 0,0910 e 0,2157. Para determinar a probabilidade em questão basta fazer a subtração abaixo:

\[ P(0,23 \le z \le 0,57)=0,2157-0,0910=0,1247 \]

Teste de Hipóteses sobre a Média

O teste de hipóteses sobre a média é uma ferramenta estatística utilizada para verificar se uma amostra representa uma população com uma média específica. Quando se trabalha com distribuições normais de probabilidades, é possível utilizar testes paramétricos para avaliar a significância da média amostral.

Hipóteses

\[ \begin{aligned} H_0: \mu &= \mu_0 \\ H_1: \mu &\neq \mu_0 \end{aligned} \]

\( H_0 \) é chamada de hipótese nula e \( H_1 \) a hipótese alternativa

Teste de Hipóteses

  1. Escolha o nível de significância \( \alpha \) - geralmente 5%.
  2. Calcule a estatística do teste \( z \) ou \( t \), dependendo do tamanho da amostra e se a variância populacional é conhecida.
  3. Verifique a distribuição normal da variável.
  4. Compare o valor calculado da estatística com o valor crítico da distribuição normal \( z \) ou \( t \).

Estatísticas do Teste

\[ \begin{aligned} z &= \frac{\overline{x} - \mu_0}{\sigma / \sqrt{n}} \\ t &= \frac{\overline{x} - \mu_0}{s / \sqrt{n}} \end{aligned} \]

Interpretação

\[ \begin{aligned} \text{Se } z &\gt z_{\alpha/2}, \text{ rejeite } H_0 \\ \text{Se } z &\lt z_{\alpha/2}, \text{ não rejeite } H_0 \end{aligned} \]

EXEMPLO: Suponha que você queira verificar se a média de altura de uma população é igual a 175 cm. Você coleta uma amostra de 100 indivíduos e encontra uma média de 180 cm com desvio padrão de 5 cm.

\[ \begin{aligned} H_0: \mu &= 175 \\ H_1: \mu &\neq 175 \\ \alpha &= 0,05 \\ z &= \frac{180 - 175}{5 / \sqrt{100}} = 10 \\ z_{\alpha/2} &= 1,96 \end{aligned} \]

Como \( z > z_{\alpha/2} \), rejeite \( H_0 \).

Conclusão: A média de altura da população é estatisticamente diferente de 175 cm.

EXEMPLO: Um fabricante de aparelhos celulares afirma que a duração média da bateria desses aparelhos nos primeiros 12 meses de uso é de 120 horas. Analisando uma amostra de 20 aparelhos, obteve-se uma média de duração de 113 horas, com desvio padrão de 10 horas. Verifique se a afirmação é verdadeira, utilizando um nível de confiança de 95% bicaudal.

Utilizando a tabela de distribuição t student, definem-se os pontos críticos através do grau de liberdade (19) e o nível de confiança (95%).

Nesse caso, os pontos críticos são \( \pm 2,093 \), ou seja, \(P(-2,093 \lt t \lt 2,093) \). Se o valor de t estiver dentro desses limites a afirmação é verdadeira.

Na sequência calcula-se o valor de t para a amostra:

Vamos calcular o valor crítico (\(t_c\)) usando a relação abaixo:

\[ t=\frac{\overline{X}-\mu}{s \over \sqrt{n}}=\frac{113-120}{10 \over \sqrt{20}}=-3,130 \]

Conclusão: Como \(t = -3,130 \), encontra-se FORA dos limites críticos, \(P(-2,093 \lt t \lt 2,093)\), a afirmação do fabricante de celular que a duração média da sua bateria é de 120 horas, a um nível de confiança de 95%, não é verdadeira.

EXERCÍCIOS

  1. Determine a probabilidade de jogar um dado comum 2 vezes e sair um número par na primeira jogada e um número maior que 4 na segunda jogada ou um número menor que 3 na primeira jogada e maior que 2 na segunda jogada.
  2. Calcule a probabilidade \(P(0 \le z \le 1,05) \)
  3. Calcule a probabilidade \(P(-2,05 \le z \le 0) \)
  4. Calcule a probabilidade \(P(-1,34 \le z \le 0,89) \)
  5. Um fabricante de refrigerante produz um tipo de produto que tem um volume médio de líquido igual a 500 mL com desvio de 25 mL. Determine a probabilidade de comprar um refrigerante e o volume de líquido estar entre 480 mL e 525 mL.
  6. Uma fábrica de arroz embala os pacotes com um peso médio de 1 kg e desvio padrão de 50 g. Qual a probabilidade de um pacote ter entre 950 g e 1,1 kg?
  7. O tempo médio de entrega de uma encomenda por uma empresa de transportes é de 5 dias, com desvio padrão de 1,5 dias. Qual a probabilidade de uma encomenda ser entregue entre 4 e 7 dias?
  8. A altura dos homens adultos em uma determinada cidade segue uma distribuição normal com média de 175 cm e desvio padrão de 8 cm. Qual a probabilidade de um homem adulto ter entre 165 cm e 185 cm?
  9. Um fabricante de biscoitos embala os pacotes com um peso médio de 200 g e desvio padrão de 10 g. Qual a probabilidade de um pacote ter entre 190 g e 215 g?
  10. Calcule a probabilidade \( P(-1,2 \le z \le -0,23) \)
  11. Calcule a probabilidade \( P(0,87 \le z \le 0,98) \)
  12. Calcule a probabilidade \( P(0,65 \le z \le 1,47) \)
  13. Calcule a probabilidade \( P(-2,11 \le z \le -0,12) \)
  14. Calcule a probabilidade \( P(-3,14 \le z \le -3) \)
  15. Uma fábrica de suco embala garrafas com um volume médio de 1 litro e desvio padrão de 30 mL. Qual a probabilidade de uma garrafa ter entre 970 mL e 1030 mL?
  16. Um fabricante de café embala pacotes com um peso médio de 500 g e desvio padrão de 20 g. Qual a probabilidade de um pacote de café ter entre 480 g e 520 g?
  17. O tempo médio de atendimento em uma clínica médica é de 30 minutos, com um desvio padrão de 8 minutos. Qual a probabilidade de um paciente ser atendido entre 25 e 40 minutos?
  18. O peso dos cachorros adultos de uma determinada raça segue uma distribuição normal com média de 25 kg e desvio padrão de 4 kg. Qual a probabilidade de um cachorro dessa raça pesar entre 22 kg e 30 kg?
  19. Uma fábrica de chocolate embala barras com um peso médio de 150 g e desvio padrão de 5 g. Qual a probabilidade de uma barra de chocolate pesar entre 145 g e 160 g?
  20. Uma indústria de leite enche garrafas com um volume médio de 1,5 L e desvio padrão de 50 mL. Qual a probabilidade de uma garrafa conter entre 1,45 L e 1,55 L de leite?
  21. Uma fábrica de massas embala pacotes de macarrão com um peso médio de 250 g e desvio padrão de 15 g. Qual a probabilidade de um pacote pesar entre 230 g e 270 g?
  22. O tempo médio de espera para atendimento em um restaurante é de 20 minutos, com desvio padrão de 5 minutos. Qual a probabilidade de um cliente esperar entre 15 e 25 minutos?
  23. A altura das mulheres adultas em uma cidade segue uma distribuição normal com média de 162 cm e desvio padrão de 6 cm. Qual a probabilidade de uma mulher adulta ter entre 155 cm e 170 cm de altura?
  24. Uma empresa de detergente embala garrafas com volume médio de 750 mL e desvio padrão de 20 mL. Qual a probabilidade de uma garrafa conter entre 730 mL e 780 mL de detergente?
  25. Um estudo afirma que a duração média do treinamento cardiovascular recomendado para atletas é de 60 minutos. Em uma amostra de 25 atletas, verificou-se uma média de 55 minutos de treino, com desvio padrão de 8 minutos. Teste se a duração média dos treinos desses atletas é significativamente diferente da recomendação de 60 minutos, com um nível de confiança de 95% bicaudal.
  26. Um treinador diz que, após um programa de 3 meses de musculação, o ganho de peso médio em massa magra dos participantes é de 4 kg. Em uma amostra de 30 alunos, obteve-se um ganho médio de 3,5 kg, com desvio padrão de 1,2 kg. Verifique a afirmação do treinador com um nível de confiança de 99% bicaudal.
  27. Pesquisadores afirmam que após um mês de prática de yoga, a redução média da frequência cardíaca em repouso é de 6 batidas por minuto. Em uma amostra de 15 participantes, a média de redução observada foi de 4,5 batidas, com desvio padrão de 1,5 batidas. Utilize um nível de confiança de 95% bicaudal para testar se a prática de yoga resultou em uma redução média de frequência cardíaca diferente da afirmada.

Tabela Z - Distribuição Normal Acumulada a partir da Média

Valores de Z Acumulados (A partir da Média)
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00.00000.00400.00800.01200.01600.01990.02390.02790.03190.0359
0,10.03980.04380.04780.05170.05570.05960.06360.06750.07140.0753
0,20.07930.08320.08710.09100.09480.09870.10260.10640.11030.1141
0,30.11790.12170.12550.12930.13310.13680.14060.14430.14800.1517
0,40.15540.15910.16280.16640.17000.17360.17720.18080.18440.1879
0,50.19150.19500.19850.20190.20540.20880.21230.21570.21900.2224
0,60.22570.22910.23240.23570.23890.24220.24540.24860.25170.2549
0,70.25800.26110.26420.26730.27040.27340.27640.27940.28230.2852
0,80.28810.29100.29390.29670.29950.30230.30510.30780.31060.3133
0,90.31590.31860.32120.32380.32640.32890.33150.33400.33650.3389
1,00.34130.34380.34610.34850.35080.35310.35540.35770.35990.3621
1,10.36430.36650.36860.37080.37290.37490.37700.37900.38100.3830
1,20.38490.38690.38880.39070.39250.39440.39620.39800.39970.4015
1,30.40320.40490.40660.40820.40990.41150.41310.41470.41620.4177
1,40.41920.42070.42220.42360.42510.42650.42790.42920.43060.4319
1,50.43320.43450.43570.43700.43820.43940.44060.44180.44290.4441
1,60.44520.44630.44740.44840.44950.45050.45150.45250.45350.4545
1,70.45540.45640.45730.45820.45910.45990.46080.46160.46250.4633
1,80.46410.46490.46560.46640.46710.46780.46860.46930.46990.4706
1,90.47130.47190.47260.47320.47380.47440.47500.47560.47610.4767
2,00.47720.47780.47830.47880.47930.47980.48030.48080.48120.4817
2,10.48210.48260.48300.48340.48380.48420.48460.48500.48540.4857
2,20.48610.48640.48680.48710.48750.48780.48810.48840.48870.4890
2,30.48930.48960.48980.49010.49040.49060.49090.49110.49130.4916
2,40.49180.49200.49220.49250.49270.49290.49310.49320.49340.4936
2,50.49380.49400.49410.49430.49450.49460.49480.49490.49510.4952
2,60.49530.49550.49560.49570.49590.49600.49610.49620.49630.4964
2,70.49650.49660.49670.49680.49690.49700.49710.49720.49730.4974
2,80.49740.49750.49760.49770.49770.49780.49790.49790.49800.4981
2,90.49810.49820.49820.49830.49840.49840.49850.49850.49860.4986
3,00.49870.49870.49870.49880.49880.49890.49890.49890.49900.4990
3,10.49900.49910.49910.49910.49920.49920.49920.49920.49930.4993
3,20.49930.49930.49930.49940.49940.49940.49940.49940.49940.4995
3,30.49950.49950.49950.49950.49950.49950.49950.49950.49950.4996
3,40.49960.49960.49960.49960.49960.49960.49960.49960.49960.4996
3,50.49970.49970.49970.49970.49970.49970.49970.49970.49970.4997
3,60.49970.49970.49970.49970.49970.49970.49970.49970.49970.4997
3,70.49980.49980.49980.49980.49980.49980.49980.49980.49980.4998
3,80.49980.49980.49980.49980.49980.49980.49980.49980.49980.4998
3,90.49980.49980.49980.49980.49980.49980.49980.49980.49980.4998
4,00.49980.49980.49980.49980.49980.49980.49980.49980.49980.4998

Tabela t-Student

Unicaudal 75% 80% 85% 90% 95% 97,5% 99% 99,5% 99,75% 99,9% 99,95%
Bicaudal 50% 60% 70% 80% 90% 95% 98% 99% 99,5% 99,8% 99,9%
1 1,000 1,376 1,963 3,078 6,314 12,71 31,82 63,66 127,3 318,3 636,6
2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 14,09 22,33 31,60
3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 7,453 10,21 12,92
4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610
5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869
6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408
8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041
9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073
16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015
17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965
18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883
20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850
21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792
23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,767
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745
25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,690
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659
30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646
40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
50 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496
60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460
80 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639 2,887 3,195 3,416
100 0,677 0,845 1,042 1,290 1,660 1,984 2,364 2,626 2,871 3,174 3,390
1200,6770,8451,0411,2891,6581,9802,3582,6172,8603,1603,373
\( \infty \) 0,6740,8421,0361,2821,6451,9602,3262,5762,8073,0903,291


Desenvolvido por Fumachi