Lição 05

Teste t para Duas Amostras Independentes

Variância combinada (pooled) vs. Welch — os dois caminhos quando σ é desconhecido.

🎯 Objetivo desta lição

Aprender os dois testes t para amostras independentes: com variância combinada (quando σ₁² = σ₂²) e Welch (quando σ₁² ≠ σ₂²). Você vai saber resolver as questões 1, 6, 11, 12, 15, 17 e 18 da lista complementar.

A Grande Decisão: Pooled ou Welch?

Quando temos amostras independentes com variâncias desconhecidas e normalidade razoável, precisamos decidir entre dois caminhos:

🔵 Variância Combinada (Pooled)

Usado quando podemos assumir variâncias populacionais iguais: \(\sigma_1^2 = \sigma_2^2\).

Pistas no enunciado:

  • "Assuma variâncias iguais"
  • "O teste de Levene não rejeitou H₀"
  • "As variâncias populacionais podem ser consideradas iguais"
🟡 Welch

Usado quando não podemos assumir variâncias iguais.

Pistas no enunciado:

  • "Não assuma igualdade de variâncias"
  • "Variâncias possivelmente diferentes"
  • "O teste de Levene rejeitou H₀"
💡 Fluxo na prova

Às vezes o próprio exercício pede primeiro para testar as variâncias (Levene) e depois escolher o teste t adequado. Ex: Questões 6, 12 e 18 da lista complementar.

Teste t com Variância Combinada (Pooled)

Procedimento

1

Calcular a variância combinada

Variância Combinada \(S_p^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}\)

É uma média ponderada das variâncias amostrais, ponderada pelos graus de liberdade de cada grupo.

2

Calcular a estatística t

Estatística t (Pooled) \(T_{obs} = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{S_p^2 \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}\)
Graus de liberdade \(gl = n_1 + n_2 - 2\)

Exemplo — Questão 1 da Lista Complementar

✏️ Resolução Completa

Algoritmos A e B, amostras independentes, normalidade + variâncias iguais:

\(A: 12, 14, 13, 15, 16, 14 \quad\) \(B: 18, 17, 19, 20, 16, 18\)


Estatísticas amostrais

\(\bar{X}_A = \frac{12+14+13+15+16+14}{6} = \frac{84}{6} = 14{,}00\)

\(\bar{X}_B = \frac{18+17+19+20+16+18}{6} = \frac{108}{6} = 18{,}00\)

\(S_A^2 = \frac{(12-14)^2 + (14-14)^2 + \ldots + (14-14)^2}{5} = \frac{10}{5} = 2{,}00\)

\(S_B^2 = \frac{(18-18)^2 + (17-18)^2 + \ldots + (18-18)^2}{5} = \frac{10}{5} = 2{,}00\)

Variância combinada

\(S_p^2 = \frac{(6-1) \cdot 2{,}00 + (6-1) \cdot 2{,}00}{6+6-2} = \frac{5 \cdot 2 + 5 \cdot 2}{10} = \frac{20}{10} = 2{,}00\)

Estatística t

\(T_{obs} = \frac{14{,}00 - 18{,}00}{\sqrt{2{,}00 \cdot (1/6 + 1/6)}} = \frac{-4{,}00}{\sqrt{2{,}00 \cdot 0{,}333}} = \frac{-4{,}00}{\sqrt{0{,}667}} = \frac{-4{,}00}{0{,}816} \approx -4{,}899\)

\(gl = 6 + 6 - 2 = 10\)

Conclusão

Bilateral, α = 5%: \(t_{0{,}025; 10} = 2{,}228\).

\(|T_{obs}| = 4{,}899 > 2{,}228\) → Rejeita \(H_0\).

Há indícios de diferença entre os tempos médios de execução dos algoritmos.

Teste t de Welch

Quando não podemos assumir variâncias iguais, usamos Welch. A diferença principal:

1

Estatística t (sem variância combinada)

Estatística t (Welch) \(T_{obs} = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}}\)

Parece com o Z, mas usa \(S^2\) (amostrais) em vez de \(\sigma^2\) (populacionais).

2

Graus de liberdade de Satterthwaite

GL de Satterthwaite \(gl = \frac{\left(\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}\right)^2}{\frac{\left(\frac{S_1^2}{n_1}\right)^2}{n_1 - 1} + \frac{\left(\frac{S_2^2}{n_2}\right)^2}{n_2 - 1}}\)

Resultado geralmente não é inteiro — arredonde para baixo para ser conservador.

Exemplo — Questão 4 da Lista Complementar

✏️ Resolução — Welch

Sistemas A e B, independentes, normalidade, variâncias possivelmente diferentes:

\(A: 48, 50, 49, 51, 52, 50 \quad\) \(B: 40, 45, 55, 60, 70, 80\)


Estatísticas amostrais

\(\bar{X}_A = 50{,}00, \quad S_A^2 = 2{,}00\)

\(\bar{X}_B = 58{,}33, \quad S_B^2 = 226{,}67\)

Note: as variâncias são muito diferentes (2,00 vs 226,67) — Welch é necessário.

Estatística t

\(T_{obs} = \frac{50{,}00 - 58{,}33}{\sqrt{2{,}00/6 + 226{,}67/6}} = \frac{-8{,}33}{\sqrt{0{,}333 + 37{,}778}} = \frac{-8{,}33}{\sqrt{38{,}111}} = \frac{-8{,}33}{6{,}174} \approx -1{,}350\)

Graus de liberdade

\(gl = \frac{(0{,}333 + 37{,}778)^2}{\frac{0{,}333^2}{5} + \frac{37{,}778^2}{5}} = \frac{38{,}111^2}{\frac{0{,}111}{5} + \frac{1427{,}18}{5}} \approx \frac{1452{,}5}{285{,}46} \approx 5{,}09\)

Arredondando: \(gl \approx 5\).

Conclusão

Bilateral, α = 5%, gl = 5: \(t_{0{,}025; 5} = 2{,}571\).

\(|T_{obs}| = 1{,}350 < 2{,}571\) → Não rejeita \(H_0\).

Não há indícios suficientes de diferença entre os tempos médios. Porém, a variabilidade de B é muito maior — igualdade de médias não implica igualdade de estabilidade!

Resumo: Pooled vs. Welch

AspectoPooledWelch
Pressuposto sobre variâncias \(\sigma_1^2 = \sigma_2^2\) Nenhum
Denominador \(\sqrt{S_p^2(1/n_1 + 1/n_2)}\) \(\sqrt{S_1^2/n_1 + S_2^2/n_2}\)
Graus de liberdade \(n_1 + n_2 - 2\) (simples) Satterthwaite (complicado)
Quando usar Levene não rejeitou / enunciado assume igualdade Levene rejeitou / enunciado diz "possivelmente diferentes"

🧪 Quiz — Teste t Independente

🧠 Teste seu Conhecimento

1 Em um teste t com variância combinada, \(n_1 = 6\) e \(n_2 = 6\). Quantos graus de liberdade?
  • A\(gl = 10\) (\(n_1 + n_2 - 2\))
  • B\(gl = 11\) (\(n_1 + n_2 - 1\))
  • C\(gl = 5\) (\(n_1 - 1\))
  • D\(gl = 12\) (\(n_1 + n_2\))
✅ Correto! No teste t pooled, \(gl = n_1 + n_2 - 2 = 6 + 6 - 2 = 10\).
❌ A fórmula é \(gl = n_1 + n_2 - 2\). Subtraímos 2 porque estimamos duas médias.
2 O teste de Levene resultou em \(F_{obs} = 7{,}12\) com \(gl_1 = 1, gl_2 = 10\), e o valor crítico \(F_{0,05;1,10} = 4{,}96\). O que concluímos?
  • AAs variâncias são iguais; usamos pooled para as médias
  • BNão podemos comparar as médias com nenhum teste
  • CAs variâncias são diferentes; usamos Welch para as médias
  • DAs médias são iguais; não é necessário fazer mais testes
✅ Correto! \(F_{obs} = 7{,}12 > 4{,}96\) → rejeitamos igualdade de variâncias → usamos Welch (não pooled).
❌ \(F_{obs} > F_{crítico}\) → rejeitamos H₀ do Levene (variâncias iguais). Então as variâncias são diferentes e devemos usar Welch para comparar médias.
3 No teste de Welch, os graus de liberdade calculados foram gl ≈ 5,22. Qual valor usar na tabela t?
  • AArredondar para cima: gl = 6
  • BArredondar para baixo: gl = 5 (mais conservador)
  • CUsar exatamente 5,22 na tabela t
  • DUsar gl = ∞ para simplificar os cálculos
✅ Correto! Arredondamos para baixo (gl = 5), o que dá um valor crítico maior e é mais conservador (mais difícil de rejeitar).
❌ Na prova, arredondamos gl para baixo (mais conservador). gl = 5,22 → usamos gl = 5. Isso aumenta o valor crítico, tornando o teste mais exigente.
4 Por que o denominador do teste t de Welch NÃO usa \(S_p^2\) (variância combinada)?
  • APorque Welch é um teste não paramétrico
  • BPorque a variância combinada exige normalidade
  • CPorque Welch é usado para dados pareados
  • DPorque \(S_p^2\) assume variâncias iguais, e Welch não faz essa suposição
✅ Correto! \(S_p^2\) é uma média ponderada que só faz sentido se \(\sigma_1^2 = \sigma_2^2\). Welch não faz essa suposição, então mantém \(S_1^2\) e \(S_2^2\) separados.
❌ A variância combinada \(S_p^2\) pressupõe \(\sigma_1^2 = \sigma_2^2\). Se as variâncias podem ser diferentes, não podemos "misturá-las". Welch usa cada uma separadamente.
5 Dados: \(S_1^2 = 5{,}367\), \(S_2^2 = 3{,}500\), \(n_1 = n_2 = 6\). Qual é \(S_p^2\)?
  • A\(\frac{5 \cdot 5{,}367 + 5 \cdot 3{,}500}{10} = 4{,}433\)
  • B\(\frac{5{,}367 + 3{,}500}{2} = 4{,}434\)
  • C\(\frac{6 \cdot 5{,}367 + 6 \cdot 3{,}500}{12} = 4{,}434\)
  • D\(\sqrt{5{,}367 \cdot 3{,}500} = 4{,}334\)
✅ Correto! \(S_p^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2} = \frac{5 \times 5{,}367 + 5 \times 3{,}500}{10} = \frac{44{,}335}{10} = 4{,}433\). Os pesos são \((n_i - 1)\), não \(n_i\)!
❌ A fórmula usa \((n_i - 1)\) como pesos, não \(n_i\). É \(\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}\). Com \(n_1 = n_2\), os pesos são iguais e o resultado é a média simples — mas a fórmula correta pondera por \(n_i - 1\).
Pontuação:
← Voltar ao Arquivo Jedi (Índice Central)