Lição 02

Formulação de Hipóteses e Tipos de Erro

Como escrever H₀ e H₁ corretamente — incluindo a armadilha dos testes unilaterais.

🎯 Objetivo desta lição

Dominar a formulação de \(H_0\) e \(H_1\), entender a diferença entre testes uni e bilaterais, e saber interpretar corretamente a conclusão de um teste. Essas competências são cobradas em todas as questões da lista.

O que são H₀ e H₁?

H₀ — Hipótese Nula

A hipótese nula é a afirmação de "não efeito" ou "não diferença". É o que assumimos como verdadeiro até que haja evidência suficiente para rejeitá-la.

  • Para médias: \(H_0: \mu_1 - \mu_2 = 0\) ou \(H_0: \mu_D = 0\)
  • Para correlação: \(H_0: \rho = 0\)
  • Para variâncias (Levene): \(H_0: \sigma_1^2 = \sigma_2^2\)
H₁ — Hipótese Alternativa

A hipótese alternativa é o que queremos demonstrar. É a "afirmação da pesquisa".

  • Bilateral: \(H_1: \mu_1 - \mu_2 \neq 0\) (só perguntamos se há diferença)
  • Unilateral à direita: \(H_1: \mu_1 - \mu_2 > 0\) (afirmamos que \(\mu_1\) é maior)
  • Unilateral à esquerda: \(H_1: \mu_1 - \mu_2 < 0\) (afirmamos que \(\mu_1\) é menor)

Bilateral vs. Unilateral

A escolha depende da pergunta de pesquisa (definida antes de ver os dados):

Tipo Quando usar? Região crítica
Bilateral "As médias diferem?", "Há diferença?" Duas caudas: \(\alpha/2\) em cada
Unilateral direita "A é maior que B?", "Houve aumento?" Cauda direita: \(\alpha\) toda
Unilateral esquerda "A é menor que B?", "Houve redução?" Cauda esquerda: \(\alpha\) toda
🚫 Erro clássico (Questão 7c da lista)

"Vi que o tempo do grupo B ficou menor na amostra, então mudei a hipótese alternativa para unilateral."

Isso é proibido! A hipótese alternativa deve ser definida antes de olhar os dados, com base na pergunta de pesquisa. Mudar H₁ depois de ver os resultados é uma forma de viés.

⚠️ A Armadilha do Sinal em Testes Pareados

Em testes pareados, a definição de \(D_i\) determina a direção da hipótese. Cuidado!

✏️ Exemplo — Questão 10 da lista principal

"A adoção de revisão de código aumentou a cobertura de testes."

Definindo \(D_i = \text{Antes}_i - \text{Depois}_i\):

Se cobertura aumentou

\(\text{Depois} > \text{Antes}\), logo \(D_i = \text{Antes} - \text{Depois} < 0\)

Portanto: \(H_0: \mu_D = 0\) vs. \(H_1: \mu_D < 0\)

Teste unilateral à esquerda.

Cuidado com a definição inversa

Se tivéssemos definido \(D_i = \text{Depois}_i - \text{Antes}_i\):

\(H_1: \mu_D > 0\) — unilateral à direita.

O resultado final é o mesmo, mas a direção da hipótese muda!

💡 Regra prática

Sempre escreva como você definiu \(D_i\) e, a partir disso, deduza a direção de \(H_1\). Não tente "adivinhar" a cauda — deduza-a da definição.

Como concluir um teste

A conclusão de um teste de hipóteses segue um padrão rígido:

1

Compare a estatística com o valor crítico

Se \(|T_{obs}| > t_{crítico}\) (bilateral) ou \(T_{obs} > t_{crítico}\) (unilateral direita), rejeitamos \(H_0\).

2

Redija a conclusão

Se rejeitou \(H_0\): "Ao nível de \(\alpha\)%, há indícios estatísticos de que [H₁ em palavras]."

Se não rejeitou \(H_0\): "Ao nível de \(\alpha\)%, não há indícios suficientes de que [H₁ em palavras]."

🚫 Erro clássico (Questão 7a da lista)

"Como não rejeitei H₀, provei que as duas médias são iguais."

Não rejeitar H₀ NÃO é o mesmo que provar H₀. Significa apenas que não temos evidência suficiente para rejeitá-la. A ausência de evidência não é evidência de ausência.

Tipos de Erro

H₀ é verdadeira H₀ é falsa
Rejeitar H₀ Erro Tipo I (α) Decisão correta (poder)
Não rejeitar H₀ Decisão correta Erro Tipo II (β)

Verificação de Normalidade

Antes de usar testes paramétricos, verificamos normalidade. A Questão 3 da lista cobra exatamente isso:

Sobre o que verificar normalidade?
  • Dados pareados: normalidade das diferenças \(D_i\), não das amostras individuais.
  • Dados independentes: normalidade de cada grupo separadamente.
Interpretando o teste de normalidade

O teste de normalidade (ex: Shapiro-Wilk) tem:

  • \(H_0\): os dados vêm de população normal
  • Se \(p < \alpha\): rejeita \(H_0\) → não é razoável assumir normalidade
  • Se \(p \geq \alpha\): não rejeita → pode assumir normalidade
💡 Amostras grandes (Questão 3c)

Em amostras grandes (ex: n = 800), o teste de normalidade detecta desvios muito pequenos e quase sempre rejeita. Nesse caso, o Teorema Central do Limite (TCL) garante que a distribuição da média amostral é aproximadamente normal, mesmo que os dados individuais não sejam. Use o TCL + análise gráfica (histograma, QQ-plot).

🧪 Quiz — Teste seu Conhecimento

🧠 Hipóteses e Conclusões

1 Uma equipe afirma que uma atualização reduziu o tempo médio. Os tempos são medidos antes e depois nas mesmas instâncias. Definindo D = Antes − Depois, qual é H₁?
  • A \(H_1: \mu_D = 0\) (as médias não diferem)
  • B \(H_1: \mu_D \neq 0\) (há diferença, sem direção)
  • C \(H_1: \mu_D > 0\) (a diferença é positiva)
  • D \(H_1: \mu_D < 0\) (a diferença é negativa)
✅ Correto! Se D = Antes − Depois e o tempo reduziu (Antes > Depois), então D > 0. Logo \(H_1: \mu_D > 0\), unilateral à direita.
❌ Se D = Antes − Depois e a atualização reduziu o tempo, então Antes > Depois, ou seja, D > 0. A hipótese alternativa é \(H_1: \mu_D > 0\).
2 Ao nível de 5%, não rejeitamos H₀. O que podemos afirmar?
  • A Provamos que H₀ é verdadeira e as médias são iguais
  • B Não há indícios suficientes para rejeitar H₀ neste nível
  • C A probabilidade de H₁ ser verdadeira é de apenas 5%
  • D Há 95% de chance de que as médias são realmente iguais
✅ Correto! Não rejeitar H₀ significa apenas que não encontramos evidência suficiente. Nunca "provamos" H₀.
❌ Não rejeitar H₀ não prova que H₀ é verdadeira, e α não é a probabilidade de H₁ ser verdadeira. A conclusão correta é: "não há indícios suficientes para rejeitar H₀".
3 Em um estudo pareado, sobre o que devemos verificar a normalidade?
  • A Sobre as diferenças \(D_i = X_i - Y_i\)
  • B Sobre os valores de \(X_i\) individualmente
  • C Sobre os valores de \(Y_i\) individualmente
  • D Sobre \(X_i\) e \(Y_i\) separadamente, ambos devem ser normais
✅ Correto! No teste t pareado, trabalhamos com as diferenças \(D_i\). A normalidade deve ser verificada sobre \(D_i\), não sobre X ou Y individualmente.
❌ O teste t pareado transforma o problema em uma amostra só: as diferenças \(D_i = X_i - Y_i\). É sobre essas diferenças que verificamos normalidade.
4 Um teste de normalidade com n = 800 retorna p = 0,03, mas histograma e QQ-plot parecem razoáveis. O que concluir?
  • A Os dados não são normais; usar teste não paramétrico obrigatoriamente
  • B O teste de normalidade errou; ignorar o resultado completamente
  • C A rejeição pode ser por excesso de poder; pelo TCL, testes paramétricos são razoáveis
  • D Precisamos coletar mais dados para ter certeza sobre a normalidade
✅ Correto! Com n grande, o teste detecta desvios minúsculos. O Teorema Central do Limite + análise gráfica justificam o uso de testes paramétricos.
❌ Com amostras grandes (n = 800), o teste de normalidade tem poder demais e detecta desvios insignificantes. O TCL garante que a média amostral é aproximadamente normal, tornando testes paramétricos razoáveis.
5 Um pesquisador tinha variâncias amostrais \(s_1^2\) e \(s_2^2\). Ele usou o teste Z. Qual o erro?
  • A Nenhum erro, pois variâncias amostrais são boas estimativas
  • B O teste Z exige variâncias populacionais σ², não amostrais s²
  • C O teste Z só funciona para dados pareados, não independentes
  • D O teste Z exige que as variâncias sejam iguais entre grupos
✅ Correto! O teste Z requer \(\sigma_1^2\) e \(\sigma_2^2\) conhecidos (populacionais). Se só temos \(s^2\) (amostrais), devemos usar teste t. (Questão 7d da lista.)
❌ A distinção crucial: o teste Z usa variâncias populacionais (\(\sigma^2\)), que devem ser conhecidas a priori. Se temos apenas variâncias amostrais (\(s^2\)), calculadas dos dados, devemos usar o teste t.
Pontuação:
← Voltar ao Arquivo Jedi (Índice Central)