Lição 2 — Formulação de Hipóteses e Tipos de Erro

🎯 Objetivo desta lição

Dominar a formulação de \(H_0\) e \(H_1\), entender a diferença entre testes uni e bilaterais, e saber interpretar corretamente a conclusão de um teste. Essas competências são cobradas em todas as questões da lista.

O que são H₀ e H₁?

H₀ — Hipótese Nula

A hipótese nula é a afirmação de "não efeito" ou "não diferença". É o que assumimos como verdadeiro até que haja evidência suficiente para rejeitá-la.

Para médias: \(H_0: \mu_1 - \mu_2 = 0\) ou \(H_0: \mu_D = 0\)
Para correlação: \(H_0: \rho = 0\)
Para variâncias (Levene): \(H_0: \sigma_1^2 = \sigma_2^2\)

H₁ — Hipótese Alternativa

A hipótese alternativa é o que queremos demonstrar. É a "afirmação da pesquisa".

Bilateral: \(H_1: \mu_1 - \mu_2 \neq 0\) (só perguntamos se há diferença)
Unilateral à direita: \(H_1: \mu_1 - \mu_2 > 0\) (afirmamos que \(\mu_1\) é maior)
Unilateral à esquerda: \(H_1: \mu_1 - \mu_2 < 0\) (afirmamos que \(\mu_1\) é menor)

Bilateral vs. Unilateral

A escolha depende da pergunta de pesquisa (definida antes de ver os dados):

Tipo	Quando usar?	Região crítica
Bilateral	"As médias diferem?", "Há diferença?"	Duas caudas: \(\alpha/2\) em cada
Unilateral direita	"A é maior que B?", "Houve aumento?"	Cauda direita: \(\alpha\) toda
Unilateral esquerda	"A é menor que B?", "Houve redução?"	Cauda esquerda: \(\alpha\) toda

🚫 Erro clássico (Questão 7c da lista)

"Vi que o tempo do grupo B ficou menor na amostra, então mudei a hipótese alternativa para unilateral."

Isso é proibido! A hipótese alternativa deve ser definida antes de olhar os dados, com base na pergunta de pesquisa. Mudar H₁ depois de ver os resultados é uma forma de viés.

⚠️ A Armadilha do Sinal em Testes Pareados

Em testes pareados, a definição de \(D_i\) determina a direção da hipótese. Cuidado!

✏️ Exemplo — Questão 10 da lista principal

"A adoção de revisão de código aumentou a cobertura de testes."

Definindo \(D_i = \text{Antes}_i - \text{Depois}_i\):

Se cobertura aumentou

\(\text{Depois} > \text{Antes}\), logo \(D_i = \text{Antes} - \text{Depois} < 0\)

Portanto: \(H_0: \mu_D = 0\) vs. \(H_1: \mu_D < 0\)

Teste unilateral à esquerda.

Cuidado com a definição inversa

Se tivéssemos definido \(D_i = \text{Depois}_i - \text{Antes}_i\):

\(H_1: \mu_D > 0\) — unilateral à direita.

O resultado final é o mesmo, mas a direção da hipótese muda!

💡 Regra prática

Sempre escreva como você definiu \(D_i\) e, a partir disso, deduza a direção de \(H_1\). Não tente "adivinhar" a cauda — deduza-a da definição.

Como concluir um teste

A conclusão de um teste de hipóteses segue um padrão rígido:

1

Compare a estatística com o valor crítico

Se \(|T_{obs}| > t_{crítico}\) (bilateral) ou \(T_{obs} > t_{crítico}\) (unilateral direita), rejeitamos \(H_0\).

2

Redija a conclusão

Se rejeitou \(H_0\): "Ao nível de \(\alpha\)%, há indícios estatísticos de que [H₁ em palavras]."

Se não rejeitou \(H_0\): "Ao nível de \(\alpha\)%, não há indícios suficientes de que [H₁ em palavras]."

🚫 Erro clássico (Questão 7a da lista)

"Como não rejeitei H₀, provei que as duas médias são iguais."

Não rejeitar H₀ NÃO é o mesmo que provar H₀. Significa apenas que não temos evidência suficiente para rejeitá-la. A ausência de evidência não é evidência de ausência.

Tipos de Erro

	H₀ é verdadeira	H₀ é falsa
Rejeitar H₀	Erro Tipo I (α)	Decisão correta (poder)
Não rejeitar H₀	Decisão correta	Erro Tipo II (β)

Erro Tipo I (α): Rejeitar H₀ quando ela é verdadeira. Probabilidade = nível de significância (5% na prova).
Erro Tipo II (β): Não rejeitar H₀ quando ela é falsa. "Deixar passar" um efeito real.

Verificação de Normalidade

Antes de usar testes paramétricos, verificamos normalidade. A Questão 3 da lista cobra exatamente isso:

Sobre o que verificar normalidade?

Dados pareados: normalidade das diferenças \(D_i\), não das amostras individuais.
Dados independentes: normalidade de cada grupo separadamente.

Interpretando o teste de normalidade

O teste de normalidade (ex: Shapiro-Wilk) tem:

\(H_0\): os dados vêm de população normal
Se \(p < \alpha\): rejeita \(H_0\) → não é razoável assumir normalidade
Se \(p \geq \alpha\): não rejeita → pode assumir normalidade

💡 Amostras grandes (Questão 3c)

Em amostras grandes (ex: n = 800), o teste de normalidade detecta desvios muito pequenos e quase sempre rejeita. Nesse caso, o Teorema Central do Limite (TCL) garante que a distribuição da média amostral é aproximadamente normal, mesmo que os dados individuais não sejam. Use o TCL + análise gráfica (histograma, QQ-plot).

🧪 Quiz — Teste seu Conhecimento

🧠 Hipóteses e Conclusões

1 Uma equipe afirma que uma atualização reduziu o tempo médio. Os tempos são medidos antes e depois nas mesmas instâncias. Definindo D = Antes − Depois, qual é H₁?

A \(H_1: \mu_D = 0\) (as médias não diferem)
B \(H_1: \mu_D \neq 0\) (há diferença, sem direção)
C \(H_1: \mu_D > 0\) (a diferença é positiva)
D \(H_1: \mu_D < 0\) (a diferença é negativa)

✅ Correto! Se D = Antes − Depois e o tempo reduziu (Antes > Depois), então D > 0. Logo \(H_1: \mu_D > 0\), unilateral à direita.

❌ Se D = Antes − Depois e a atualização reduziu o tempo, então Antes > Depois, ou seja, D > 0. A hipótese alternativa é \(H_1: \mu_D > 0\).

2 Ao nível de 5%, não rejeitamos H₀. O que podemos afirmar?

A Provamos que H₀ é verdadeira e as médias são iguais
B Não há indícios suficientes para rejeitar H₀ neste nível
C A probabilidade de H₁ ser verdadeira é de apenas 5%
D Há 95% de chance de que as médias são realmente iguais

✅ Correto! Não rejeitar H₀ significa apenas que não encontramos evidência suficiente. Nunca "provamos" H₀.

❌ Não rejeitar H₀ não prova que H₀ é verdadeira, e α não é a probabilidade de H₁ ser verdadeira. A conclusão correta é: "não há indícios suficientes para rejeitar H₀".

3 Em um estudo pareado, sobre o que devemos verificar a normalidade?

A Sobre as diferenças \(D_i = X_i - Y_i\)
B Sobre os valores de \(X_i\) individualmente
C Sobre os valores de \(Y_i\) individualmente
D Sobre \(X_i\) e \(Y_i\) separadamente, ambos devem ser normais

✅ Correto! No teste t pareado, trabalhamos com as diferenças \(D_i\). A normalidade deve ser verificada sobre \(D_i\), não sobre X ou Y individualmente.

❌ O teste t pareado transforma o problema em uma amostra só: as diferenças \(D_i = X_i - Y_i\). É sobre essas diferenças que verificamos normalidade.

4 Um teste de normalidade com n = 800 retorna p = 0,03, mas histograma e QQ-plot parecem razoáveis. O que concluir?

A Os dados não são normais; usar teste não paramétrico obrigatoriamente
B O teste de normalidade errou; ignorar o resultado completamente
C A rejeição pode ser por excesso de poder; pelo TCL, testes paramétricos são razoáveis
D Precisamos coletar mais dados para ter certeza sobre a normalidade

✅ Correto! Com n grande, o teste detecta desvios minúsculos. O Teorema Central do Limite + análise gráfica justificam o uso de testes paramétricos.

❌ Com amostras grandes (n = 800), o teste de normalidade tem poder demais e detecta desvios insignificantes. O TCL garante que a média amostral é aproximadamente normal, tornando testes paramétricos razoáveis.

5 Um pesquisador tinha variâncias amostrais \(s_1^2\) e \(s_2^2\). Ele usou o teste Z. Qual o erro?

A Nenhum erro, pois variâncias amostrais são boas estimativas
B O teste Z exige variâncias populacionais σ², não amostrais s²
C O teste Z só funciona para dados pareados, não independentes
D O teste Z exige que as variâncias sejam iguais entre grupos

✅ Correto! O teste Z requer \(\sigma_1^2\) e \(\sigma_2^2\) conhecidos (populacionais). Se só temos \(s^2\) (amostrais), devemos usar teste t. (Questão 7d da lista.)

❌ A distinção crucial: o teste Z usa variâncias populacionais (\(\sigma^2\)), que devem ser conhecidas a priori. Se temos apenas variâncias amostrais (\(s^2\)), calculadas dos dados, devemos usar o teste t.

Pontuação: —