A primeira pergunta antes de qualquer cálculo: o que estou comparando e como os dados foram coletados?
Aprender a classificar corretamente o desenho de um estudo estatístico antes de fazer qualquer conta. Essa é a habilidade mais importante da disciplina: escolher o teste errado invalida toda a análise, mesmo que os cálculos estejam corretos.
Na sua lista de exercícios, a Questão 1 pede exatamente isso: "identifique se o desenho é pareado ou independente, o parâmetro de interesse, e qual procedimento você aplicaria". E a instrução geral diz:
"Sempre justifique a escolha do teste antes de calcular. Identifique o desenho do estudo."
O professor está dizendo: se você escolheu o teste errado, perdeu a questão — mesmo com conta certa.
Existem três grandes categorias de perguntas que aparecem na prova:
| Categoria | O que se pergunta? | Parâmetro |
|---|---|---|
| Comparação de médias | As médias de duas populações são iguais? | \(\mu_1 - \mu_2\) ou \(\mu_D\) |
| Comparação de variâncias | A dispersão (estabilidade) é igual? | \(\sigma_1^2 / \sigma_2^2\) |
| Correlação | Existe relação linear/monotônica entre duas variáveis? | \(\rho\) ou \(\rho_s\) |
Quando a pergunta é sobre médias, a primeira decisão é:
Os mesmos indivíduos (ou unidades) são medidos em duas condições diferentes.
Se faz sentido calcular \(D_i = X_i - Y_i\) para cada unidade, o desenho é pareado. Cada par gera uma diferença.
Grupos diferentes de unidades são medidos, sem correspondência entre eles.
Se não existe correspondência natural entre as observações dos dois grupos (o sujeito 1 do grupo A não tem "par" no grupo B), o desenho é independente.
"Os dados são antes/depois do mesmo sistema, então tratei como duas amostras independentes."
Isso está errado. Se as medidas são do mesmo sistema em dois momentos, o desenho é pareado. Ignorar a dependência desperdiça informação e pode levar a conclusões incorretas.
Às vezes a pergunta não é se as médias são iguais, mas se a dispersão (variabilidade, estabilidade) é a mesma. Palavras-chave:
Nesse caso, o parâmetro de interesse é \(\sigma_1^2 / \sigma_2^2\) e usamos procedimentos específicos para comparar variâncias (Teste de Levene, por exemplo).
Não rejeitar \(H_0\) para médias iguais não significa que as populações tenham a mesma estabilidade. São parâmetros diferentes! (Veja Questão 8b da lista complementar.)
A correlação aparece quando temos pares de variáveis medidas nos mesmos indivíduos, e queremos saber se existe relação entre elas.
A escolha entre Pearson e Spearman depende da escala dos dados:
| Situação | Coeficiente |
|---|---|
| Variáveis contínuas, relação linear, normalidade razoável | Pearson (\(r\)) |
| Variáveis ordinais, ou relação monotônica (não linear) | Spearman (\(r_s\)) |
Este é o fluxo mental que você deve seguir ao ler cada questão da prova:
Vamos aplicar a árvore de decisão aos itens da Questão 1 da lista principal:
"Mede-se o tempo de execução de um algoritmo nas mesmas 15 instâncias, antes e depois de uma refatoração."
→ Mesmas instâncias, duas condições → pareado
→ Parâmetro: \(\mu_D\) (média das diferenças)
→ Procedimento: Teste t pareado (assumindo normalidade das diferenças)
"Comparam-se as latências médias de dois servidores fisicamente distintos, A e B, com o desvio-padrão de cada servidor já conhecido de medições históricas."
→ Servidores distintos → independente
→ \(\sigma_1\) e \(\sigma_2\) conhecidos
→ Procedimento: Teste Z para duas médias
"Deseja-se saber se duas APIs entregam respostas com a mesma estabilidade."
→ Palavra-chave: estabilidade = variância
→ Parâmetro: \(\sigma_1^2 / \sigma_2^2\)
→ Procedimento: Teste de Levene
"Dois grupos diferentes de usuários, um por interface; variâncias populacionais conhecidas."
→ Grupos diferentes → independente
→ Variâncias conhecidas
→ Procedimento: Teste Z
"Os mesmos 20 sensores são calibrados por dois métodos."
→ Mesmos sensores, dois métodos → pareado
→ Parâmetro: \(\mu_D\)
→ Procedimento: Teste t pareado
| Desenho | Paramétrico | Não Paramétrico |
|---|---|---|
| Pareado | Teste t pareado | Wilcoxon pareado |
| Independente (σ conhecido) | Teste Z | — |
| Independente (σ² iguais) | Teste t (variância combinada) | Mann-Whitney |
| Independente (σ² diferentes) | Teste t de Welch | Mann-Whitney |
| Variância | Teste de Levene | |
| Correlação (linear) | Pearson | |
| Correlação (monotônica) | Spearman | |
Capítulo sobre Testes de Hipóteses no livro Estatística Básica (Bussab & Morettin), seção sobre comparação de duas populações. É a referência mais completa em português para os conceitos desta disciplina.
Agora que você sabe identificar o desenho e escolher o teste, nas próximas lições vamos aprender a executar cada teste, passo a passo: