Medindo a força da relação entre duas variáveis — e testando se ela é real.
Dominar os dois coeficientes de correlação da disciplina e seus testes de significância. Ao final, você saberá resolver as questões 2, 7, 10, 14 e 19 da lista complementar — incluindo as armadilhas de relações não lineares e pontos extremos.
Mede a correlação linear entre duas variáveis contínuas.
Mede a associação monotônica — se quando X sobe, Y também sobe (ou desce).
Pearson mede correlação linear — uma relação em forma de reta.
Spearman mede associação monotônica — uma relação onde "mais X" sempre implica "mais Y" (ou "menos Y"), mesmo que não seja em linha reta.
Uma relação em forma de U (parábola) pode ter \(r = 0\) (Pearson) mas não é "sem relação"!
Forma equivalente (útil quando o enunciado dá somatórios):
Hipóteses:
Horas de prática (X) e nota na atividade (Y), n = 8 estudantes:
(1, 55), (2, 60), (3, 58), (4, 65), (5, 68), (6, 72), (7, 74), (8, 78)
Teste se existe correlação linear positiva (α = 5%).
\(H_0: \rho = 0\) vs. \(H_1: \rho > 0\) (correlação positiva)
Teste unilateral à direita.
\(r = 0{,}983\) (correlação muito forte)
\(T_{obs} = \frac{0{,}983\sqrt{8-2}}{\sqrt{1-0{,}983^2}} = \frac{0{,}983 \times 2{,}449}{\sqrt{1-0{,}966}} = \frac{2{,}407}{\sqrt{0{,}034}} = \frac{2{,}407}{0{,}185} \approx 13{,}011\)
\(gl = 8 - 2 = 6\)
Unilateral direita, α = 5%, gl = 6: \(t_{0{,}05; 6} \approx 1{,}943\).
\(T_{obs} = 13{,}011 > 1{,}943\) → Rejeita \(H_0\).
Há indícios de correlação linear positiva: estudantes com mais horas de prática tendem a ter maiores notas.
Dados em forma de U:
(−3, 9), (−2, 4), (−1, 1), (0, 0), (1, 1), (2, 4), (3, 9)
Note: \(Y = X^2\) — relação perfeitamente determinística!
\(r = 0\) e \(T_{obs} = 0\) → Não rejeita \(H_0\).
Conclusão: Não há indícios de correlação linear.
Isso NÃO significa ausência de relação! Os dados apresentam uma relação não linear clara (parabólica). Pearson só detecta relações lineares.
"O coeficiente de Pearson é zero, logo X e Y são independentes." — ERRADO!
Pearson mede apenas relação linear. Pode haver relação quadrática, exponencial, etc. Sempre faça o gráfico de dispersão.
Dados:
(1, 6), (2, 5), (3, 5), (4, 6), (5, 5), (20, 20)
\(r = 0{,}972\), \(T_{obs} = 8{,}250\), gl = 4 → Rejeita \(H_0\).
Correlação positiva forte!
\(r \approx -0{,}289\) → Correlação fraca negativa!
Um único ponto extremo inverteu completamente a conclusão. O gráfico e a análise de outliers são indispensáveis.
Quando o enunciado mencionar "ponto extremo" ou quando um par (x, y) for muito distante dos demais, o professor espera que você:
Ordene os valores de X e atribua postos de 1 a n. Faça o mesmo para Y.
Onde \(d_i = \text{posto}(x_i) - \text{posto}(y_i)\).
Mesma fórmula do teste para Pearson, mas usando \(r_s\).
Dificuldade percebida (X) e necessidade de suporte técnico (Y), escala ordinal 1–6:
(1, 1), (2, 3), (3, 2), (4, 4), (5, 5), (6, 6)
Variáveis ordinais → use Spearman. Teste associação monotônica positiva (α = 5%).
| i | X | Posto X | Y | Posto Y | \(d_i\) | \(d_i^2\) |
|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 1 | 1 | 0 | 0 |
| 2 | 2 | 2 | 3 | 3 | −1 | 1 |
| 3 | 3 | 3 | 2 | 2 | 1 | 1 |
| 4 | 4 | 4 | 4 | 4 | 0 | 0 |
| 5 | 5 | 5 | 5 | 5 | 0 | 0 |
| 6 | 6 | 6 | 6 | 6 | 0 | 0 |
\(\sum d_i^2 = 0 + 1 + 1 + 0 + 0 + 0 = 2\)
\(r_s = 1 - \frac{6 \times 2}{6 \times (36-1)} = 1 - \frac{12}{210} = 1 - 0{,}057 = 0{,}943\)
\(H_0: \rho_s = 0\) vs. \(H_1: \rho_s > 0\) (associação positiva)
\(T_{obs} = \frac{0{,}943\sqrt{4}}{\sqrt{1-0{,}889}} = \frac{0{,}943 \times 2}{\sqrt{0{,}111}} = \frac{1{,}886}{0{,}333} \approx 5{,}659\)
\(gl = 4\)
Unilateral direita, α = 5%, gl = 4: \(t_{0{,}05; 4} \approx 2{,}132\).
\(T_{obs} = 5{,}659 > 2{,}132\) → Rejeita \(H_0\).
Há indícios de associação monotônica positiva: quanto maior a dificuldade percebida, maior a necessidade de suporte técnico.
| Aspecto | Pearson (\(r\)) | Spearman (\(r_s\)) |
|---|---|---|
| O que mede | Correlação linear | Associação monotônica |
| Tipo de dado | Quantitativo contínuo | Ordinal ou contínuo |
| Pressupostos | Normalidade, linearidade | Nenhum (não paramétrico) |
| Sensibilidade a outliers | Alta | Baixa (usa postos) |
| Fórmula do coeficiente | Covariância / produto dos DPs | \(1 - 6\sum d_i^2 / [n(n^2-1)]\) |
| Teste de significância | Mesmo: \(T = r\sqrt{n-2} / \sqrt{1-r^2}\), \(gl = n-2\) | |
"O sentido dessa associação permite concluir que quilometragem causa redução no preço?"
Não! Correlação mede associação, não causalidade. Pode haver variáveis confundidoras (idade do carro, estado de conservação, etc.). Para demonstrar causalidade, seria necessário um experimento controlado.