Crônicas de Dados da República

Capítulo 4: O Enigma do Hiperdrive

Núcleo de hiperpropulsão brilhando no laboratório de engenharia

O hangar de testes cheirava a ozônio e combustível de plasma. No centro, o enorme núcleo de um motor de hiperpropulsão pulsava com uma energia azul-violeta instável. Jaxen e Elara usavam óculos de proteção polarizados enquanto os técnicos ajustavam os conectores.

— Resuma o problema, Elara.

— A fábrica principal na Corellia está produzindo motores hiperdrive em duas linhas de montagem diferentes: Linha A (antiga) e Linha B (nova, totalmente automatizada). Precisamos saber se o tempo médio de salto (em microsegundos) é diferente entre as linhas. Eles testaram 6 motores de cada linha.

Elara projetou os dados no ar. Tempos da Linha A: 12, 14, 13, 15, 16, 14. Tempos da Linha B: 18, 17, 19, 20, 16, 18.

— Amostras independentes. Tamanho \(n=6\) para ambas. E as variâncias populacionais? O fabricante garantiu alguma coisa, como os Kaminoanos?

— Negativo. Variâncias desconhecidas. Teremos que estimar tudo a partir das amostras. É o território do Teste t Independente.

Registro Datacore: A Encruzilhada
Sem o desvio populacional (\(\sigma\)), o Teste Z é descartado. Eles precisam usar o Teste t Independente. Mas qual versão? A Pooled (Variância Combinada), que assume variâncias iguais, ou a de Welch, que não faz essa suposição?

— Não podemos simplesmente assumir que a Linha A e a Linha B têm a mesma estabilidade. A Linha B é nova. Precisamos testar as variâncias primeiro. O Teste de Levene.

Jaxen rapidamente instruiu o sistema a calcular as medianas de cada grupo e os desvios absolutos de cada motor em relação à mediana de sua linha. O computador cuspiu uma estatística F baseada na ANOVA desses desvios.

— O teste de Levene gerou um \(F_{obs}\) de 0,82. Com \(\alpha = 5\%\), \(gl_1 = 1\) e \(gl_2 = 10\), o valor crítico é 4,96.

— Como \(0,82 < 4,96\), não rejeitamos a hipótese de igualdade das variâncias. Ambas as linhas de produção têm estabilidade comparável.

— Perfeito! Isso significa luz verde para usar o Teste t com Variância Combinada (Pooled).

Registro Datacore: Caminho Escolhido
Levene não rejeitou \(H_0\) \(\rightarrow\) \(\sigma_A^2 = \sigma_B^2\) assumido \(\rightarrow\) Teste t Pooled. Eles misturarão as variâncias amostrais em um único estimador mais robusto (\(S_p^2\)).

Elara continuou: — A variância amostral da Linha A (\(S_A^2\)) é 2,00. A variância da Linha B (\(S_B^2\)) também é 2,00. Como os tamanhos de amostra são idênticos (\(n=6\)), a variância combinada \(S_p^2\) é apenas a média das duas: 2,00.

— Média da Linha A é 14,0. Média da Linha B é 18,0. Vamos à estatística t: \((14 - 18) / \sqrt{2,00 \times (1/6 + 1/6)}\).

A máquina zumbiu e exibiu: \(T_{obs} = -4,899\).

— Graus de liberdade para pooled é simples: \(n_1 + n_2 - 2\). Temos 10 graus de liberdade. Em um teste bilateral a 5%, o \(t_{crítico}\) é 2,228.

— E \(|-4,899| > 2,228\). Hipótese nula rejeitada. A Linha B definitivamente produz motores com tempos de salto significativamente mais altos. A nova linha de montagem automatizada é um fracasso; os hiperdrives estão lentos.

Elara digitou o relatório, bloqueando os motores da Linha B de serem instalados nas naves estelares. De repente, ela parou e olhou para Jaxen.

— Jaxen... e se tivéssemos analisado aquele outro lote experimental de hiperdrives contrabandistas na semana passada? Os tempos eram 50 na média, mas a variância de um grupo era 2 e do outro era 226!

— Naquele caso — explicou ele seriamente —, o Teste de Levene teria rejeitado a igualdade. As variâncias eram absurdamente diferentes. Teríamos sido forçados a usar o Teste de Welch. Ele não mistura as variâncias e calcula os graus de liberdade usando a terrível equação de Satterthwaite.

— É a diferença entre consertar algo com um martelo preciso e uma marreta que lida com a desordem. Sábia decisão a nossa.

← Capítulo 3 Voltar ao Índice Próximo Capítulo: Instintos de Piloto →