Compreendendo os testes t: 1-amostra, 2-amostra, e emparelhados T-testes
em estatísticas, t-testes são um tipo de teste de hipótese que lhe permite comparar meios. Eles são chamados t-tests porque cada t-test ferve seus dados de amostra para baixo para um número, o t-valor. Se você entender como os testes-t calculam os valores-t, Você está bem em seu caminho para entender como esses testes funcionam.
nesta série de posts, eu estou focando em conceitos ao invés de equações para mostrar como t-tests funcionam. No entanto, este post inclui duas equações simples que vou trabalhar usando a analogia de uma relação sinal-ruído.,o software estatístico Minitab oferece o teste T de 1 amostra, o teste t emparelhado e o teste t de 2 amostras. Vamos ver como cada um destes testes-t reduz os seus dados de amostra para o valor-T.
How 1-Sample t-Tests Calculate t-Values
Understanding this process is crucial to understanding how t-tests work. Primeiro mostro-te a fórmula e depois explico-te como funciona.
note que a fórmula é um rácio. Uma analogia comum é que o valor t é a razão sinal-ruído.
Signal (t. c. p.the effect size)
o numerador é o sinal., Basta pegar na média da amostra e subtrair o valor da hipótese nula. Se a média da amostra for 10 e a hipótese nula for 6, a diferença, ou sinal, é 4.
Se não houver diferença entre a média da amostra e o valor nulo, o sinal no numerador, bem como o valor de toda a razão, é igual a zero. Por exemplo, se a média da amostra for 6 e o valor nulo for 6, a diferença é zero.
Como a diferença entre a média da amostra e a média da hipótese nula aumenta na direção positiva ou negativa, a força do sinal aumenta.,muitos ruídos podem sobrecarregar o sinal.
ruído
o denominador é o ruído. A equação no denominador é uma medida da variabilidade conhecida como o erro padrão da média. Esta estatística indica com que precisão a sua amostra estima a média da população. Um número maior indica que sua estimativa da amostra é menos precisa porque tem mais erro aleatório.
Este erro aleatório é o ” ruído.”Quando há mais ruído, você espera ver maiores diferenças entre a média da amostra e o valor da hipótese nula mesmo quando a hipótese nula é verdadeira., Incluímos o factor ruído no denominador, porque temos de determinar se o sinal é suficientemente grande para se destacar dele.
Relação sinal-ruído
tanto os valores do sinal como do ruído estão nas unidades dos seus dados. Se o seu sinal é 6 e o ruído é 2, o seu valor-t é 3. Este valor-t indica que a diferença é 3 vezes o tamanho do erro padrão. No entanto, se houver uma diferença do mesmo tamanho, mas os seus dados têm mais variabilidade (6), O SEU VALOR-t é apenas 1. O sinal está na mesma escala que o ruído.,
desta forma, os valores de t permitem-lhe ver como o seu sinal se distingue do ruído. Sinais relativamente grandes e baixos níveis de ruído produzem valores t maiores. Se o sinal não se destaca do ruído, é provável que a diferença observada entre a estimativa da amostra e o valor da hipótese nula seja devido a erro aleatório na amostra ao invés de uma verdadeira diferença no nível da população.
um teste t emparelhado é apenas um teste t de 1 amostra
muitas pessoas estão confusas sobre quando usar um teste t emparelhado e como ele funciona. Vou contar-te um pequeno segredo., O teste t emparelhado e o teste t de 1 amostra são, na verdade, o mesmo teste disfarçado! Como vimos acima, um teste T de 1 amostra compara uma média de amostra a um valor de hipótese nula. Um teste t emparelhado simplesmente calcula a diferença entre observações emparelhadas (por exemplo, antes e depois) e então realiza um teste t de 1 amostra sobre as diferenças.
pode testar isto com este conjunto de dados para ver como todos os resultados são idênticos, incluindo a diferença média, valor t, valor p e intervalo de confiança da diferença.,compreender que o teste t emparelhado simplesmente realiza um teste T de 1 amostra sobre as diferenças emparelhadas pode realmente ajudá-lo a entender como o teste t emparelhado funciona e quando usá-lo. Você só precisa descobrir se faz sentido calcular a diferença entre cada par de observações.por exemplo, vamos assumir que “antes ” e” depois ” representam pontuações de teste, e houve uma intervenção entre elas., Se as pontuações antes e depois em cada linha da planilha de exemplo representarem o mesmo assunto, faz sentido calcular a diferença entre as pontuações desta forma—o teste t emparelhado é apropriado. No entanto, se as pontuações em cada linha são para assuntos diferentes, não faz sentido calcular a diferença. Neste caso, você precisa usar outro teste, como o teste t de 2 amostras, que eu discuto abaixo.
Usando o teste t emparelhado simplesmente poupa – lhe o passo de ter de calcular as diferenças antes de realizar o teste T., Você só precisa ter certeza de que as diferenças emparelhadas fazem sentido!quando for apropriado utilizar um teste t emparelhado, pode ser mais potente do que um teste t de 2 amostras. Para obter mais informações, consulte a visão geral de T emparelhado.
como os testes T de duas amostras calculam os valores t
o teste t de 2 amostras retira os dados da amostra de dois grupos e reduz-os ao valor t. O processo é muito semelhante ao teste T de 1 amostra, e você ainda pode usar a analogia da razão sinal-ruído. Ao contrário do teste t emparelhado, o teste t de 2 amostras requer grupos independentes para cada amostra.,
a fórmula está abaixo, e então alguma discussão.
para o ensaio t de 2 amostras, o numerador é novamente o sinal, que é a diferença entre os meios das duas amostras. Por exemplo, se a média do grupo 1 é 10, e a média do grupo 2 é 4, a diferença é 6.
a hipótese nula padrão para um teste t de 2 amostras é que os dois grupos são iguais. Você pode ver na equação que quando os dois grupos são iguais, a diferença (e a razão inteira) também é igual a zero., À medida que a diferença entre os dois grupos cresce em uma direção positiva ou negativa, o sinal torna-se mais forte.
em um teste T de 2 amostras, o denominador ainda é o ruído, mas Minitab pode usar dois valores diferentes. Você pode assumir que a variabilidade em ambos os grupos é igual ou não, e Minitab usa a estimativa correspondente da variabilidade. De qualquer forma, o princípio permanece o mesmo: você está comparando seu sinal com o ruído para ver o quanto o sinal se destaca.,
assim como com o teste T de 1 amostra, para qualquer diferença dada no numerador, à medida que você aumenta o valor de ruído no denominador, o valor t torna-se menor. Para determinar que os grupos são diferentes, você precisa de um valor-t que é grande.
o que significam os valores de t?
cada tipo de teste t usa um procedimento para ferver todos os seus dados de amostra até um valor, o valor t. Os cálculos comparam a(S) média (s) da amostra com a hipótese nula e incorporam o tamanho da amostra e a variabilidade dos dados., Um valor t de 0 indica que a amostra resulta exatamente igual à hipótese nula. Em estatística, chamamos a diferença entre a estimativa da amostra e a hipótese nula de tamanho do efeito. À medida que esta diferença aumenta, o valor absoluto do valor t aumenta.isso é tudo simpático,mas o que significa um valor-t de, digamos, 2? A partir da discussão acima, sabemos que um valor t de 2 indica que a diferença observada é o dobro do tamanho da variabilidade em seus dados. No entanto, usamos testes-t para avaliar hipóteses em vez de apenas descobrir a razão sinal-ruído., Queremos determinar se o tamanho do efeito é estatisticamente significativo.
para ver como passamos dos valores-t para avaliar hipóteses e determinar significância estatística, leia o outro post desta série, entendendo t-Tests: t-values e t-distributions.