Comprensión de las pruebas t: 1-muestra, 2-muestra y pruebas t emparejadas
en Estadística, las pruebas t son un tipo de prueba de hipótesis que le permite comparar Medias. Se llaman pruebas t porque cada prueba t reduce los datos de la muestra a un número, el valor T. Si entiende cómo las pruebas t calculan los valores t, está en el buen camino para comprender cómo funcionan estas pruebas.
en esta serie de publicaciones, me estoy centrando en conceptos en lugar de ecuaciones para mostrar cómo funcionan las pruebas T. Sin embargo, este post incluye dos ecuaciones simples que trabajaré usando la analogía de una relación señal-ruido.,
el software estadístico Minitab ofrece la prueba t de 1 muestra, la prueba t emparejada y la prueba t de 2 muestras. Veamos cómo cada una de estas pruebas t reduce los datos de muestra al valor T.
cómo las pruebas T de 1 muestra calculan los valores t
comprender este proceso es crucial para comprender cómo funcionan las pruebas T. Te mostraré la fórmula primero, y luego te explicaré cómo funciona.
tenga en cuenta que la fórmula es una relación. Una analogía común es que el valor t es la relación señal-ruido.
Signal (también conocido como el tamaño del efecto)
el numerador es la señal., Simplemente toma la media de la muestra y resta el valor de la hipótesis nula. Si su media muestral es 10 y la hipótesis nula es 6, la diferencia, o señal, es 4.
si no hay diferencia entre la media muestral y el valor nulo, la señal en el numerador, así como el valor de toda la relación, es igual a cero. Por ejemplo, si la media de la muestra es 6 y el valor nulo es 6, la diferencia es cero.
a medida que la diferencia entre la media de la muestra y la media de la hipótesis nula aumenta en la dirección positiva o negativa, la fuerza de la señal aumenta.,
Ruido
el denominador es El ruido. La ecuación en el denominador es una medida de variabilidad conocida como el error estándar de la media. Esta estadística indica la precisión con la que su muestra estima la media de la población. Un número mayor indica que la estimación de la muestra es menos precisa porque tiene más errores aleatorios.
Este error aleatorio es el «ruido.»Cuando hay más ruido, se espera ver mayores diferencias entre la media de la muestra y el valor de la hipótesis nula, incluso cuando la hipótesis nula es verdadera., Incluimos el factor de ruido en el denominador porque debemos determinar si la señal es lo suficientemente grande como para destacarse de ella.
Relación Señal / ruido
tanto los valores de señal como de ruido están en las unidades de sus datos. Si su señal es 6 y el ruido es 2, su valor t es 3. Este valor T indica que la diferencia es 3 veces el tamaño del error estándar. Sin embargo, si hay una diferencia del mismo tamaño pero sus datos tienen más variabilidad (6), su valor t es solo 1. La señal está a la misma escala que el ruido.,
de esta manera, los valores t le permiten ver cuán distinguible es su señal del ruido. Las señales relativamente grandes y los bajos niveles de ruido producen valores t más grandes. Si la señal no se destaca del ruido, es probable que la diferencia observada entre la estimación de la muestra y el valor de la hipótesis nula se deba a un error aleatorio en la muestra en lugar de una diferencia verdadera a nivel de la población.
una prueba T emparejada es solo una prueba t de 1 muestra
muchas personas están confundidas sobre cuándo usar una prueba t emparejada y cómo funciona. Te contaré un pequeño secreto., ¡La prueba t emparejada y la prueba t de 1 muestra son en realidad la misma prueba disfrazada! Como vimos anteriormente, una prueba t de 1 muestra compara una media de muestra con un valor de hipótesis nulo. Una prueba t emparejada simplemente calcula la diferencia entre las observaciones emparejadas (por ejemplo, antes y después) y luego realiza una prueba t de 1 muestra en las diferencias.
puede probar esto con este conjunto de datos para ver cómo todos los resultados son idénticos, incluida la diferencia de media, el valor t, el valor p y el intervalo de confianza de la diferencia.,
comprender que la prueba t emparejada simplemente realiza una prueba t de 1 muestra en las diferencias emparejadas realmente puede ayudarlo a comprender cómo funciona la prueba t emparejada y cuándo usarla. Solo tiene que averiguar si tiene sentido calcular la diferencia entre cada par de observaciones.
por ejemplo, supongamos que «antes» y «después» representan los puntajes de las pruebas, y hubo una intervención entre ellos., Si las puntuaciones antes y después en cada fila de la hoja de trabajo de ejemplo representan el mismo tema, tiene sentido calcular la diferencia entre las puntuaciones de esta manera: la prueba t emparejada es apropiada. Sin embargo, si las puntuaciones en cada fila son para diferentes sujetos, no tiene sentido calcular la diferencia. En este caso, tendría que usar otra prueba, como la prueba t de 2 muestras, que analizo a continuación.
El uso de la prueba t emparejada simplemente le ahorra el paso de tener que calcular las diferencias antes de realizar la prueba T., Solo tienes que estar seguro de que las diferencias emparejadas tienen sentido!
cuando es apropiado usar una prueba t emparejada, puede ser más poderosa que una prueba t de 2 muestras. Para obtener más información, vaya a Descripción general de T emparejado.
cómo las pruebas T de dos muestras calculan los valores t
la prueba t de 2 muestras toma los datos de muestra de dos grupos y los reduce al valor T. El proceso es muy similar a la prueba t de 1 muestra, y aún puede usar la analogía de la relación señal-ruido. A diferencia de la prueba t emparejada, la prueba t de 2 muestras requiere grupos independientes para cada muestra.,
la fórmula está a continuación, y luego un poco de discusión.
para la prueba t de 2 muestras, el numerador es nuevamente la señal, que es la diferencia entre las medias de las dos muestras. Por ejemplo, si la media del Grupo 1 es 10, y la media del Grupo 2 es 4, la diferencia es 6.
la hipótesis nula predeterminada para una prueba t de 2 muestras es que los dos grupos son iguales. Se puede ver en la ecuación que cuando los dos grupos son iguales, la diferencia (y toda la relación) también es igual a cero., A medida que la diferencia entre los dos grupos crece en una dirección positiva o negativa, la señal se vuelve más fuerte.
en una prueba t de 2 muestras, el denominador sigue siendo el ruido, pero Minitab puede usar dos valores diferentes. Puede asumir que la variabilidad en ambos grupos es igual o no igual, y Minitab utiliza la estimación correspondiente de la variabilidad. De cualquier manera, el principio sigue siendo el mismo: está comparando su señal con el ruido para ver cuánto destaca la señal.,
al igual que con la prueba t de 1 muestra, para cualquier diferencia dada en el numerador, a medida que aumenta el valor de ruido en el denominador, el valor t se vuelve más pequeño. Para determinar que los grupos son diferentes, necesita un valor T que sea grande.
¿Qué significan los valores t?
cada tipo de prueba t utiliza un procedimiento para reducir todos los datos de la muestra a un valor, el valor T. Los cálculos comparan las medias de la muestra con la hipótesis nula e incorporan tanto el tamaño de la muestra como la variabilidad de los datos., Un valor t de 0 indica que los resultados de la muestra son exactamente iguales a la hipótesis nula. En Estadística, llamamos a la diferencia entre la estimación de la muestra y la hipótesis nula el tamaño del efecto. A medida que esta diferencia aumenta, el valor absoluto del valor T aumenta.
todo eso es bueno,pero ¿qué significa realmente un valor t de, digamos, 2? De la discusión anterior, sabemos que un valor t de 2 indica que la diferencia observada es el doble del tamaño de la variabilidad en sus datos. Sin embargo, utilizamos pruebas t para evaluar hipótesis en lugar de simplemente averiguar la relación señal-ruido., Queremos determinar si el tamaño del efecto es estadísticamente significativo.
para ver cómo pasamos de los valores t a evaluar hipótesis y determinar significancia estadística, lea el otro post de esta serie, Understanding t-Tests: t-values and T-distributions.