Articles

Comprendre les Tests t: 1-échantillon, 2-Échantillon et T-Tests appariés

en statistique, les tests T sont un type de test d’hypothèse qui vous permet de comparer des moyennes. Ils sont appelés t-tests car chaque t-test réduit vos données d’échantillon à un nombre, la valeur T. Si vous comprenez comment les tests t calculent les valeurs t, vous êtes sur la bonne voie pour comprendre le fonctionnement de ces tests.

dans cette série d’articles, je me concentre sur les concepts plutôt que sur les équations pour montrer comment fonctionnent les t-tests. Cependant, ce post comprend deux équations simples que je vais travailler en utilisant l’analogie d’un rapport signal sur bruit.,

le logiciel statistique Minitab propose le test t à 1 échantillon, le test T apparié et le test T à 2 échantillons. Voyons comment chacun de ces tests t réduit vos données d’échantillon à la valeur T.

comment les tests T à 1 échantillon calculent les valeurs t

la compréhension de ce processus est cruciale pour comprendre le fonctionnement des tests t. Je vais d’abord vous montrer la formule, puis vous expliquer comment ça marche.

Veuillez noter que la formule est d’un rapport. Une analogie courante est que la valeur t est le rapport signal sur bruit.

Signal (un.k.un. la taille de l’effet)

le numérateur est Le signal., Vous prenez simplement la moyenne de l’échantillon et soustrayez la valeur de l’hypothèse nulle. Si votre moyenne d’échantillon est 10 et que l’hypothèse nulle est 6, la différence, ou signal, est 4.

S’il n’y a pas de différence entre la moyenne de l’échantillon et la valeur nulle, le signal dans le numérateur, ainsi que la valeur du rapport entier, est égal à zéro. Par exemple, si la moyenne de votre échantillon est de 6 et que la valeur nulle est de 6, la différence est nulle.

Comme la différence entre la moyenne de l’échantillon et de l’hypothèse nulle moyenne augmente dans le sens positif ou négatif, la force du signal augmente.,

Beaucoup de bruit peut saturer le signal.

Bruit

Le dénominateur est le bruit. L’équation du dénominateur est une mesure de la variabilité connue sous le nom d’erreur-type de la moyenne. Cette statistique indique avec quelle précision votre échantillon estime la moyenne de la population. Un nombre plus élevé indique que votre estimation de l’échantillon est moins précise car elle comporte plus d’erreurs aléatoires.

Cette erreur aléatoire est le « bruit. »Lorsqu’il y a plus de bruit, vous vous attendez à voir des différences plus importantes entre la moyenne de l’échantillon et la valeur de l’hypothèse nulle, même lorsque l’hypothèse nulle est vraie., Nous incluons le facteur de bruit dans le dénominateur car nous devons déterminer si le signal est suffisamment grand pour s’en démarquer.

Rapport Signal / bruit

Les valeurs signal et bruit sont dans les unités de vos données. Si votre signal est 6 et le bruit est 2, votre valeur t est 3. Cette valeur t indique que la différence est 3 fois la taille de l’erreur standard. Cependant, s’il y a une différence de même taille mais que vos données ont plus de variabilité (6), votre valeur t est seulement 1. Le signal est à la même échelle que le bruit.,

de cette manière, les valeurs t vous permettent de voir à quel point votre signal se distingue du bruit. Des signaux relativement importants et de faibles niveaux de bruit produisent des valeurs t plus élevées. Si le signal ne se distingue pas du bruit, il est probable que la différence observée entre l’estimation de l’échantillon et la valeur de l’hypothèse nulle soit due à une erreur aléatoire dans l’échantillon plutôt qu’à une vraie différence au niveau de la population.

un test T apparié N’est Qu’un test T à 1 échantillon

beaucoup de gens ne savent pas quand utiliser un test T apparié et comment cela fonctionne. Je vous laisse entrer un petit secret., Le test T jumelé et le test t à 1 échantillon sont en fait le même test déguisé! Comme nous l’avons vu ci-dessus, un test t à 1 échantillon compare une moyenne d’échantillon à une valeur d’hypothèse nulle. Un test T apparié calcule simplement la différence entre les observations appariées (par exemple, avant et après), puis effectue un test T à 1 échantillon sur les différences.

Vous pouvez tester ceci avec cet ensemble de données pour voir comment tous les résultats sont identiques, y compris la différence moyenne, la valeur t, la valeur p et l’intervalle de confiance de la différence.,

comprendre que le test T apparié effectue simplement un test T à 1 échantillon sur les différences appariées peut vraiment vous aider à comprendre comment fonctionne le test T apparié et quand l’utiliser. Vous avez juste besoin de savoir s’il est logique de calculer la différence entre chaque paire d’observations.

par exemple, supposons que « avant” et « après” représentent les résultats des tests, et qu’il y a eu une intervention entre eux., Si les scores avant et après dans chaque ligne de l’exemple de feuille de calcul représentent le même sujet, il est logique de calculer la différence entre les scores de cette manière—le test T apparié est approprié. Cependant, si les scores de chaque ligne concernent des sujets différents, il n’est pas logique de calculer la différence. Dans ce cas, vous devrez utiliser un autre test, tel que le test t à 2 échantillons, dont je discute ci-dessous.

L’Utilisation du test T jumelé vous évite simplement de devoir calculer les différences avant d’effectuer le test t., Vous avez juste besoin d’être sûr que les différences appariées ont un sens!

lorsqu’il est approprié d’utiliser un test T apparié, il peut être plus puissant qu’un test T à 2 échantillons. Pour plus d’informations, reportez-vous à la section Présentation des T appariés.

comment les tests T à deux échantillons calculent les valeurs T

le test T à 2 échantillons prend vos données d’échantillon de deux groupes et les réduit à la valeur T. Le processus est très similaire au test t à 1 échantillon, et vous pouvez toujours utiliser l’analogie du rapport signal sur bruit. Contrairement au test T apparié, le test T à 2 échantillons nécessite des groupes indépendants pour chaque échantillon.,

la formule est ci-dessous, puis une discussion.

pour le test t à 2 échantillons, le numérateur est à nouveau le signal, qui est la différence entre les moyennes des deux échantillons. Par exemple, si la moyenne du Groupe 1 est 10 et la moyenne du groupe 2 est 4, la différence est 6.

l’hypothèse nulle par défaut pour un test t à 2 échantillons est que les deux groupes sont égaux. Vous pouvez voir dans l’équation que lorsque les deux groupes sont égaux, la différence (et le rapport entier) est également égale à zéro., À mesure que la différence entre les deux groupes augmente dans une direction positive ou négative, le signal devient plus fort.

dans un test t à 2 échantillons, le dénominateur est toujours le bruit, mais Minitab peut utiliser deux valeurs différentes. Vous pouvez supposer que la variabilité dans les deux groupes est égale ou non égale, et Minitab utilise L’estimation correspondante de la variabilité. Quoi qu’il en soit, le principe reste le même: vous comparez votre signal au bruit pour voir à quel point le signal se démarque.,

tout comme avec le test t à 1 échantillon, pour toute différence donnée dans le numérateur, lorsque vous augmentez la valeur de bruit dans le dénominateur, la valeur t devient plus petite. Pour déterminer que les groupes sont différents, vous avez besoin d’une valeur t grande.

que signifient les valeurs t?

chaque type de test T utilise une procédure pour réduire toutes vos données d’échantillon à une valeur, la valeur T. Les calculs comparent la moyenne de votre échantillon à l’hypothèse nulle et intègrent à la fois la taille de l’échantillon et la variabilité des données., Une valeur t de 0 indique que les résultats de l’échantillon sont exactement égaux à l’hypothèse nulle. En statistique, nous appelons la différence entre l’estimation de l’échantillon et l’hypothèse nulle la taille de l’effet. À mesure que cette différence augmente, la valeur absolue de la valeur t augmente.

c’est bien, mais que signifie vraiment une valeur t de, disons, 2? D’après la discussion ci-dessus, nous savons qu’une valeur t de 2 indique que la différence observée est le double de la taille de la variabilité de vos données. Cependant, nous utilisons des tests t pour évaluer des hypothèses plutôt que de simplement déterminer le rapport signal sur bruit., Nous voulons déterminer si la taille de l’effet est statistiquement significatif.

pour voir comment nous passons des valeurs t à l’évaluation des hypothèses et à la détermination de la signification statistique, lisez l’autre article de cette série, Understanding t-Tests: t-values and T-distributions.