Articles

T-Tests verstehen: 1-Sample, 2-Sample und gepaarte T-Tests

In der Statistik sind t-Tests eine Art Hypothesentest, mit dem Sie Mittel vergleichen können. Sie werden als t-Tests bezeichnet, da jeder t-Test Ihre Beispieldaten auf eine Zahl, den t-Wert, reduziert. Wenn Sie verstehen, wie T-Tests T-Werte berechnen, sind Sie auf dem besten Weg zu verstehen, wie diese Tests funktionieren.

In dieser Reihe von Beiträgen konzentriere ich mich eher auf Konzepte als auf Gleichungen, um zu zeigen, wie T-Tests funktionieren. Dieser Beitrag enthält jedoch zwei einfache Gleichungen, die ich anhand der Analogie eines Signal-Rausch-Verhältnisses durcharbeiten werde.,

Minitab Statistical Software bietet den 1-Sample t-Test, den gepaarten t-Test und den 2-Sample t-Test. Schauen wir uns an, wie jeder dieser T-Tests Ihre Beispieldaten auf den t-Wert reduziert.

Wie 1-Sample-T-Tests t-Werte berechnen

Das Verständnis dieses Prozesses ist entscheidend für das Verständnis, wie T-Tests funktionieren. Ich zeige Ihnen zuerst die Formel und dann erkläre ich Ihnen, wie sie funktioniert.

Bitte beachten Sie, dass die Formel ein Verhältnis ist. Eine gängige Analogie ist, dass der t-Wert das Signal-Rausch-Verhältnis ist.

Signal (auch bekannt als Effektgröße)

Der Zähler ist das Signal., Sie nehmen einfach den Stichprobenmittelwert und subtrahieren den Nullhypothesenwert. Wenn Ihr Stichprobenmittelwert 10 und die Nullhypothese 6 ist, beträgt die Differenz oder das Signal 4.

Wenn es keinen Unterschied zwischen dem Stichprobenmittelwert und dem Nullwert gibt, ist das Signal im Zähler sowie der Wert des gesamten Verhältnisses gleich Null. Wenn Ihr Stichprobenmittelwert beispielsweise 6 und der Nullwert 6 ist, ist die Differenz Null.

Wenn die Differenz zwischen dem Stichprobenmittelwert und dem Nullhypothesenmittelwert entweder in positiver oder negativer Richtung zunimmt, nimmt die Stärke des Signals zu.,

Viel Rauschen kann das Signal überwältigen.

Rauschen

Der Nenner ist das Rauschen. Die Gleichung im Nenner ist ein Maß für die Variabilität, das als Standardfehler des Mittelwerts bekannt ist. Diese Statistik gibt an, wie genau Ihre Stichprobe den Mittelwert der Population schätzt. Eine größere Zahl zeigt an, dass Ihre Stichprobenschätzung weniger präzise ist, da sie mehr zufällige Fehler aufweist.

Dieser zufällige Fehler ist das “ Rauschen.“Wenn es mehr Rauschen gibt, erwarten Sie größere Unterschiede zwischen dem Stichprobenmittelwert und dem Nullhypothesenwert, selbst wenn die Nullhypothese wahr ist., Wir nehmen den Rauschfaktor in den Nenner auf, weil wir feststellen müssen, ob das Signal groß genug ist, um sich von ihm abzuheben.

Signal-Rausch-Verhältnis

Sowohl die Signal – als auch die Rauschwerte befinden sich in den Einheiten Ihrer Daten. Wenn Ihr Signal 6 und das Rauschen 2 ist, ist Ihr t-Wert 3. Dieser t-Wert gibt an, dass die Differenz das Dreifache der Größe des Standardfehlers beträgt. Wenn es jedoch einen Unterschied der gleichen Größe gibt, Ihre Daten jedoch variabler sind (6), beträgt Ihr t-Wert nur 1. Das Signal ist im gleichen Maßstab wie das Rauschen.,

Auf diese Weise können Sie mit t-Werten sehen, wie sich Ihr Signal vom Rauschen unterscheidet. Relativ große Signale und geringe Geräuschpegel erzeugen größere t-Werte. Wenn sich das Signal nicht vom Rauschen abhebt, ist es wahrscheinlich, dass die beobachtete Differenz zwischen der Stichprobenschätzung und dem Nullhypothesenwert eher auf einen zufälligen Fehler in der Stichprobe als auf eine echte Differenz auf Populationsebene zurückzuführen ist.

Ein gepaarter T-Test ist nur ein T-Test mit 1 Probe

Viele Menschen sind verwirrt darüber, wann ein gepaarter T-Test verwendet werden soll und wie er funktioniert. Ich lasse dich in ein kleines Geheimnis ein., Der gepaarte T-Test und der 1-Sample T-Test sind eigentlich der gleiche Test in Verkleidung! Wie wir oben gesehen haben, vergleicht ein 1-Sample-T-Test einen Sample-Mittelwert mit einem Null-Hypothesenwert. Ein gepaarter T-Test berechnet einfach die Differenz zwischen gepaarten Beobachtungen (z. B. vorher und nachher) und führt dann einen 1-Sample-t-Test für die Unterschiede durch.

Sie können dies mit diesem Datensatz testen, um zu sehen, wie alle Ergebnisse identisch sind, einschließlich der mittleren Differenz, des t-Werts, des p-Werts und des Konfidenzintervalls der Differenz.,

Wenn Sie verstehen, dass der gepaarte T-Test einfach einen 1-Sample-T-Test für die gepaarten Unterschiede durchführt, können Sie wirklich verstehen, wie der gepaarte T-Test funktioniert und wann er verwendet wird. Sie müssen nur herausfinden, ob es sinnvoll ist, die Differenz zwischen den einzelnen Beobachtungen zu berechnen.

Nehmen wir zum Beispiel an, dass „vorher“ und „Nachher“ Testergebnisse darstellen, und dazwischen lag ein Eingriff., Wenn die Vorher-Nachher-Ergebnisse in jeder Zeile des Beispielarbeitsblatts dasselbe Thema darstellen, ist es sinnvoll, die Differenz zwischen den Ergebnissen auf diese Weise zu berechnen—der gepaarte t-Test ist angemessen. Wenn die Punktzahlen in jeder Zeile jedoch für verschiedene Fächer gelten, ist es nicht sinnvoll, den Unterschied zu berechnen. In diesem Fall müssen Sie einen anderen Test verwenden, z. B. den T-Test mit zwei Stichproben, den ich unten bespreche.

Die Verwendung des gepaarten t-Tests erspart Ihnen einfach den Schritt, die Unterschiede vor der Durchführung des T-Tests berechnen zu müssen., Sie müssen nur sicher sein, dass die gepaarten Unterschiede Sinn machen!

Wenn es angebracht ist, einen gepaarten T-Test zu verwenden, kann er leistungsfähiger sein als ein 2-Proben-T-Test. Weitere Informationen finden Sie in der Übersicht für gepaartes t.

Wie T-Tests mit zwei Stichproben T-Werte berechnen

Der T-Test mit zwei Stichproben entnimmt Ihre Stichprobendaten aus zwei Gruppen und kocht sie auf den t-Wert herunter. Der Prozess ist dem 1-Sample-T-Test sehr ähnlich, und Sie können immer noch die Analogie des Signal-Rausch-Verhältnisses verwenden. Im Gegensatz zum gepaarten T-Test erfordert der T-Test mit 2 Proben unabhängige Gruppen für jede Probe.,

Die Formel ist unten, und dann einige Diskussion.

Für den 2-Sample-t-Test ist der Zähler wieder das Signal, welches die Differenz zwischen den Mittelwerten der beiden Samples ist. Wenn beispielsweise der Mittelwert der Gruppe 1 10 und der Mittelwert der Gruppe 2 4 beträgt, beträgt die Differenz 6.

Die Standardhypothese für einen T-Test mit 2 Stichproben ist, dass die beiden Gruppen gleich sind. Sie können in der Gleichung sehen, dass, wenn die beiden Gruppen gleich sind, die Differenz (und das gesamte Verhältnis) auch gleich Null ist., Wenn der Unterschied zwischen den beiden Gruppen entweder in positiver oder negativer Richtung zunimmt, wird das Signal stärker.

In einem 2-Sample-T-Test ist der Nenner immer noch das Rauschen, aber Minitab kann zwei verschiedene Werte verwenden. Sie können entweder davon ausgehen, dass die Variabilität in beiden Gruppen gleich oder nicht gleich ist, und Minitab verwendet die entsprechende Schätzung der Variabilität. In jedem Fall bleibt das Prinzip dasselbe: Sie vergleichen Ihr Signal mit dem Rauschen, um zu sehen, wie stark das Signal auffällt.,

Genau wie beim 1-Sample-t-Test wird bei jeder gegebenen Differenz im Zähler der t-Wert kleiner, wenn Sie den Rauschwert im Nenner erhöhen. Um festzustellen, dass die Gruppen unterschiedlich sind, benötigen Sie einen großen t-Wert.

Was bedeuten t-Werte?

Jede Art von T-Test verwendet eine Prozedur, um alle Ihre Beispieldaten auf einen Wert, den t-Wert, zu reduzieren. Die Berechnungen vergleichen Ihre Stichprobenmittelwerte mit der Nullhypothese und enthalten sowohl die Stichprobengröße als auch die Variabilität in den Daten., Ein t-Wert von 0 gibt an, dass die Stichprobenergebnisse genau der Nullhypothese entsprechen. In der Statistik nennen wir die Differenz zwischen der Stichprobenschätzung und der Nullhypothese die Effektgröße. Wenn diese Differenz zunimmt, erhöht sich der absolute Wert des t-Wertes.

Das ist alles schön, aber was bedeutet ein T-Wert von beispielsweise 2 wirklich? Aus der obigen Diskussion wissen wir, dass ein t-Wert von 2 anzeigt, dass der beobachtete Unterschied doppelt so groß ist wie die Variabilität in Ihren Daten. Wir verwenden jedoch t-Tests, um Hypothesen zu bewerten, anstatt nur das Signal-Rausch-Verhältnis herauszufinden., Wir wollen feststellen, ob die Effektgröße statistisch signifikant ist.

Um zu sehen, wie wir von T-Werten zur Beurteilung von Hypothesen und zur Bestimmung der statistischen Signifikanz gelangen, lesen Sie den anderen Beitrag in dieser Reihe, Verständnis von T-Tests: t-Werte und t-Verteilungen.