Articles

T-Tests begrijpen: 1-sample, 2-sample en gepaarde t-Tests

in statistieken zijn t-tests een type hypothese test waarmee u middelen kunt vergelijken. Ze worden t-tests genoemd omdat elke t-test uw monstergegevens neerligt op één getal, de T-waarde. Als je begrijpt hoe t-tests t-waarden berekenen, ben je goed op weg om te begrijpen hoe deze tests werken.

In deze serie posts, richt ik me op concepten in plaats van vergelijkingen om te laten zien hoe t-tests werken. Echter, dit bericht bevat twee eenvoudige vergelijkingen die Ik zal werken door middel van de analogie van een signaal-ruisverhouding.,

Minitab statistische Software biedt de 1-monster t-test, gepaarde t-test, en de 2-Monster t-test. Laten we eens kijken hoe elk van deze t-tests je monstergegevens reduceren tot de t-waarde.

hoe 1-monster t-Tests t-waarden berekenen

Dit proces begrijpen is cruciaal om te begrijpen hoe t-tests werken. Ik zal je eerst de formule laten zien, en dan zal ik uitleggen hoe het werkt.

merk op dat de formule een verhouding is. Een veel voorkomende analogie is dat de T-waarde de signaal-ruisverhouding is.

signaal (ook bekend als de effectgrootte)

De teller is het signaal., Je neemt gewoon het steekproefgemiddelde en trekt de nulhypothese waarde af. Als uw steekproefgemiddelde 10 is en de nulhypothese 6 is, is het verschil, of signaal, 4.

als er geen verschil is tussen het gemiddelde van het monster en de nulwaarde, is het signaal in de teller en de waarde van de gehele verhouding gelijk aan nul. Bijvoorbeeld, als uw steekproefgemiddelde 6 is en de nulwaarde 6 is, is het verschil nul.

naarmate het verschil tussen het monstergemiddelde en het nulhypothesegemiddelde in zowel de positieve als de negatieve richting toeneemt, neemt de sterkte van het signaal toe.,

veel ruis kan het signaal overweldigen.

ruis

de noemer is de ruis. De vergelijking in de noemer is een maat voor de variabiliteit die bekend staat als de standaardfout van het gemiddelde. Deze statistiek geeft aan hoe nauwkeurig uw steekproef Het gemiddelde van de populatie schat. Een groter aantal geeft aan dat uw steekproef schatting minder nauwkeurig is omdat het meer willekeurige fout heeft.

deze willekeurige fout is de ” ruis.”Wanneer er meer ruis is, verwacht je grotere verschillen te zien tussen het steekproefgemiddelde en de waarde van de nulhypothese, zelfs wanneer de nulhypothese waar is., We nemen de ruisfactor in de noemer op omdat we moeten bepalen of het signaal groot genoeg is om zich ervan te onderscheiden.

signaal-ruisverhouding

zowel de signaal – als ruiswaarden bevinden zich in de eenheden van uw gegevens. Als je signaal 6 is en de ruis 2, is je T-waarde 3. Deze t-waarde geeft aan dat het verschil 3 keer de grootte van de standaardfout is. Als er echter een verschil van dezelfde grootte is, maar uw gegevens meer variabiliteit hebben (6), is uw t-waarde slechts 1. Het signaal is op dezelfde schaal als de ruis.,

op deze manier kunt u met t-waarden zien hoe uw signaal te onderscheiden is van de ruis. Relatief grote signalen en lage geluidsniveaus produceren grotere t-waarden. Als het signaal zich niet onderscheidt van de ruis, is het waarschijnlijk dat het waargenomen verschil tussen de steekproefschatting en de nulhypothesewaarde te wijten is aan willekeurige fout in de steekproef in plaats van een echt verschil op het populatieniveau.

een gepaarde t-test Is slechts een 1-Sample t-Test

veel mensen zijn in de war over wanneer een gepaarde t-test te gebruiken en hoe het werkt. Ik zal je een geheimpje verklappen., De gepaarde t-test en de 1-sample t-test zijn eigenlijk dezelfde test in vermomming! Zoals we hierboven zagen, vergelijkt een 1-steekproef t-test één steekproefgemiddelde met een nulhypothesewaarde. Een gepaarde t-test berekent eenvoudig het verschil tussen gepaarde waarnemingen (bijvoorbeeld voor en na) en voert vervolgens een 1-monster t-test uit op de verschillen.

u kunt dit testen met deze gegevensverzameling om te zien hoe alle resultaten identiek zijn, inclusief het gemiddelde verschil, de t-waarde, de p-waarde en het betrouwbaarheidsinterval van het verschil.,

begrijpen dat de gepaarde t-test gewoon een 1-sample t-test uitvoert op de gepaarde verschillen kan u echt helpen begrijpen hoe de gepaarde t-test werkt en wanneer u deze moet gebruiken. Je hoeft alleen maar uit te zoeken of het zinvol is om het verschil tussen elk paar waarnemingen te berekenen.

bijvoorbeeld, laten we aannemen dat” before “en” after ” testscores vertegenwoordigen, en er was een interventie tussen hen., Als de voor-en na-scores in elke rij van het voorbeeldwerkblad hetzelfde onderwerp vertegenwoordigen, is het zinvol om het verschil tussen de scores op deze manier te berekenen—de gekoppelde t-test is geschikt. Echter, als de scores in elke rij voor verschillende onderwerpen zijn, heeft het geen zin om het verschil te berekenen. In dit geval moet u een andere test gebruiken, zoals de 2-sample t-test, die ik hieronder bespreek.

het gebruik van de gekoppelde t-test bespaart u simpelweg de stap van het berekenen van de verschillen voordat u de t-test uitvoert., Je hoeft alleen maar om zeker te zijn dat de gekoppelde verschillen zinvol zijn!

wanneer het aangewezen is een gepaarde t-test te gebruiken, kan deze krachtiger zijn dan een t-test van 2 monsters. Voor meer informatie, ga naar overzicht voor gepaarde t.

hoe twee-monster T-tests t-waarden berekenen

De twee-monster t-test neemt uw monstergegevens van twee groepen en komt neer op de t-waarde. Het proces is zeer vergelijkbaar met de 1-sample t-test, en je kunt nog steeds de analogie van de signaal-ruisverhouding gebruiken. In tegenstelling tot de gepaarde t-test, vereist de 2-steekproef t-test onafhankelijke groepen voor elk monster.,

De formule is hieronder, en dan wat discussie.

voor de t-test met 2 monsters is de teller opnieuw het signaal, dat het verschil is tussen het gemiddelde van de twee monsters. Bijvoorbeeld, als het gemiddelde van groep 1 10 is, en het gemiddelde van groep 2 4 is, is het verschil 6.

De standaard nulhypothese voor een t-test met 2 monsters is dat de twee groepen gelijk zijn. Je kunt in de vergelijking zien dat wanneer de twee groepen gelijk zijn, het verschil (en de hele verhouding) ook gelijk is aan nul., Naarmate het verschil tussen de twee groepen in positieve of negatieve richting toeneemt, wordt het signaal sterker.

in een t-test met 2 monsters is de noemer nog steeds de ruis, maar Minitab kan twee verschillende waarden gebruiken. Je kunt aannemen dat de variabiliteit in beide groepen gelijk of niet gelijk is, en Minitab gebruikt de overeenkomstige schatting van de variabiliteit. Hoe dan ook, het principe blijft hetzelfde: je vergelijkt je signaal met de ruis om te zien hoeveel het signaal opvalt.,

net als bij de 1-sample t-test, voor een bepaald verschil in de teller, als je de ruiswaarde in de noemer verhoogt, wordt de T-waarde kleiner. Om te bepalen dat de groepen verschillend zijn, heb je een T-waarde nodig die groot is.

Wat betekenen t-waarden?

elk type t-test gebruikt een procedure om al uw monstergegevens samen te vatten tot één waarde, de t-waarde. De berekeningen vergelijken uw steekproefgemiddelde (s) met de nulhypothese en omvat zowel de steekproefgrootte als de variabiliteit in de gegevens., Een t-waarde van 0 geeft aan dat de resultaten van de steekproef precies gelijk zijn aan de nulhypothese. In statistieken noemen we het verschil tussen de steekproefschatting en de nulhypothese de effectgrootte. Naarmate dit verschil toeneemt, neemt de absolute waarde van de t-waarde toe.

dat is allemaal mooi, maar wat betekent een t-waarde van, Laten we zeggen, 2 echt? Uit bovenstaande discussie weten we dat een t-waarde van 2 aangeeft dat het waargenomen verschil tweemaal zo groot is als de variabiliteit in uw gegevens. Echter, we gebruiken t-tests om hypothesen te evalueren in plaats van alleen het uitzoeken van de signaal-ruisverhouding., We willen bepalen of de effectgrootte statistisch significant is.

om te zien hoe we van t-waarden naar het beoordelen van hypothesen en het bepalen van statistische significantie, lees het andere bericht in deze serie, begrip t-Tests: t-waarden en T-distributies.