Förstå T-test: 1-prov, 2-prov och Parade t-test
i statistiken är t-test en typ av hypotestest som låter dig jämföra medel. De kallas t-test eftersom varje t-test kokar dina provdata ner till ett nummer, t-värdet. Om du förstår hur t-tester beräknar t-värden är du på god väg att förstå hur dessa tester fungerar.
i den här serien av inlägg fokuserar jag på begrepp snarare än ekvationer för att visa hur t-tester fungerar. Men det här inlägget innehåller två enkla ekvationer som jag ska arbeta igenom med hjälp av analogi av ett signal-till-brusförhållande.,
Minitab Statistical Software erbjuder 1-prov T-test, parat t-test och 2-prov t-test. Låt oss titta på hur var och en av dessa t-tester minskar dina provdata ner till t-värdet.
Hur 1-prov t-tester beräknar t-värden
att förstå denna process är avgörande för att förstå hur t-tester fungerar. Jag ska visa dig formeln först, och sedan ska jag förklara hur det fungerar.
Observera att formeln är ett förhållande. En vanlig analogi är att t-värdet är signal-brusförhållandet.
Signal (Alias effektstorleken)
täljaren är signalen., Du tar helt enkelt provet medelvärde och subtrahera nollhypotesvärdet. Om ditt provmedelvärde är 10 och nollhypotesen är 6 är skillnaden eller signalen 4.
om det inte finns någon skillnad mellan provmedelvärdet och nollvärdet, är signalen i täljaren, liksom värdet av hela förhållandet, lika med noll. Till exempel, om ditt prov medelvärde är 6 och nollvärdet är 6, skillnaden är noll.
eftersom skillnaden mellan provmedelvärdet och nollhypotesen innebär ökningar i antingen den positiva eller negativa riktningen ökar signalstyrkan.,
brus
nämnaren är bruset. Ekvationen i nämnaren är ett mått på variabilitet som kallas medelvärdets standardfel. Denna statistik visar hur exakt ditt prov uppskattar medelvärdet av befolkningen. Ett större antal indikerar att ditt prov uppskattning är mindre exakt eftersom det har mer slumpmässigt fel.
det här slumpmässiga felet är ”bruset”.”När det finns mer ljud förväntar du dig att se större skillnader mellan provmedelvärdet och nollhypotesvärdet även när nollhypotesen är sann., Vi inkluderar bullerfaktorn i nämnaren eftersom vi måste avgöra om signalen är tillräckligt stor för att sticka ut från den.
Signal-brusförhållande
både signal-och brusvärdena finns i enheterna i dina data. Om din signal är 6 och bruset är 2, är ditt T-värde 3. Detta t-värde indikerar att skillnaden är 3 gånger storleken på standardfelet. Men om det finns en skillnad av samma storlek men dina data har mer variabilitet (6) är ditt T-värde bara 1. Signalen är i samma skala som bruset.,
På detta sätt tillåter t-värden dig att se hur urskiljbar din signal är från bruset. Relativt stora signaler och låga bullernivåer ger större T-värden. Om signalen inte sticker ut från bruset är det troligt att den observerade skillnaden mellan provberäkningen och nollhypotesvärdet beror på slumpmässigt fel i provet snarare än en sann skillnad på populationsnivån.
ett parat t-test är bara ett 1-prov T-Test
många människor är förvirrade om när man ska använda ett parat t-test och hur det fungerar. Jag släpper in dig på en liten hemlighet., Det parade t-testet och 1-provet t-testet är faktiskt samma test i förklädnad! Som vi såg ovan jämför ett 1-prov t-test ett prov medelvärde till ett nollhypotesvärde. Ett parat t-test beräknar helt enkelt skillnaden mellan Parade observationer (t.ex. före och efter) och utför sedan ett 1-prov T-test på skillnaderna.
Du kan testa detta med denna datauppsättning för att se hur alla resultat är identiska, inklusive skillnaden i medelvärde, t-värde, p-värde och konfidensintervall för skillnaden.,
förstå att det parade t-testet helt enkelt utför ett 1-prov T-test på de parade skillnaderna kan verkligen hjälpa dig att förstå hur det parade t-testet fungerar och när du ska använda det. Du behöver bara ta reda på om det är vettigt att beräkna skillnaden mellan varje par observationer.
till exempel, låt oss anta att ”före” och ”efter” representerar testresultat, och det fanns en intervention mellan dem., Om före och efter poäng i varje rad i exempelbladet representerar samma ämne, är det vettigt att beräkna skillnaden mellan poängen på detta sätt—det parade t-testet är lämpligt. Men om poängen i varje rad är för olika ämnen, är det inte meningsfullt att beräkna skillnaden. I det här fallet måste du använda ett annat test, till exempel 2-provet t-test, som jag diskuterar nedan.
med hjälp av det parade t-testet sparar du helt enkelt steget att behöva beräkna skillnaderna innan du utför t-testet., Du behöver bara vara säker på att de parade skillnaderna är meningsfulla!
När det är lämpligt att använda ett parat t-test kan det vara kraftfullare än ett t-test med 2 prov. För mer information, gå till Översikt för parade t.
hur två-prov t-tester beräkna t-värden
2-prov T-testet tar dina provdata från två grupper och kokar ner till t-värdet. Processen är mycket lik 1-prov T-test, och du kan fortfarande använda analogin av signal-brusförhållandet. Till skillnad från det parade t-testet kräver 2-prov T-testet oberoende grupper för varje prov.,
formeln är nedan, och sedan lite diskussion.
för 2-prov T-testet är täljaren igen signalen, vilket är skillnaden mellan de två provens medel. Till exempel, om medelvärdet för Grupp 1 är 10, och medelvärdet för Grupp 2 är 4, är skillnaden 6.
standardnullhypotesen för ett 2-prov T-test är att de två grupperna är lika. Du kan se i ekvationen att när de två grupperna är lika, är skillnaden (och hela förhållandet) också lika med noll., Eftersom skillnaden mellan de två grupperna växer i antingen positiv eller negativ riktning blir signalen starkare.
i ett 2-prov T-test är nämnaren fortfarande bruset, men Minitab kan använda två olika värden. Du kan antingen anta att variationen i båda grupperna är lika eller inte lika, och Minitab använder motsvarande uppskattning av variabiliteten. Hur som helst är principen densamma: du jämför din signal med bruset för att se hur mycket signalen sticker ut.,
precis som med 1-prov T-test, för varje given skillnad i täljaren, när du ökar bullervärdet i nämnaren, blir t-värdet mindre. För att bestämma att grupperna är olika behöver du ett T-värde som är stort.
Vad betyder T-värden?
varje typ av T-test använder ett förfarande för att koka alla dina provdata ner till ett värde, t-värdet. Beräkningarna jämför dina provmedelvärden med nollhypotesen och innehåller både provstorleken och variationen i data., Ett T-värde på 0 indikerar att provresultaten exakt motsvarar nollhypotesen. I statistiken kallar vi skillnaden mellan provberäkningen och nollhypotesen effektstorleken. När denna skillnad ökar ökar det absoluta värdet av T-värdet.
det är trevligt, men vad betyder ett T-värde av, säg, 2 verkligen? Från diskussionen ovan vet vi att ett T-värde på 2 indikerar att den observerade skillnaden är dubbelt så stor som variationen i dina data. Vi använder dock t-test för att utvärdera hypoteser snarare än att bara räkna ut signal-till-brusförhållandet., Vi vill avgöra om effektstorleken är statistiskt signifikant.
för att se hur vi får från t-värden för att bedöma hypoteser och bestämma statistisk signifikans, läs det andra inlägget i denna serie, förstå t-test: t-värden och t-fördelningar.