Articles

Forståelse af t-Test: 1-Prøve, 2-prøve og parrede t-test

i statistikker er t-test en type hypotesetest, der giver dig mulighed for at sammenligne midler. De kaldes t-test, fordi hver t-test koger dine prøvedata ned til et nummer, t-værdien. Hvis du forstår, hvordan t-test beregner t-værdier, er du godt på vej til at forstå, hvordan disse test fungerer.

i denne serie af indlæg fokuserer jeg på begreber snarere end ligninger for at vise, hvordan t-test fungerer. Men dette indlæg indeholder to enkle ligninger, som jeg vil arbejde igennem ved hjælp af analogien af et signal-til-støj-forhold.,

Minitab statistisk Soft .are tilbyder 1-prøve t-test, parret t-test, og 2-prøve t-test. Lad os se på, hvordan hver af disse t-test reducerer dine prøvedata ned til t-værdien.

Hvordan 1-Prøve t-test beregner t-værdier

forståelse af denne proces er afgørende for at forstå, hvordan t-test fungerer. Jeg vil vise dig formlen først, og så vil jeg forklare, hvordan det virker.

Bemærk venligst, at formlen er et forhold. En almindelig analogi er, AT T-værdien er signal-til-støj-forholdet.

Signal (alias effektstørrelsen)

tælleren er signalet., Du skal blot tage prøven middelværdi og trække nul hypotese værdi. Hvis din prøvemiddelværdi er 10, og nulhypotesen er 6, er forskellen eller signalet 4.

hvis der ikke er nogen forskel mellem prøvemiddelværdien og nulværdien, er signalet i tælleren såvel som værdien af hele forholdet lig med nul. For eksempel, hvis din prøvemiddelværdi er 6, og nullværdien er 6, er forskellen nul.

da forskellen mellem prøvemiddelværdien og nullhypotesen øges i enten den positive eller negative retning, øges signalets styrke.,


masser af støj kan overvælde signalet.

støj

nævneren er støj. Ligningen i nævneren er et mål for variabilitet kendt som middelfejlens standardfejl. Denne statistik angiver, hvor præcist din prøve estimerer gennemsnittet af befolkningen. Et større antal angiver, at din prøve skøn er mindre præcis, fordi det har mere tilfældig fejl.

denne tilfældige fejl er “støj.”Når der er mere støj, forventer du at se større forskelle mellem prøvemiddelværdien og nullhypotesværdien, selv når nullhypotesen er sand., Vi inkluderer støjfaktoren i nævneren, fordi vi skal afgøre, om signalet er stort nok til at skille sig ud fra det.

Signal-støjforhold

både signal-og støjværdierne findes i enhederne i dine data. Hvis dit signal er 6, og støjen er 2, er din t-værdi 3. Denne T-værdi angiver, at forskellen er 3 gange størrelsen af standardfejlen. Men hvis der er forskel på samme størrelse, men dine data har større variation (6), er din t-værdi kun 1. Signalet er i samme skala som støj.,

på denne måde giver t-værdier dig mulighed for at se, hvor skelneligt dit signal er fra støj. Relativt store signaler og lave støjniveauer giver større t-værdier. Hvis signalet ikke skiller sig ud fra den støj, det er sandsynligt, at den observerede forskel mellem prøven skøn, og nulhypotesen værdi skyldes tilfældige fejl i stikprøven, snarere end en sand forskel på befolkningen.

en parret t-test er kun en 1-Prøve t-Test

mange mennesker er forvirrede over, hvornår de skal bruge en parret t-test, og hvordan den fungerer. Jeg vil lade dig ind på en lille hemmelighed., Den parrede t-test og 1-prøve t-test er faktisk den samme test i forklædning! Som vi så ovenfor, sammenligner en 1-prøve t-test en prøve middelværdi til en nulhypotesværdi. En parret t-test beregner blot forskellen mellem parrede observationer (f before før og efter) og udfører derefter en 1-prøve t-test på forskellene.

Du kan teste dette med dette datasæt for at se, hvordan alle resultaterne er identiske, herunder den gennemsnitlige forskel, t-værdi, p-værdi og konfidensinterval for forskellen.,forståelse af, at den parrede t-test blot udfører en 1-prøve t-test på de parrede forskelle, kan virkelig hjælpe dig med at forstå, hvordan den parrede t-test fungerer, og hvornår du skal bruge den. Du skal bare finde ud af, om det giver mening at beregne forskellen mellem hvert par observationer.antage, at “før” og “efter” repræsenterer testresultater, og der var en intervention mellem dem., Hvis før og efter scoringer i hver række i eksemplet regneark repræsenterer det samme emne, er det fornuftigt at beregne forskellen mellem scoringerne på denne måde—den parrede t-test er passende. Men hvis scorerne i hver række er for forskellige emner, giver det ikke mening at beregne forskellen. I dette tilfælde skal du bruge en anden test, såsom 2-prøve t-test, som jeg diskuterer nedenfor.

brug af den parrede t-test sparer dig simpelthen for at skulle beregne forskellene, før du udfører t-testen., Du skal bare være sikker på, at de parrede forskelle giver mening!

Når det er hensigtsmæssigt at bruge en parret t-test, kan den være mere kraftfuld end en 2-prøve t-test. For mere information, gå til Oversigt for parret t.

hvordan To-prøve T-test beregner T-værdier

2-prøve t-testen tager dine prøvedata fra to grupper og koger dem ned til t-værdien. Processen ligner meget på 1-prøve t-testen, og du kan stadig bruge analogien af signal-til-støj-forholdet. I modsætning til den parrede t-test kræver 2-prøve t-testen uafhængige grupper for hver prøve.,

formlen er nedenfor, og derefter nogle diskussioner.

for 2-prøve t-testen er tælleren igen signalet, hvilket er forskellen mellem midlerne til de to prøver. For eksempel, hvis gennemsnittet af gruppe 1 er 10, og gennemsnittet af gruppe 2 er 4, er forskellen 6.

standard nulhypotesen for en 2-prøve t-test er, at de to grupper er ens. Du kan se i ligningen, at når de to grupper er ens, er forskellen (og hele forholdet) også lig med nul., Når forskellen mellem de to grupper vokser i enten en positiv eller negativ retning, bliver signalet stærkere.

i en 2-prøve t-test er nævneren stadig støj, men Minitab kan bruge to forskellige værdier. Du kan enten antage, at variabiliteten i begge grupper er lige eller ikke lige, og Minitab bruger det tilsvarende skøn over variabiliteten. Uanset hvad forbliver princippet det samme: du sammenligner dit signal med støj for at se, hvor meget signalet skiller sig ud.,

ligesom med 1-prøve t-testen, for en given forskel i tælleren, når du øger støjværdien i nævneren, bliver t-værdien mindre. For at bestemme, at grupperne er forskellige, har du brug for en T-værdi, der er stor.

Hvad betyder t-værdier?

hver Type t-test bruger en procedure til at koge alle dine prøvedata ned til en værdi, t-værdien. Beregningerne sammenligner din prøvemiddelværdi (er) med nulhypotesen og inkorporerer både prøvestørrelsen og variabiliteten i dataene., En T-værdi på 0 indikerer, at prøveresultaterne nøjagtigt svarer til nulhypotesen. I statistikker kalder vi forskellen mellem prøvestimatet og nulhypotesen effektstørrelsen. Når denne forskel stiger, stiger den absolutte værdi af t-værdien.

det er alt godt, men hvad betyder en T-værdi af, Siger, 2 virkelig? Fra diskussionen ovenfor ved vi, at en T-værdi på 2 indikerer, at den observerede forskel er dobbelt så stor som variationen i dine data. Vi bruger dog t-test til at evaluere hypoteser snarere end bare at finde ud af signal-til-støj-forholdet., Vi ønsker at afgøre, om effektstørrelsen er statistisk signifikant.

for at se, hvordan vi kommer fra t-værdier til vurdering af hypoteser og bestemmelse af statistisk betydning, skal du læse det andet indlæg i denne serie, forstå t-test: t-værdier og t-distributioner.