Articles

Forståelse t-Tester: 1-utvalg, 2-utvalg, og Parede t-Tester

I statistikk, t-tester er en type hypotesetest som gir deg mulighet til å sammenligne betyr. De er kalt t-tester fordi hver t-test koker din eksempeldata ned til ett tall, t-verdi. Hvis du forstår hvordan t-tester beregne t-verdier, er du godt på vei til å forstå hvordan disse testene arbeid.

I denne serien av innlegg, jeg fokuserer på begrepene snarere enn ligninger for å vise hvordan t-tester arbeid. Men, dette innlegget inneholder to enkle ligninger som jeg kommer til å samarbeide gjennom å bruke analogien av en signal-til-støy-forhold.,

Minitab Statistisk Programvare tilbyr 1-utvalg t-test paret t-test, 2-utvalg t-test. La oss se på hvordan hver av disse t-tester redusere eksempel data ned til t-verdi.

Hvordan 1-Utvalg t-Tester Beregne t-Verdier

Forstå denne prosessen er avgjørende for å forstå hvordan t-tester arbeid. Jeg vil vise deg formel først, og så skal jeg forklare hvordan det fungerer.

Vennligst legg merke til at formelen er en-forhold. En felles analogien er at t-verdien er signal-til-støy-forhold.

– Signal (et.k.a. effekten size)

telleren er signalet., Du bare ta utvalgsgjennomsnittet og trekke fra nullhypotesen verdi. Hvis prøven mener er 10 og nullhypotesen er 6, forskjellen, eller signalet er 4.

Hvis det ikke er noen forskjell mellom utvalgsgjennomsnittet og null-verdi, signal i telleren, samt verdien av hele forholdet, er lik null. For eksempel, hvis din utvalget mener er 6 og null-verdi er 6, forskjellen er null.

Som forskjellen mellom utvalgsgjennomsnittet og nullhypotesen bety en økning i enten positiv eller negativ retning, styrken på signalet øker.,

Mye støy kan overvelde signal.

Støy

nevneren er støy. Ligningen i nevneren er et mål på variasjonen kjent som standard error of the mean. Denne statistikken viser nøyaktig hvordan din utvalget anslår gjennomsnittlig i befolkningen. Et større antall indikerer at prøven anslaget er mindre presist fordi det har mer tilfeldige feil.

Denne tilfeldige feil er «støy.»Når det er mer støy, kan du forvente å se større forskjeller mellom utvalgsgjennomsnittet og nullhypotesen verdi selv når nullhypotesen er sann., Vi inkluderer støy faktor i nevneren fordi vi må finne ut om signalet er store nok til å skille seg ut fra det.

Signal-til-Støy-forhold

Både signal og støy verdier er i enheter av dine data. Hvis signalet er 6 og støy er 2, t-verdien er 3. Denne t-verdien indikerer at forskjellen er 3 ganger størrelsen på standard feil. Imidlertid, hvis det er en forskjell av samme størrelse, men dataene har mer variasjon (6), t-verdien er bare 1. Signalet er på samme skala som støy.,

På denne måten, t-verdier kan du se hvordan dine skilles signal fra støy. Relativt store signaler og lave nivåer av støy produsere større t-verdier. Hvis signalet ikke skiller seg ut fra støy, er det sannsynlig at den observerte forskjellen mellom sample estimat og nullhypotesen verdi er på grunn av tilfeldige feil i prøven snarere enn en sann forskjell på befolkningsnivå.

En Paret t-test Er Bare En 1-Utvalg t-Test

Mange mennesker er forvirret om når du skal bruke en paret t-test og hvordan det fungerer. Jeg skal fortelle deg en liten hemmelighet., Paret t-test og 1-utvalg t-test er faktisk den samme testen i forkledning! Som vi så ovenfor, en 1-utvalg t-test sammenligner ett eksempel bety for et null-hypotesen verdi. En paret t-test bare beregner forskjellen mellom de sammenkoblede observasjoner (f.eks., før og etter), og utfører deretter en 1-utvalg t-test på forskjeller.

Du kan teste dette med dette datasettet for å se hvordan alle resultatene er identiske, inkludert bety forskjellen, t-verdi p-verdi og konfidensintervall for forskjellen.,

Forstå at paret t-test rett og slett utfører en 1-utvalg t-test på den sammenkoblede forskjeller kan virkelig hjelpe deg å forstå hvordan paret t-test virker, og når du skal bruke det. Du trenger bare å finne ut om det er fornuftig å beregne forskjellen mellom hvert par av observasjoner.

For eksempel, la oss anta at «før» og «etter» representerer testresultater, og det var en intervensjon i mellom dem., Hvis før og etter score i hver rad, for eksempel regneark representerer det samme motivet, er det fornuftig å beregne forskjellen mellom resultatene i denne fashion—paret t-test er riktig. Imidlertid, hvis score i hver rad er for ulike fag, er det ikke gir mening å beregne forskjellen. I dette tilfellet, ville du trenger å bruke en annen test, for eksempel 2-utvalg t-test, som jeg diskutere nedenfor.

ved Hjelp av paret t-test bare sparer deg trinn for å beregne forskjeller før du utfører t-test., Du trenger bare å være sikker på at den parvise forskjeller fornuftig!

Når er det hensiktsmessig å bruke en paret t-test, den kan være mer effektiv enn en 2-utvalg t-test. For mer informasjon, gå til Oversikt for parede t.

Hvordan To-Utvalg T-tester Beregne T-Verdier

2-utvalg t-test tar prøven data fra to grupper, og koker det ned til t-verdi. Prosessen er svært lik 1-utvalg t-test, og du kan fortsatt bruke analogien av signal-til-støy-forhold. I motsetning til paret t-test, 2-utvalg t-test krever uavhengige grupper for hver prøve.,

formelen nedenfor, og deretter noen diskusjon.

For 2-utvalg t-test, teller er igjen signalet, som er forskjellen mellom gjennomsnittene i de to utvalgene. For eksempel, hvis gjennomsnittet for gruppe 1 er 10, og middelverdien av gruppe 2 er 4, forskjellen er 6.

standard nullhypotesen for en 2-utvalg t-test er at de to gruppene er like. Du kan se i ligningen at når de to gruppene er like, forskjellen (og hele ratio) også er lik null., Forskjellen mellom de to gruppene vokser i enten en positiv eller negativ retning, signalet blir sterkere.

I en 2-utvalg t-test, nevneren er fortsatt støy, men Minitab kan bruke to forskjellige verdier. Du kan enten anta at variasjonen i begge grupper er like eller ikke like, og Minitab bruker den tilsvarende estimat for variasjon. Uansett, prinsippet er det samme: du sammenligner dine signal til støy for å se hvor mye signalet skiller seg ut.,

Akkurat som med 1-utvalg t-test, for en gitt forskjell i telleren, som du øker støy verdi i nevneren, t-verdien blir mindre. For å finne ut at gruppene er forskjellige, trenger du en t-verdi som er stor.

Hva Gjør t-Verdier Betyr?

Hver type t-testen bruker en prosedyre for å koke alle dine eksempeldata ned til en verdi t-verdi. Beregningene sammenligne eksempel betyr(er) til null-hypotesen, og omfatter både sample størrelse og variasjon i data., En t-verdi på 0 indikerer at prøveresultatene nøyaktig lik null-hypotesen. I statistikken, kaller vi forskjellen mellom sample estimat og nullhypotesen effekten størrelse. Så denne forskjellen øker, den absolutte verdien av t-verdien øker.

Det er alt bra, men hva gjør en t-verdi på, sier, 2 egentlig betyr? Fra diskusjonen ovenfor, vet vi at en t-verdi på 2 viser at den observerte forskjellen er to ganger størrelsen av variabiliteten i dataene. Men, vil vi bruke t-tester for å vurdere hypoteser snarere enn bare å finne ut signal-til-støy-forhold., Vi ønsker å finne ut om effekten størrelse er statistisk signifikant.

for Å se hvordan vi får fra t-verdier til å vurdere hypoteser og å bestemme statistisk signifikans, lese andre innlegg i denne serien, Forståelse t-Tester: t-verdier og t-distribusjoner.