Înțelegerea testelor t: 1-Eșantion, 2-eșantion și teste t asociate
în statistici, testele t sunt un tip de test de ipoteză care vă permite să comparați mijloacele. Ele sunt numite t-teste, deoarece fiecare t-test se reduce datele de probă până la un număr, t-valoare. Dacă înțelegeți modul în care testele t calculează valorile t, sunteți pe cale să înțelegeți cum funcționează aceste teste.
în această serie de postări, mă concentrez mai degrabă pe concepte decât pe ecuații pentru a arăta cum funcționează testele T. Cu toate acestea, acest post include două ecuații simple pe care le voi lucra prin utilizarea analogiei unui raport semnal-zgomot.,software-ul statistic Minitab oferă testul t 1-eșantion, testul t asociat și testul T 2-eșantion. Să analizăm modul în care fiecare dintre aceste teste t reduce datele eșantionului până la valoarea T.
Cum 1-probă t-teste calcula t-valori
înțelegerea acestui proces este crucială pentru a înțelege modul în care funcționează t-teste. Vă voi arăta mai întâi formula și apoi vă voi explica cum funcționează.
vă rugăm să observați că formula este un raport. O analogie comună este că valoarea t este raportul semnal-zgomot.
semnal (aka dimensiunea efectului)
numărătorul este semnalul., Pur și simplu luați media eșantionului și scădeți valoarea ipotezei nule. Dacă media eșantionului dvs. este 10 și ipoteza nulă este 6, diferența sau semnalul este 4.dacă nu există nicio diferență între media eșantionului și valoarea nulă, semnalul din numărător, precum și valoarea întregului raport, este egal cu zero. De exemplu, dacă media eșantionului dvs. este 6 și valoarea nulă este 6, diferența este zero.deoarece diferența dintre media eșantionului și ipoteza nulă crește în direcția pozitivă sau negativă, puterea semnalului crește.,o mulțime de zgomot poate copleși semnalul.
zgomot
numitorul este zgomotul. Ecuația din numitor este o măsură a variabilității cunoscută sub numele de eroarea standard a mediei. Această statistică indică cât de precis eșantionul dvs. estimează media populației. Un număr mai mare indică faptul că estimarea eșantionului dvs. este mai puțin precisă, deoarece are o eroare mai aleatorie.această eroare aleatorie este ” zgomot.”Când există mai mult zgomot, vă așteptați să vedeți diferențe mai mari între media eșantionului și valoarea ipotezei nule chiar și atunci când ipoteza nulă este adevărată., Includem factorul de zgomot în numitor, deoarece trebuie să determinăm dacă semnalul este suficient de mare pentru a ieși în evidență.
raportul semnal-zgomot
atât valorile semnalului, cât și cele ale zgomotului sunt în unitățile datelor dvs. Dacă semnalul dvs. este 6 și zgomotul este 2, Valoarea t este 3. Această valoare t indică faptul că diferența este de 3 ori mai mare decât eroarea standard. Cu toate acestea, dacă există o diferență de aceeași dimensiune, dar datele dvs. au o variabilitate mai mare (6), valoarea t este doar 1. Semnalul este la aceeași scară cu zgomotul.,
în acest mod, valorile t vă permit să vedeți cât de distinct este semnalul dvs. de zgomot. Semnalele relativ mari și nivelurile scăzute de zgomot produc valori t mai mari. Dacă semnalul nu iasă în evidență de la zgomot, este probabil ca diferența observată între eșantionul de estimare și ipoteza nulă valoare se datorează erorii aleatorii în eșantion, mai degrabă decât o adevărată diferență la nivelul populației.
un test T asociat este doar un test T cu 1 probă
mulți oameni sunt confuzi când să folosească un test t asociat și cum funcționează. O să-ți spun un mic secret., Testul t asociat și testul t cu 1 eșantion sunt de fapt același test deghizat! După cum am văzut mai sus, un test t cu 1 eșantion compară o medie a eșantionului cu o valoare nulă a ipotezei. Un T-test asociat calculează pur și simplu diferența dintre observațiile pereche (de exemplu, înainte și după) și apoi efectuează un 1-probă t-test privind diferențele.puteți testa acest lucru cu acest set de date pentru a vedea cum toate rezultatele sunt identice, inclusiv diferența medie, valoarea t, valoarea p și intervalul de încredere al diferenței.,
înțelegerea faptului că testul t asociat efectuează pur și simplu un test t cu 1 eșantion pe diferențele asociate vă poate ajuta cu adevărat să înțelegeți cum funcționează testul t asociat și când să îl utilizați. Trebuie doar să vă dați seama dacă are sens să calculați diferența dintre fiecare pereche de observații.de exemplu, să presupunem că” înainte „și” după ” reprezintă scorurile testelor și a existat o intervenție între ele., Dacă scorurile înainte și după din fiecare rând al foii de lucru de exemplu reprezintă același subiect, este logic să se calculeze diferența dintre scoruri în acest mod—testul t asociat este adecvat. Cu toate acestea, dacă scorurile din fiecare rând sunt pentru subiecte diferite, nu are sens să se calculeze diferența. În acest caz, va trebui să utilizați un alt test, cum ar fi testul T 2-sample, pe care îl discut mai jos.
folosind asociat t-test pur și simplu vă salvează pasul de a avea pentru a calcula diferențele înainte de a efectua t-test., Trebuie doar să fii sigur că diferențele asociate au sens!când este necesar să se utilizeze un test t asociat, acesta poate fi mai puternic decât un test t cu 2 probe. Pentru mai multe informații, accesați Prezentare generală pentru T asociat.
modul în care testele T cu două eșantioane calculează valorile t
testul t cu 2 eșantioane ia datele dvs. de probă din două grupuri și le reduce la valoarea T. Procesul este foarte similar cu testul t cu 1 eșantion și puteți utiliza în continuare analogia raportului semnal-zgomot. Spre deosebire de testul t asociat, testul t cu 2 eșantioane necesită grupuri independente pentru fiecare eșantion.,
formula este de mai jos, și apoi unele discuții.
pentru testul t cu 2 eșantioane, numărătorul este din nou semnalul, care este diferența dintre mijloacele celor două eșantioane. De exemplu, dacă media grupului 1 este 10, iar media grupului 2 este 4, diferența este 6.
ipoteza implicită nulă pentru un 2-eșantion t-test este că cele două grupuri sunt egale. Puteți vedea în ecuație că atunci când cele două grupuri sunt egale, diferența (și întregul raport) este de asemenea egală cu zero., Pe măsură ce diferența dintre cele două grupuri crește fie într-o direcție pozitivă, fie negativă, semnalul devine mai puternic.
într-un test t cu 2 eșantioane, numitorul este în continuare zgomotul, dar Minitab poate utiliza două valori diferite. Puteți presupune fie că variabilitatea în ambele grupuri este egală sau nu egală, iar Minitab utilizează estimarea corespunzătoare a variabilității. Oricum, principiul rămâne același: vă comparați semnalul cu zgomotul pentru a vedea cât de mult semnalul iese în evidență.,la fel ca în cazul testului t cu 1 eșantion, pentru orice diferență dată în numărător, pe măsură ce creșteți valoarea zgomotului în numitor, valoarea t devine mai mică. Pentru a determina că grupurile sunt diferite, aveți nevoie de o valoare t care este mare.
ce înseamnă valorile t?
fiecare tip de test t utilizează o procedură pentru a reduce toate datele eșantionului la o singură valoare, valoarea T. Calculele compară media eșantionului(eșantioanelor) cu ipoteza nulă și încorporează atât dimensiunea eșantionului, cât și variabilitatea datelor., O valoare t de 0 indică faptul că rezultatele eșantionului sunt exact egale cu ipoteza nulă. În statistici, numim diferența dintre estimarea eșantionului și ipoteza nulă dimensiunea efectului. Pe măsură ce această diferență crește, valoarea absolută a valorii t crește.
totul este frumos, dar ce înseamnă cu adevărat o valoare t de, să zicem, 2? Din discuția de mai sus, știm că o valoare t de 2 indică faptul că diferența observată este de două ori mai mare decât variabilitatea datelor dvs. Cu toate acestea, folosim teste t pentru a evalua ipoteze, mai degrabă decât doar imaginind raportul semnal-zgomot., Vrem să determinăm dacă mărimea efectului este semnificativă statistic.pentru a vedea cum ajungem de la valorile t la evaluarea ipotezelor și determinarea semnificației statistice, citiți cealaltă postare din această serie, înțelegând testele t: valorile t și distribuțiile T.