Porozumění t-testům: 1-vzorek, 2-vzorek a spárované t-testy
ve statistikách jsou T-testy typem testu hypotézy, který vám umožňuje porovnat prostředky. Nazývají se t-testy, protože každý t-test snižuje vaše vzorková data na jedno číslo, hodnotu T. Pokud pochopíte, jak t-testy vypočítávají hodnoty t, jste na dobré cestě k pochopení toho, jak tyto testy fungují.
v této sérii příspěvků se zaměřuji spíše na koncepty než na rovnice, abych ukázal, jak fungují t-testy. Tento příspěvek však obsahuje dvě jednoduché rovnice, které budu pracovat pomocí analogie poměru signál-šum.,
statistický Software Minitab nabízí 1-sample t-test, spárovaný t-test a 2-sample t-test. Podívejme se, jak každý z těchto t-testů snižuje vaše vzorová data na hodnotu T.
jak 1-vzorek t-testy vypočítat t-hodnoty
pochopení tohoto procesu je zásadní pro pochopení toho, jak t-testy fungují. Nejdřív vám ukážu vzorec a pak vysvětlím, jak to funguje.
Upozorňujeme, že vzorec je poměr. Běžnou analogií je, že hodnota t je poměr signálu k šumu.
signál (také znám jako velikost efektu)
čitatel je signál., Jednoduše odeberete vzorový průměr a odečtete hodnotu nulové hypotézy. Pokud je váš vzorový průměr 10 a nulová hypotéza je 6, rozdíl nebo signál je 4.
pokud neexistuje žádný rozdíl mezi průměrem vzorku a nulovou hodnotou, signál v čitateli, stejně jako hodnota celého poměru, se rovná nule. Například, pokud je váš průměr vzorku 6 a hodnota null je 6, rozdíl je nulový.
Jako rozdíl mezi výběrový průměr a nulová hypotéza znamená zvýšení buď pozitivní nebo negativní směr, síla signálu se zvyšuje.,
šum
jmenovatelem je šum. Rovnice ve jmenovateli je měřítkem variability známé jako standardní chyba průměru. Tato statistika udává, jak přesně váš vzorek odhaduje průměr populace. Větší číslo znamená, že odhad vzorku je méně přesný, protože má více náhodných chyb.
tato náhodná chyba je “ šum.“Když je více šumu, očekáváte větší rozdíly mezi průměrem vzorku a hodnotou nulové hypotézy, i když je nulová hypotéza pravdivá., Do jmenovatele zahrnujeme faktor šumu, protože musíme určit, zda je signál dostatečně velký, aby z něj vyčníval.
poměr signálu k šumu
hodnoty signálu I šumu jsou v jednotkách vašich dat. Pokud je váš signál 6 a šum je 2, vaše hodnota t je 3. Tato hodnota t znamená, že rozdíl je 3krát větší než standardní chyba. Pokud však existuje rozdíl stejné velikosti, ale vaše data mají větší variabilitu (6), vaše hodnota t je pouze 1. Signál je ve stejném měřítku jako hluk.,
tímto způsobem vám hodnoty t umožňují zjistit, jak je váš signál odlišitelný od šumu. Relativně velké signály a nízká hladina hluku produkují větší hodnoty T. Pokud signál nevyčnívá z šumu, je pravděpodobné, že pozorovaný rozdíl mezi odhadem vzorku a hodnotou nulové hypotézy je způsoben náhodnou chybou ve vzorku spíše než skutečným rozdílem na úrovni populace.
spárovaný t-test je jen 1-ukázkový T-Test
mnoho lidí je zmateno, kdy použít spárovaný t-test a jak to funguje. Pustím tě do malého tajemství., Spárovaný t-test a 1-vzorek t-test jsou ve skutečnosti stejný test v přestrojení! Jak jsme viděli výše, 1-vzorek t-test porovnává jeden průměr vzorku s nulovou hodnotou hypotézy. Spárovaný t-test jednoduše vypočítá rozdíl mezi spárovanými pozorováními (např. před a po) a poté provede 1-vzorek t-test na rozdílech.
můžete tento test se s této množiny dat, aby viděli, jak se všechny výsledky jsou identické, včetně znamenat rozdíl, t-value, p-value, interval spolehlivosti rozdílu.,
pochopení, že spárovaný t-test jednoduše provede 1-ukázkový t-test na spárovaných rozdílech, vám může opravdu pomoci pochopit, jak spárovaný t-test funguje a kdy jej použít. Stačí zjistit, zda má smysl vypočítat rozdíl mezi každým párem pozorování.
například předpokládejme, že“ před „a“ po “ představují výsledky testů a mezi nimi došlo k zásahu., Pokud skóre před a po v každém řádku příkladového listu představují stejný předmět, má smysl vypočítat rozdíl mezi skóre tímto způsobem—je vhodný spárovaný t-test. Pokud jsou však skóre v každém řádku pro různé předměty, nemá smysl vypočítat rozdíl. V tomto případě byste museli použít jiný test, jako je t-test 2-sample, o kterém diskutuji níže.
použití spárovaného t-testu vám jednoduše ušetří krok spočívající v výpočtu rozdílů před provedením t-testu., Stačí si být jisti, že spárované rozdíly mají smysl!
Pokud je vhodné použít spárovaný t-test, může být silnější než 2-vzorek t-test. Pro více informací, přejděte na Přehled pro párový t.
Jak dvouvýběrové T-testy, Výpočet T-Hodnoty
2-sample t-test trvá váš vzorek dat ze dvou skupin a vaří to, aby t-hodnota. Tento proces je velmi podobný t-testu 1-vzorku a stále můžete použít analogii poměru signál-šum. Na rozdíl od spárovaného t-testu vyžaduje 2-vzorek t-test pro každý vzorek nezávislé skupiny.,
vzorec je níže a pak nějaká diskuse.
pro 2-vzorek t-testu je čitatel opět signálem, což je rozdíl mezi prostředky obou vzorků. Například pokud je průměr skupiny 1 10 a průměr skupiny 2 je 4, rozdíl je 6.
výchozí nulová hypotéza pro t-test se 2 vzorky je, že obě skupiny jsou stejné. V rovnici můžete vidět, že když jsou obě skupiny stejné, rozdíl (a celý poměr) se také rovná nule., Vzhledem k tomu, že rozdíl mezi oběma skupinami roste buď pozitivním nebo negativním směrem, signál se stává silnějším.
ve 2-vzorkovém t-testu je jmenovatelem stále šum, ale Minitab může používat dvě různé hodnoty. Můžete buď předpokládat, že variabilita v obou skupinách je stejná nebo není stejná, a Minitab používá odpovídající odhad variability. Ať tak či onak, princip zůstává stejný: porovnáváte svůj signál s šumem, abyste zjistili, kolik signál vyniká.,
stejně jako u t-testu 1-sample, pro jakýkoli daný rozdíl v čitateli, když zvýšíte hodnotu šumu ve jmenovateli, hodnota t se zmenší. Chcete-li zjistit, že skupiny jsou různé, potřebujete velkou hodnotu T.
co znamenají hodnoty t?
každý typ t-testu používá postup k varu všech vašich vzorkových dat na jednu hodnotu, hodnotu T. Výpočty porovnávají průměr (y) vzorku s nulovou hypotézou a zahrnují jak velikost vzorku, tak variabilitu dat., Hodnota T 0 znamená, že výsledky vzorku se přesně rovnají nulové hypotéze. Ve statistice nazýváme rozdíl mezi odhadem vzorku a nulovou hypotézou velikost efektu. Jak se tento rozdíl zvyšuje, absolutní hodnota hodnoty t se zvyšuje.
to je všechno hezké,ale co znamená hodnota t, řekněme, 2? Z výše uvedené diskuse víme, že hodnota t 2 naznačuje, že pozorovaný rozdíl je dvakrát větší než variabilita vašich dat. Používáme však t-testy k vyhodnocení hypotéz, spíše než jen k určení poměru signálu k šumu., Chceme zjistit, zda je velikost efektu statisticky významná.
Chcete-li vidět, jak se dostaneme z hodnot t k hodnocení hypotéz a stanovení statistické významnosti, přečtěte si druhý příspěvek v této sérii, pochopení t-testů: t-hodnoty a t-distribuce.