Articles

Zrozumienie T-testy: 1-Próbka, 2-próbka, i sparowane T-testy

w statystykach, t-testy są rodzajem testu hipotezy, która pozwala porównać środki. Są one nazywane t-testami, ponieważ każdy t-test sprowadza dane próbki do jednej liczby, wartość t. Jeśli rozumiesz, jak testy t obliczają wartości t, jesteś na dobrej drodze do zrozumienia, jak te testy działają.

w tej serii postów skupiam się na pojęciach, a nie równaniach, aby pokazać, jak działają testy T. Jednak ten post zawiera dwa proste równania, które będę pracować za pomocą analogii stosunku sygnału do szumu.,

oprogramowanie statystyczne Minitab oferuje 1-próbny t-test, sparowany t-test i 2-próbny t-test. Przyjrzyjmy się, w jaki sposób każdy z tych testów t redukuje przykładowe dane do wartości T.

jak 1-próbkowe testy t obliczają wartości t

zrozumienie tego procesu jest kluczowe dla zrozumienia, jak działają testy T. Najpierw pokażę Ci formułę, a potem wyjaśnię, jak to działa.

proszę zauważyć, że wzór jest współczynnikiem. Powszechną analogią jest to, że wartość t jest stosunkiem sygnału do szumu.

sygnał (znany również jako rozmiar efektu)

licznik jest sygnałem., Po prostu wziąć średnią próbki i odjąć wartość hipotezy zerowej. Jeśli średnia próbki jest 10 i hipoteza zerowa jest 6, różnica, lub sygnał, jest 4.

Jeśli nie ma różnicy między średnią próbki a wartością null, sygnał w liczniku, a także wartość całego stosunku, jest równy zeru. Na przykład, jeśli średnia próbki wynosi 6, a wartość null wynosi 6, różnica wynosi zero.

jako różnica między średnią próbki i hipotezy zerowej średnich wzrostów w kierunku dodatnim lub ujemnym, siła sygnału wzrasta.,

dużo szumów może przytłoczyć sygnał.

hałas

mianownikiem jest hałas. Równanie w mianowniku jest miarą zmienności znaną jako błąd standardowy średniej. Ta statystyka wskazuje, jak dokładnie twoja próbka szacuje średnią populację. Większa liczba oznacza, że oszacowanie próbki jest mniej precyzyjne, ponieważ ma bardziej losowy błąd.

Ten losowy błąd to „szum.”Gdy jest więcej hałasu, można oczekiwać, aby zobaczyć większe różnice między średnią próbki i wartość hipotezy zerowej, nawet gdy hipoteza zerowa jest prawdziwa., Uwzględniamy współczynnik szumu w mianowniku, ponieważ musimy określić, czy sygnał jest wystarczająco duży, aby się od niego wyróżnić.

stosunek sygnału Do Szumu

zarówno wartość sygnału, jak i szumu są w jednostkach danych. Jeśli twój sygnał to 6, a szum to 2, twoja wartość t to 3. Ta wartość t wskazuje, że różnica jest 3 razy większa od błędu standardowego. Jeśli jednak istnieje różnica tego samego rozmiaru, ale dane mają większą zmienność (6), wartość t wynosi tylko 1. Sygnał jest w tej samej skali co szum.,

w ten sposób wartości t pozwalają zobaczyć, jak odróżnialny jest sygnał od szumu. Stosunkowo duże sygnały i niski poziom hałasu wytwarzają większe wartości t. Jeśli sygnał nie wyróżnia się od szumu, jest prawdopodobne, że zaobserwowana różnica między oszacowaniem próbki i wartością hipotezy zerowej jest spowodowana błędem losowym w próbie, a nie prawdziwą różnicą na poziomie populacji.

sparowany test t Jest Tylko 1-próbnym testem t

Wiele osób jest zdezorientowanych, kiedy używać sparowanego testu t i jak to działa. Zdradzę ci mały sekret., Sparowany t-test i 1-próbka t-test to w rzeczywistości ten sam test w przebraniu! Jak widzieliśmy powyżej, 1-próbka t-test porównuje jedną próbkę średnią do wartości hipotezy zerowej. Sparowany test t po prostu oblicza różnicę między sparowanymi obserwacjami (np. przed i po), a następnie wykonuje 1-próbny test t na różnicach.

możesz to przetestować za pomocą tego zestawu danych, aby sprawdzić, czy wszystkie wyniki są identyczne, w tym średnia różnica, wartość t, wartość p i przedział ufności różnicy.,

zrozumienie, że sparowany test t po prostu wykonuje 1-próbny test t na sparowanych różnicach, może naprawdę pomóc ci zrozumieć, jak działa sparowany test t i kiedy go używać. Musisz tylko dowiedzieć się, czy ma sens obliczanie różnicy między każdą parą obserwacji.

Załóżmy na przykład, że „przed” i ” po ” reprezentują wyniki testów, a między nimi nastąpiła interwencja., Jeśli wyniki przed i po w każdym wierszu przykładowego arkusza przedstawiają ten sam temat, sensowne jest obliczenie różnicy między wynikami w ten sposób—odpowiedni jest sparowany test T. Jeśli jednak wyniki w każdym wierszu dotyczą różnych przedmiotów, obliczanie różnicy nie ma sensu. W tym przypadku, trzeba użyć innego testu, takiego jak 2-próbka t-test, który omówię poniżej.

Korzystanie z sparowanego testu t pozwala po prostu zaoszczędzić czas na obliczeniu różnic przed wykonaniem testu T., Musisz tylko mieć pewność, że sparowane różnice mają sens!

gdy właściwe jest użycie sparowanego testu t, może on być mocniejszy niż 2-próbkowy test T. Aby uzyskać więcej informacji, przejdź do przeglądu dla sparowanych t.

jak dwuczłonowe testy T obliczają wartości T

dwuczłonowy test t pobiera dane próbki z dwóch grup i sprowadza je do wartości T. Proces jest bardzo podobny do 1-próbnego testu t i nadal można użyć analogii stosunku sygnału do szumu. W przeciwieństwie do sparowanego testu t, 2-próbkowy test t wymaga niezależnych grup dla każdej próbki.,

wzór jest poniżej, a potem jakaś dyskusja.

dla 2-próbkowego testu t licznik jest ponownie sygnałem, który jest różnicą między środkami dwóch próbek. Na przykład, jeśli średnia z grupy 1 wynosi 10, a średnia z grupy 2 wynosi 4, różnica wynosi 6.

domyślna hipoteza zerowa dla 2-próbka t-test jest to, że dwie grupy są równe. W równaniu widać, że gdy obie grupy są równe, różnica (i cały stosunek) również równa się zero., Gdy różnica między tymi dwoma grupami rośnie w kierunku dodatnim lub ujemnym, sygnał staje się silniejszy.

w 2-próbnym teście t mianownikiem jest nadal szum, ale Minitab może używać dwóch różnych wartości. Można założyć, że zmienność w obu grupach jest równa lub nie równa, a Minitab wykorzystuje odpowiednie oszacowanie zmienności. Tak czy inaczej, zasada pozostaje taka sama: porównujesz sygnał do szumu, aby zobaczyć, jak bardzo sygnał się wyróżnia.,

podobnie jak w przypadku 1-próbnego testu t, dla dowolnej różnicy w liczniku, w miarę zwiększania wartości szumu w mianowniku, wartość t staje się mniejsza. Aby określić, że grupy są różne, potrzebujesz wartości T, która jest duża.

co oznaczają wartości t?

każdy typ testu t wykorzystuje procedurę, aby zagotować wszystkie dane próbki do jednej wartości, wartości t. Obliczenia porównać średnią próbki (s) do hipotezy zerowej i obejmuje zarówno wielkość próby i zmienność danych., T-wartość 0 wskazuje, że wyniki próbki dokładnie równe hipotezy zerowej. W statystyce nazywamy różnicę między estymacją próbki i hipotezą zerową rozmiarem efektu. Wraz ze wzrostem tej różnicy wzrasta wartość bezwzględna wartości T.

to wszystko fajnie, ale co tak naprawdę oznacza wartość t, powiedzmy, 2? Z powyższej dyskusji wiemy, że wartość t 2 wskazuje, że obserwowana różnica jest dwukrotnie większa od zmienności w Twoich danych. Jednak używamy t-testy do oceny hipotez, a nie tylko dowiedzieć się stosunek sygnału do szumu., Chcemy ustalić, czy wielkość efektu jest statystycznie istotna.

aby zobaczyć, jak przechodzimy od wartości t do oceny hipotez i określania istotności statystycznej, przeczytaj drugi post z tej serii, rozumiejąc testy t: wartości T i rozkłady t.