Comprensione dei t-Test: 1-campione, 2-campione e t-Test accoppiati
Nelle statistiche, i t-test sono un tipo di test di ipotesi che consente di confrontare i mezzi. Sono chiamati t-test perché ogni t-test riduce i dati di esempio a un numero,il valore T. Se capisci come i test t calcolano i valori t, sei sulla buona strada per capire come funzionano questi test.
In questa serie di post, mi sto concentrando sui concetti piuttosto che sulle equazioni per mostrare come funzionano i t-test. Tuttavia, questo post include due semplici equazioni che lavorerò utilizzando l’analogia di un rapporto segnale-rumore.,
Il software statistico Minitab offre il t-test a 1 campione, il t-test accoppiato e il t-test a 2 campioni. Diamo un’occhiata a come ciascuno di questi t-test riducono i dati di esempio fino al valore T.
Come i t-Test 1-Campione calcolano i valori t
Comprendere questo processo è fondamentale per capire come funzionano i t-test. Ti mostrerò prima la formula e poi ti spiegherò come funziona.
Si prega di notare che la formula è un rapporto. Un’analogia comune è che il valore t è il rapporto segnale-rumore.
Segnale (ovvero la dimensione dell’effetto)
Il numeratore è il segnale., Basta prendere la media del campione e sottrarre il valore di ipotesi nulla. Se la media del campione è 10 e l’ipotesi nulla è 6, la differenza o il segnale è 4.
Se non vi è alcuna differenza tra la media del campione e il valore nullo, il segnale nel numeratore, così come il valore dell’intero rapporto, è uguale a zero. Ad esempio, se la media del campione è 6 e il valore null è 6, la differenza è zero.
Poiché la differenza tra la media del campione e la media dell’ipotesi nulla aumenta nella direzione positiva o negativa, la forza del segnale aumenta.,
Rumore
Il denominatore è il rumore. L’equazione nel denominatore è una misura della variabilità nota come errore standard della media. Questa statistica indica quanto accuratamente il campione stima la media della popolazione. Un numero maggiore indica che la stima del campione è meno precisa perché presenta più errori casuali.
Questo errore casuale è il ” rumore.”Quando c’è più rumore, ci si aspetta di vedere maggiori differenze tra la media del campione e il valore di ipotesi nulla anche quando l’ipotesi nulla è vera., Includiamo il fattore di rumore nel denominatore perché dobbiamo determinare se il segnale è abbastanza grande da distinguersi da esso.
Rapporto segnale / rumore
Entrambi i valori di segnale e rumore sono nelle unità dei dati. Se il segnale è 6 e il rumore è 2, il valore t è 3. Questo valore t indica che la differenza è 3 volte la dimensione dell’errore standard. Tuttavia, se c’è una differenza della stessa dimensione ma i tuoi dati hanno più variabilità (6), il tuo valore t è solo 1. Il segnale è alla stessa scala del rumore.,
In questo modo, i valori t consentono di vedere quanto sia distinguibile il segnale dal rumore. Segnali relativamente grandi e bassi livelli di rumore producono valori t più grandi. Se il segnale non si distingue dal rumore, è probabile che la differenza osservata tra la stima del campione e il valore di ipotesi nulla sia dovuta a un errore casuale nel campione piuttosto che a una vera differenza a livello di popolazione.
Un t-test accoppiato è solo un t-Test a 1 campione
Molte persone sono confuse su quando usare un t-test accoppiato e come funziona. Ti svelero ‘ un piccolo segreto., Il t-test accoppiato e il t-test 1 campione sono in realtà lo stesso test sotto mentite spoglie! Come abbiamo visto sopra, un t-test a 1 campione confronta una media del campione con un valore di ipotesi nulla. Un t-test accoppiato calcola semplicemente la differenza tra le osservazioni accoppiate (ad esempio, prima e dopo) e quindi esegue un t-test di 1 campione sulle differenze.
Puoi testarlo con questo set di dati per vedere come tutti i risultati sono identici, inclusa la differenza media, il valore t, il valore p e l’intervallo di confidenza della differenza.,
Capire che il t-test accoppiato esegue semplicemente un t-test di 1 campione sulle differenze accoppiate può davvero aiutarti a capire come funziona il t-test accoppiato e quando usarlo. Hai solo bisogno di capire se ha senso calcolare la differenza tra ogni coppia di osservazioni.
Ad esempio, supponiamo che “prima” e “dopo” rappresentino i punteggi dei test e che ci sia stato un intervento tra di loro., Se i punteggi prima e dopo in ogni riga del foglio di lavoro di esempio rappresentano lo stesso argomento, ha senso calcolare la differenza tra i punteggi in questo modo: il t—test accoppiato è appropriato. Tuttavia, se i punteggi in ogni riga sono per soggetti diversi, non ha senso calcolare la differenza. In questo caso, è necessario utilizzare un altro test, come il t-test a 2 campioni, di cui discuto di seguito.
L’utilizzo del t-test associato consente di risparmiare semplicemente il passaggio di dover calcolare le differenze prima di eseguire il t-test., Hai solo bisogno di essere sicuri che le differenze accoppiate abbiano senso!
Quando è opportuno utilizzare un t-test accoppiato, può essere più potente di un t-test a 2 campioni. Per ulteriori informazioni, vai alla Panoramica per t accoppiato.
Come i test T a due campioni calcolano i valori T
Il test t a 2 campioni preleva i dati del campione da due gruppi e li riduce al valore t. Il processo è molto simile al t-test 1-campione e si può ancora utilizzare l’analogia del rapporto segnale-rumore. A differenza del t-test accoppiato, il t-test a 2 campioni richiede gruppi indipendenti per ciascun campione.,
La formula è sotto, e poi qualche discussione.
Per il t-test a 2 campioni, il numeratore è di nuovo il segnale, che è la differenza tra i mezzi dei due campioni. Ad esempio, se la media del gruppo 1 è 10 e la media del gruppo 2 è 4, la differenza è 6.
L’ipotesi nulla predefinita per un t-test a 2 campioni è che i due gruppi siano uguali. Puoi vedere nell’equazione che quando i due gruppi sono uguali, anche la differenza (e l’intero rapporto) è uguale a zero., Man mano che la differenza tra i due gruppi cresce in una direzione positiva o negativa, il segnale diventa più forte.
In un t-test a 2 campioni, il denominatore è ancora il rumore, ma Minitab può utilizzare due valori diversi. Si può presumere che la variabilità in entrambi i gruppi sia uguale o non uguale e Minitab utilizza la stima corrispondente della variabilità. In entrambi i casi, il principio rimane lo stesso: si sta confrontando il segnale al rumore per vedere quanto il segnale si distingue.,
Proprio come con il t-test 1-campione, per ogni data differenza nel numeratore, man mano che si aumenta il valore del rumore nel denominatore, il valore t diventa più piccolo. Per determinare che i gruppi sono diversi, è necessario un valore t grande.
Cosa significano i valori t?
Ogni tipo di t-test utilizza una procedura per far bollire tutti i dati di esempio fino a un valore, il t-value. I calcoli confrontano la media del campione con l’ipotesi nulla e incorporano sia la dimensione del campione che la variabilità nei dati., Un valore t pari a 0 indica che i risultati del campione sono esattamente uguali all’ipotesi nulla. In statistica, chiamiamo la differenza tra la stima del campione e l’ipotesi nulla la dimensione dell’effetto. Man mano che questa differenza aumenta, il valore assoluto del valore t aumenta.
È tutto bello, ma cosa significa davvero un valore t di, diciamo, 2? Dalla discussione sopra, sappiamo che un valore t di 2 indica che la differenza osservata è due volte la dimensione della variabilità nei tuoi dati. Tuttavia, usiamo t-test per valutare ipotesi piuttosto che solo capire il rapporto segnale-rumore., Vogliamo determinare se la dimensione dell’effetto è statisticamente significativa.
Per vedere come si arriva dai valori t alla valutazione delle ipotesi e alla determinazione della significatività statistica, leggi l’altro post di questa serie, Comprendendo i t-Test: t-values e t-distributions.