Articles

T検定の理解:1サンプル、2サンプル、および対になったt検定

統計において、t検定は平均を比較できる仮説検定の一種です。 各t検定は、サンプルデータを一つの数、t値に沸騰させるため、これらはt検定と呼ばれます。 T検定がt値をどのように計算するかを理解していれば、これらの検定がどのように機能するかを理解することができます。

この一連の投稿では、t検定がどのように機能するかを示すために方程式ではなく概念に焦点を当てています。 しかし、この記事には、信号対雑音比の類推を使用して作業する二つの簡単な方程式が含まれています。,

Minitab統計ソフトウェアでは、1標本t検定、対t検定、および2標本t検定が提供されています。 これらのt検定のそれぞれが、標本データをt値までどのように減らすかを見てみましょう。

1サンプルt検定がt値を計算する方法

このプロセスを理解することは、t検定がどのように機能するかを理解するために重要です。 私はあなたに最初の式を示し、その後、私はそれがどのように動作するかを説明します。

式は比率であることに注意してください。 一般的な類推は、t値が信号対雑音比であるということです。

シグナル(別名エフェクトサイズ)

分子はシグナルです。, 標本平均を取り、帰無仮説値を引くだけです。 標本平均が10で帰無仮説が6の場合、差または信号は4です。

標本平均とnull値の間に差がない場合、分子内の信号および比全体の値はゼロに等しくなります。 たとえば、標本平均が6でnull値が6の場合、差はゼロになります。

標本平均と帰無仮説平均の差が正または負の方向に増加するにつれて、信号の強度が増加します。,

多くのノイズが信号を圧倒する可能性があります。

ノイズ

分母はノイズです。 分母の方程式は、平均の標準誤差として知られる変動性の尺度です。 この統計量は、標本が母集団の平均をどの程度正確に推定するかを示します。 数値が大きいほど、乱数誤差が多いため、サンプル推定の精度が低くなることを示します。

このランダムエラーは”ノイズ”です。”より多くのノイズがある場合、帰無仮説が真であっても、標本平均と帰無仮説値の間に大きな差が見られることが予想されます。, ノイズ係数を分母に含めるのは、信号がそこから目立つのに十分な大きさであるかどうかを判断する必要があるためです。

信号対ノイズ比

信号とノイズの値はどちらもデータの単位です。 信号が6でノイズが2の場合、t値は3です。 このt値は、差が標準誤差のサイズの3倍であることを示します。 ただし、同じサイズの差があるが、データのばらつきが大きい場合(6)、t値はわずか1になります。 信号はノイズと同じスケールです。,

このようにして、t値を使用すると、信号がノイズとどれだけ区別できるかを確認できます。 比較的大きな信号と低レベルのノイズは、より大きなt値を生成します。 信号がノイズから目立たない場合、標本推定値と帰無仮説値の観測された差は、母集団レベルでの真の差ではなく、標本のランダム誤差によるものである可能性が高くなります。

対になったt検定は単なる1サンプルのt検定です

多くの人々は、対になったt検定をいつ使用するか、そしてそれがどのように機能するかについて混乱しています。 ちょっとした秘密を教えてあげる, 対になったt検定と1サンプルt検定は、実際には変装して同じ検定です! 上で見たように、1サンプルt検定は、あるサンプル平均を帰無仮説値と比較します。 対になったt検定は、単に対になった観測値の差(たとえば、前と後)を計算し、その差に対して1サンプルt検定を実行します。

このデータセットを使用してこれをテストして、差の平均差、t値、p値、信頼区間など、すべての結果がどのように同一であるかを確認できます。,

対になったt検定が単に対になった差に対して1サンプルのt検定を実行することを理解することは、対になったt検定がどのように機能し、いつ使用するかを理解するのに本当に役立ちます。 観測値の各ペア間の差を計算することが理にかなっているかどうかを把握するだけです。

たとえば、”前”と”後”がテストの得点を表し、それらの間に介入があったとしましょう。, 例のワークシートの各行の前と後のスコアが同じ主題を表す場合、この方法でスコア間の差を計算することは理にかなっています—対になったt検定 ただし、各行のスコアが異なる科目の場合、その差を計算するのは意味がありません。 この場合、以下で説明する2サンプルt検定などの別のテストを使用する必要があります。

対になったt検定を使用すると、t検定を実行する前に差を計算する必要があるステップを簡単に節約できます。, あなたはペアの違いが意味をなさないことを確認する必要があります!

対になったt検定を使用することが適切である場合、2サンプルt検定よりも強力である可能性があります。 詳細については、ペアリングされたtの概要を参照してください。

二サンプルT検定がT値を計算する方法

2サンプルt検定は、二つのグループからサンプルデータを取得し、それをt値に集約します。 このプロセスは1サンプルt検定と非常によく似ており、信号対ノイズ比の類推を使用することもできます。 対になったt検定とは異なり、2サンプルt検定は各サンプルに対して独立したグループを必要とします。,

式は以下のとおりであり、その後いくつかの議論があります。

2サンプルt検定の場合、分子は再び信号であり、これは二つのサンプルの平均の差です。 たとえば、グループ1の平均が10で、グループ2の平均が4の場合、差は6になります。

2サンプルt検定のデフォルトの帰無仮説は、二つのグループが等しいということです。 あなたは二つのグループが等しいとき、差(および全体の比率)もゼロに等しいことを方程式で見ることができます。, 二つのグループ間の差が正または負の方向に大きくなるにつれて、信号はより強くなります。

2サンプルt検定では、分母は依然としてノイズですが、Minitabでは二つの異なる値を使用できます。 両方のグループの変動性が等しいか等しくないと仮定することができ、Minitabでは対応する変動性の推定値が使用されます。 信号をノイズと比較して、信号がどれだけ際立っているかを確認しています。,

1サンプルt検定の場合と同様に、分子の任意の差について、分母のノイズ値を大きくすると、t値は小さくなります。 グループが異なることを判断するには、大きなt値が必要です。

t値の意味は何ですか?

t検定の各タイプは、手順を使用して、すべてのサンプルデータを一つの値であるt値に沸騰させます。 計算では、標本平均と帰無仮説が比較され、標本サイズとデータの変動性の両方が組み込まれます。, T値0は、標本の結果が帰無仮説と正確に等しいことを示します。 統計学では、標本推定値と帰無仮説の差を効果サイズと呼びます。 この差が大きくなるにつれて、t値の絶対値が大きくなります。

それはすべて素晴らしいことですが、たとえば2のt値は本当にどういう意味ですか? 上記の議論から、t値が2であることは、観測された差がデータの変動性の倍の大きさであることを示していることがわかっています。 ただし、単に信号対雑音比を計算するのではなく、仮説を評価するためにt検定を使用します。, 効果の大きさが統計的に有意であるかどうかを判断したいと思います。

t値から仮説の評価と統計的有意性の決定に至る方法を確認するには、このシリーズの他の投稿”Understanding t-Tests:t値とt分布”を読んでください。