t 検 定


ある母集団の中の2群の平均値の差を検定するのがt検定である。
正規分布していることが条件で、関連があるかどうかでに独立2標本t検定と一標本t検定にわかれる。
また、独立2標本検定では2標本が等分散でない場合におこなうWelch法がある。

ちなみにχ二乗検定は2群の割合の比較の時に使用され、t検定は2群の平均の比較に使用される。

     


正規分布と等分散の説明はこちら

1)独立2群と関連2群の差の検定の違い

   


独立2群:例えばA群とB群の収縮期血圧に差があるかを検定する場合で、A群とB群はすべて別人である。
この場合の検定法には2標本t検定、Welch法、Mann-Whiteney検定のいずれかを用いる。
正規分布していない場合などはノンパラメトリック法のMann-Whiteney検定を選択。
正規分布かつ等分散の場合は2標本t検定。
正規分布かつ不等分散の場合はWelch法。 
等分散かどうかはF検定を行うが、正規分布している場合に分散に関係なくWelch法を用いるべきとの考えもある。
逆に、分散の検定は必要なくt検定を行えばよいとの記載もみられる。
等分散か調べて、選択するのがオーソドックスか?


関連2群:例えば10人の児でドーパミン投与前後の血圧の差を検定するような場合。
この中に一標本t検定(パラメトリック法)、Wilcoxon符号付き順位和検定(ノンパラメトリック法)がある。
この検定法は、同じ個体で比較するため時間的前後関係を考慮する必要がある。ある処置を行う前後を比較する場合が想定されるが、処置後のどの時点を比較するかに注意を払わなければならない。例えば昇圧剤の使用前後を比較する場合、1時間後、2時間後、、、、1日後、2日後など、どの時点を比較するかを決める必要がある。また、なぜその時点を選択したのかも説明できなければならない。24時間後に有意差がなかったとしても、3時間後はどうだった? 12時間後は?と疑問が出る。経時的にデータが得られるものであれば、詳細な経時的比較を行って発表すればより理解されやすい。何の説明もなく、開始前とある一点を比較したデータを発表されても、聞いている方には他の時点がどうであったのか?なぜその時点と比較したのかが伝わってこない。


2)誤った使い方
1)同一人で日齢1と日齢2の血圧を比較する場合に、一標本t検定を用いれば問題はないが、日齢1と2のサンプルの中に同一人のものと、そうでないものが混在しておりそれを二標本t検定で処理するのは正しくない。
2)A群とB群間のヘモグロビン差を比較するような場合に、同一群に同一人のサンプルが複数含まれているような場合に二標本t検定を行うのも誤り。
3)A群、B群、C群の血圧を比較する場合に、基本的にすべての組み合わせに2標本t検定を行ってはならない。3群以上の比較は、一元配置分散分析を行う。

パラメトリックとノンパラメトリックの使い分け

両者の使い分けは厳密にいうと結構面倒である。こちらを参照。
明らかな誤りは、順序尺度(軽症、中等症、重症など)を点数化したものをパラメトリック検定を適応することである。例えば、アプガースコアも順序尺度であり、多くの場合正規分布もしていない。これは本来ノンパラメトリック法を用いるべきである。
ノンパラメトリック法では、計測値を順番に変えてしまうので情報量は減少してしまうため、可能であればパラメトリック法を選択する。

welch法か2標本t検定か
 1)等分散の検定(F検定)を行い、等分散であればt検定、不等分散であればWelch法。
 2)サンプル数がほぼ等しければ、2標本t検定を用いても問題にはならない(サンプル数の比が1.5以下という者もいる)とも言われている。
 3)上述したように、正規分布していれば分散を確かめずにWelchのt検定を行う。

 

 <Instatを用いた2群間の検定>

 Instatは、難しい検定はできないが基本的な検定についてはとても使いやすいソフトと思われる。

以下にUnpaired t testの例を挙げてみる。

 

1)まず、比較した項目を選択する。

 平均の比較、回帰分析か相関分析か、分割表かを選択する。

 平均の比較の場合、右表にあるような検定法が可能である。

 データ入力は、生データでも平均、SD(またはSE)、サンプル数でもよい。

2)例として、男女別の数値比較をしてみる。もちろん対応はない。

3)データのまとめを見る。

 平均、SD,SEM、95%信頼区間、正規性の検定と結果が表示される。

 両群とも正規性の検定をパスしているので、t検定を行う。

 なお、このソフトではサンプル数が5個以上ないとKS(Kolmogorov and Smirnov)法が施行できない。

4) unpaired test で、等分散と仮定し、一標本t検定を選択する。

5)結果表示

  P値は0.0079で非常に有意。

  次に平均の差の95%信頼区間表示

  そして、等分散かどうかのテストでふたつのSDの差は有意でないので等分散とみなす。

  最後に正規性の検定結果で、両群とも正規性のテストをパスしている。