χ2検定とMcNemar検定(マクネマー検定)

 

 2x2分割表については、比率の差、相対危険度、オッズ比とその95%信頼区間について別項で説明した。ここでは、検定法について説明する。

1)χ2独立性の検定: Chi-square test for independence

2x2分割表の検定に用いられる。

例:出生体重1000g未満の児に予防的にグルコースーインスリン療法(GI療法)を施行した群としなかった群での、高カリウム血症発生数を比較し、GI療法により発生率が異なるかをみる。

高K血症(+)
高K血症(-)
GI療法施行
8
20
GI療法施行せず
23
6


この場合各セルの期待度数がすべて5以上ならχ2検定を行う。
もし、5以下のセルがある場合にはFishreの直接確率計算法を行う。

ちなみに、行と列にどちらを入力するのか?

2つの処置A,Bを行った場合に、例えば疾患C,Dの発生率を検討する場合に2X2分割表は
処置A,Bを左列に置くのが正しい。

   C
 A  8 30 
B 15  20 

ただし、カイ2乗検定やFisher直接確率検定のp値は行と列を入れ替えても同じ値となる。

InStatで行うと

Fisher's Exact Test
The two-sided P value is 0.0764, considered not quite significant.
The row/column association is not statistically significant.

Relative Risk
Relative risk = 0.4912
95% Confidence Interval: 0.2379 to 1.014
(using the approximation of Katz.)


と出る。
relative riskは (8/30)/(15/35)=0.49

では、以下のように行と列を入れ替えると
   A
 8 15 
30 20 

Fisher's Exact Test
The two-sided P value is 0.0764, considered not quite significant.
The row/column association is not statistically significant.

Relative Risk
Relative risk = 0.5797
95% Confidence Interval: 0.3169 to 1.060
(using the approximation of Katz.)

Relative risk=(8/23)/(30/50)=0.57

p値は、同じになるがRelative riskは異なっている。
2x2分割表では、Relative risk (リスク比)は、 D群のAの生じる確率を基にした、C群のAの生じる確率の比となる。よって行と列をどう並べるかを意識する必要がある。




★ 期待度数とは

x1
x2
y1
a
c
y2
b
d


aの期待度数=(a+b)×(a+c)/(a+b+c+d)

Stat Viewでは、期待度数の計算も可能.

χ2検定かFisher検定かについて、Harvey Motulskyは次のようにまとめて
いる。

○Fisher's Exact検定は、常に正確なp値を与えるために最良の選択である。
○χ2検定は計算が簡単であるが、近似的なp値しか与えない。
○コンピューターに計算させる場合 Fisher検定を用いるべきである。
○分割表の数値が6未満の数値が一つでもあればχ2検定は絶対に
 避けるべきである。
○サンプルサイズが大きい場合Yatesの補正は必要ない。


独立性の検定(χ2検定)と2群の比率の差の検定

 両者とも2x2分割表の検定に用いられるが独立性の検定の帰無仮説は「2変数は関連がない」であるのに対し2群の比率の差の検定の帰無仮説は「2群の比率に差はない」である。
 両者の検定結果は全く同じ

 

以下の例のような、A国とB国の乳児の寝るときの体位の比が同じかどうかをみるには、同等性の検定(χ2検定と同じ)をおこなう.

うつ伏せ寝
仰向け寝
一定せず
A国
33%
30%
37%
B国
28%
35%
37%

しかし、2群において、著効、やや有効、不変、悪化など順位をつけた場合にはMann-Whitney 検定 (Wilcoxon rank sum test)を用いる。ちなみに、4群を有効と無効に分類してしまうと、χ2検定となる。

著効
やや有効
不変
悪化
A群
3
5
6
7
B群
4
5
3
2



2)McNemar検定

2群の比率の差の検定でも対応がある場合にはMcMemar検定を用いる。
例1)同じ100人で大統領を支持するかどうかを前期と後期で調査し差があったかどうかを調べる場合。

前期
後期
支持
非支持
支持
20
25
45
非支持
35
20
55
55
45
100

例2) 2人の病理医が同一の標本をみて、その評価に違いがでるかどうかを調べる場合

病理医A
病理医B
正常
異常
正常
a
b
m1
異常
c
d
m2
n1
n2
N
これを、χ2検定する場合の2x2分割表は次のようになるが正しくはない。

病理医
診断結果
正常
異常
m1
m2
N
n1
n2
N
n1+m1
n2+m2
2N

例3)乳幼児突然死症候群(SIDS)の危険因子の研究において、SIDSで死亡した症例とマッチさせた対照を選んで検討したとする。この場合対照は同じ地域で同じ頃出生した同性の児であったとする。例えば普段仰向け寝であったかそうでなかったかで違いがあるかをみる場合、単にχ2検定をするよりもマッチングさせた事を取り入れた検定法の方が望ましい。こういった場合にもMcNemar検定が用いられる。

SIDS
1
1
0
1
0
・・・・
1
対照
0
1
0
0
1
・・・・
0
0:うつ伏せ寝以外、1:うつ伏せ寝

対照
SIDS
うつ伏せ寝
うつ伏せ寝以外
うつ伏せ寝
a
b
m1
うつ伏せ寝以外
c
d
m2
n1
n2
N


SPSSによるMcNemar検定法はこちら