分散分析(analysis of variance: ANOVA)

 

ANOVAとは
 ANOVAとは、多群の比較に使用する検定法である。例えばA,B,Cの3群について比較するのに、AB間、AC間、BC間をそれぞれ二標本 t 検定するのでなく、3群まとめて検定する。

 なぜ、多群において全ての組み合わせで t 検定をしてはいけないか。例えば3群の比較では、3通りの組み合わせがあるが、それぞれに危険率5%で二標本 t 検定を行った場合、「少なくとも一つたまたま有意差あり」となる確率は1-(1-0.05)*(1-0.05)*(1-0.05)で計算され、危険率は14%となってしまう。5%の危険率のつもりが、実際には危険率が上昇してしまう。
この対処法のひとつは、多重比較法を用いることである。たとえば、Bonferroni法は有意差水準を0.05/3=0.017にして検定する。Bonferroni法は多重比較法のひとつであるが、その他にもいくつかの多重比較法がある。多重比較の項参照。もうひとつは、まず3群間に有意差があるかどうか検定(ANOVA)し、もし差があった場合にはどの群間に差があるかを多重比較する.

「分散分析の帰無仮説は”各群の平均値は全て等しい”」であるが、医学統計ではどの群とどの群の間に有意差があるかを知りたい場合が多い。その場合には、分散分析を用いず直接群間の比較を行う多重比較法を用いた方がいいように思われる。たとえば、コントロール群とA薬、B薬、C薬投与群を比較する場合である。

ANOVAは、便利な検定法に思われるが使用上は注意が必要で、例えばコントロールとA薬の2郡間に2標本t検定で有意差があるのに、B薬、C薬も加えてANOVAをすると有意差が出なくなる可能性がある。 統計の多重性には配慮が必要であるが、比較するものは少ない方がよいこともある。

 


ANOVAの検定法
 分散分析の検定法は、群間変動と郡内変動の比を検定することになる。たとえばA群、B群、C群についてANOVAを使用するとすると、各群間の分散値(総平均と各群の平均より求める)と群内変動の分散値(それぞれの群間の平均値と測定値から求める)を求め、その比で検定する。

例)A,B,C3群間に有意差があるかどうかを一元配置分散分析(One-factre ANOVA)で検定する。
A
B
C
15
20
30
20
25
35
20
24
30
8
18
33
20
18
20



通常、ANOVAを施行すると分散分析表が表示される。例えばStat Viewでは下記のような
表が作成される。

変動要因

   平方和   自由度   分散   分散比   p値

群間変動

    437.2      2    218.6   9.1    0.0039

郡内変動

    288.4     12    24.0



P値0.004で有意差があるが、どの群とどの群に有意差があるかは多重比較(ポストホックテスト)を行う。
これは、一元配置分散分析の分散分析表で、二元配置分散分析表は異なったものになる。


群間の比較はpost hocテストを行う。例えばFisherのPLSDでは下記のようになり、AC間とBC間に有意差があることがわかる。




多群の比較に用いられる検定法にはどのようなものがあるか
(なお、ノンパラメトリック法のKruskal-Wallis 検定、Friedman 検定は分散分析ではない)

1)一元配置分散分析(対応なし)One-way Factorial ANOVA
2)一元配置分散分析(対応あり)One-Way Repeated-Measures ANOVA
3)Kruskal-Wallis 検定
4)Friedman 検定
5)二元配置分散分析(対応のない因子と対応のない因子)Two-way Factorial ANOVA
6)二元配置分散分析(対応のある因子と対応のない因子)Two-way Repeated-Measures ANOVA
7)二元配置分散分析(対応のある因子と対応のある因子)
8)繰り返しのない二元配置分散分析
9)共分散分析
10)多変量分散分析

こんなに複雑ではなかなか理解するのは難しい。実際には、スタディする前にどういう検定が必要か決めておき、データを入力する段階でその検定にあったデータ入力をするようにしなければならない。入力法をまちがえると、後から全部入力しなおさなければならなくなることはよくある。

よく使う分散分析について簡単に解説しておく(以下の例は,架空のデータで,症例数はかなり少なくしてある)
1)One-way Factorial ANOVAとKruskal-Wallis 検定
 例えば、3つの地域で出生した児の臍帯血のヘモグロビン値に差があるかどうかを検定したい場合には、対応のない一元配置分散分析を施行する。対応なしとは、A地域、B地域、C地域の間に対応がないということである。
ノンパラメトリック法ではKruskal-Wallis検定を行う。
A地域
B地域
C地域
15.6
16.4
16.2
14.6
15.4
16.1
16.9
17.0
15.2
13.9
17.6
14.8
16.3
15.4
12.3

この検定で、もし有意差があった場合にどの群間に有意差があるかどうかは多重比較(post-hoc test)を行う。
最初から多重比較を行う場合には、Bonferroni法かTukey法を用いる。ノンパラメトリック法はBonferroni法かSteel-Dwass法を用いる。


2)One-Way Repeated-Measures ANOVAとFriedman 検定
エリスロポエチンを投与した場合にヘモグロビンに変化があるかを検定したい場合、対応のある一元配置分散分析を施行する。
ノンパラメトリック法ではFriedman検定
対応があるとは、つまり前値と1週目、2週目の値が同一人物で繰り返し測定されているということである。対応のない一元配置分散分析より有意差がでやすくなる。
1週目
2週目
A
8.5
9.5
10.0
B
7.0
7.8
9.0
C
6.8
7.5
8.0
D
6.8
6.9
7.5
E
7.0
7.8
8.5

注)3群を3つの組み合わせで一標本 t 検定するのは問題視される(Bonferroni法で補正すればよい)。
  また、同一人の測定値が1週目や2週目に複数入っていたりするデータをone-way Factorial ANOVAで検定するのも誤り。この場合の多重比較はすべての組み合わせによる多重比較をやってもあまり意味がない。

時系列データの取り扱いは難しい。どの時点の測定値を含めるかによって結果も変わってくることがある。ある時点までは上昇するが、それ以降は横ばいになる場合、はやりすべての時点のデータを含めた検定をすると有意差が出なくなってしまうリスクがある。 まずは、すべてのデータをグラフにプロットして、全体の流れを把握することが重要と思われる。時系列データは、グラフ上で一定の傾向(上昇 or 下降)を示すのであればそれだけで説得力があり、逆に全体のデータを統計処理するとかえって本質を見逃す可能性もある。

こういった、時系列データについては、実際にはコントロールと各時点をt検定で比較している場合が多いようである。いつから有意差が出てくるかという傾向がわかればいいということであろうか。


  ところで、このOne-Way Repeated-Measures ANOVAは、教科書によれば繰り返しのない2元配置分散分析に分類されていることがある(例えば、「バイオサイエンスの統計学」。このふたつの統計法は同じあるから、どちらで検定してもよい。)

 

 

3)Two-way Repeated-Measures ANOVA
上の例で、コントロールをたててスタディするとより正確な結果が得られる。つまり対応のある因子と対応のない因子の二元配置分散分析である。

この検定では、投与群と非投与群でヘモグロビンに有意差があるとでても、エリスロポエチン投与がヘモグロビンの変化に影響を与えたとはいえない。両者は最初から平行関係にあったかもしれないからである。この場合には、エリスロポエチン投与によりヘモグロビン値の変化のパターンが異なることを示さなければならない。つまりエリスロポエチン投与とヘモグロビン値の変化の間に交互作用があるかどうかが問題になる。
 このパターンのデータにANOVAを使用するかというと、実際にはあまり使われない。各時点でt検定を行い、どの時点からどの時点まで有意差が出現するかわかった方が理解しやすいためだと思われる。多重性の問題が起こるが、むしろどういう傾向があるかを知ることの方が有用な情報になるからと思われる。

 

なお、この例で投与群と非投与群の対象を同一人で行うと対応のある因子と対応のある因子の二元配置分散分析となる。つまり下表のような場合である。
エリスロポエチン
1週目
2週目
投与
A
8.5
9.5
10.0
投与
B
7.0
7.8
9.0
投与
C
6.8
7.5
8.0
投与
D
6.8
6.9
7.5
投与
E
7.0
7.8
8.5
非投与
A
7.0
7.2
7.1
非投与
B
7.5
7.4
7.9
非投与
C
6.8
6.9
7.0
非投与
D
7.5
7.2
7.3
非投与
E
7.2
7.6
7.2


対応ありとは、反復測定(repeated mesure)のような因子をいう。
反復測定とは、同じ人で時間をずらして何回か測定すること。

繰り返しなしとは、例えば異なる4人に対して一回ずつ測定する場合。例えば、3)の例は繰り返しなしである。
繰り返しありとは、例えば異なる4人に対して2回以上測定する場合。


Kruskal-Wallis検定は一元配置分散分析(対応なし)のノンパラメトリック版。
Friedman 検定は、一元配置分散分析(対応あり)とのノンパラメトリック版と考えてよい(nonparametric Two-Way ANOVAとして使われることもある)。

パラメトリックとノンパラメトリックで分類すると

ノンパラメトリックテストには
1)独立2群の比較      Mann-Whitney U-test
2)独立3群以上の比較    Kruskal-Wallis test
3)対応のある2群の比較   Wilcoxon signed rank test
4)対応のある3群以上の比較 Friedman test

パラメトリックテストには
1)母集団の平均値との比較      One Sample t-test
2)対応のない2群の比較       Unpaired t-test
3)対応のある2群の比較       Paired t-test
4)一元配置分散分析(対応なし)   One-way Factorial ANOVA
5)一元配置分散分析(対応あり)   One-Way Repeated-Measures ANOVA
6)二元配置分散分析(対応のない因子と対応のない因子)Two-way Factorial ANOVA
7)二元配置分散分析(対応のある因子と対応のない因子)Two-way Repeated-Measures ANOVA