必要な症例数とは

 研究のプロトコールを作成する上、で症例数の設定は重要である.
 たとえば、デキサメサゾンで慢性肺疾患が減少するかどうかをスタディする場合に必要な症例数を求めたいとする。この場合必要となるのは、以下の3つである。
   有意水準(αエラー)
   統計学的検出力
   有効性

有意水準は、最終的に統計学的検討をする場合に用いる有意水準で、通常0.05が用いられる。統計学的検出力とは、この試験に何パーセントの成功する確率を求めるかということであり、通常80%が用いられる。つまり、10回同様のスタディを行うと、8回有意な差が出ることになる。有効性とは、この例ではコントロール群とデキサメサゾン使用群の慢性肺疾患発生率にあたる。例えばそれぞれ80%、50%の発生率とすると、各群の必要な症例数は39例となる。有効性は今までの経験から推測することになるが、この有効率がかなり確かなものであれば検出力は低くても有意差がでる可能性は高くなる。しかし、有効性については事前にわからない場合もある。その場合には、臨床上意義のある有効率を設定する。80%の発生率が75%になっても臨床上あまり意味はなく、症例数を増やして有意差が得られてもその治療法が有効なものかどうか疑問である。必要な症例数をあらかじめ求めることは、非常に重要で、期間を決めてあるスタディを行って有意差が出なくても、それが本当に有意差がなかった場合と症例数が少ないために本来有意なものが有意でないとでてしまった可能性があるからである。有意差なしで、帰無仮説を採択するにはあらかじめ検出力を考慮したサンプル数のデータを得た上で結論を出すことが必要である。
 サンプル数の計算に関してはいろいろな式があるが、二標本 t 検定とχ2検定におけるサンプル数および検出力の計算がファイルメーカープロで簡単に計算できるファイルを作成したので、必要な方はダウンロードして利用されたい。また、Cox回帰分析や、ロジスティック回帰分析での必要サンプル数の計算方法もあるが、実際に利用することは少ないように思う。一番よく使われるのが、上記の例のようなχ2検定におけるサンプル数計算ではなかろうか。


症例数と検出力と有意差:仮定した差が、ほぼ確実に出るのであれば、検出力は50%あれば有意差が出るのである.もし、検出力80%で予想した通りの差がでれば、p値は0.01未満とかなりの有意差となる.また、小さな差でも、症例数さえ増やせば検出力は上がるし、有意差も出るようになる.逆に、臨床的に十分有効と思われる差がありながら、有意差が出ないのは症例数が少ない、つまり検出力が小さいためということになる.症例数を考慮せず、P値のみで判定すると過ちをおかす可能性がある.この点からも、P値でなく2群の差の点推定と区間推定が重要になる.2群の差が臨床的に十分と思えるのに有意差が出ないのは、症例数が少ないことに起因している可能性が大で、はじめに症例数を設定しなかったための過ちといえる.
症例数の設定法:先にも述べたが、2群の差をどの程度にとるかによって症例数は変化する.大きくとれば症例数は少なくてすむし、少なくとれば症例数も多くなる.効果をある程度推測できればよいが、できなければいろいろ仮定してみて、このスタディが可能かどうかを検討してみる.実際に症例数を設定してみるとかなりの数が必要なことが多い.スタディの内容にもよるが、単一施設ではなかなか症例数を集めるのが困難な場合も多く、どうしても多施設共同研究が必要になることが多いように思われる.





脱落率の補正公式


w=脱落率、n=脱落のないときの症例数
n'=n / (1-w) 例:w=10%=0.1のときは n'=n / 0.9 =1.11n

第一種と第二種の誤り、検出力

 第一種の誤りとは、実際には差がないのに、差があると結論してしまうエラーの確率のこと。
この確率をα(有意水準)で表す。

 第二種の誤りとは、実際には差があるのに、差がないと結論してしまうエラーの確率のこと。
この確率をβで表す。仮説が偽であり、仮説を棄却して差ありと正しく判定される確率は(1−β)でこの確率を検出力という。

一般にαを大きくすればβは大きくなる。通常はαのみを問題にしており、有意水準0.05が採用される。


カイ2乗検定におけるサンプル数簡易表
50%を下回る場合は100%から引けばよい。たとえば
PA=40%,PB=20%であればPA=80%,PB=60%の行を
参照にする。

PA       PB   症例数/各群

90%      80%      199
       70%        62
       60%        32
80%      70%      294
       60%        82
       50%        39
70%      60%      356
       50%       93
       40%        42
60%      50%      388
       40%       97
       30%       42
50%      40%      388
       30%       93
       20%       39



(折笠 英樹著 医学研究における統計入門より)