統計の多重性に注意

経時的データ解析とサブグループ解析

 

 統計解析を行うにあたって最も注意しなければならないもののひとつが、多重性の問題です。これは様々な場面で問題となりますが、私がよく気になるのは経時的データの扱いとサブグループ解析です。

 

 経時的データで問題となるケースとしては、ある薬剤を開始後のコントロールとの比較において、何日目とか何週目に有意差が認められたというデータが発表されますと、聞いている方はそれをそのまま受け止めてしまうことがあります。

 例えば、ステロイドの吸入開始後7日目に呼吸機能に有意な改善が認められたという発表を聞くと、効果があるのだと思ってしまいます。ところが、後方視的研究においては最初に7日目に効果があるかどうかを決めていたかどうかが問題です。よく行われるのは、経時的データをいろいろな時点で比較し、有意差が出たところだけ発表するやり方です。これは、発表する時にそのことも表していれば、多くの時点では有意差はないが一部に有意差があるのだ。これは偶然の可能性が高いが、もしかしたらその時期に効果が出やすいのかもしれないから、今度は前方視的に検討してみるといいと判断できますが、ある時点で有意であったから効果があるという発表のされかたをすると間違った解釈をしてしまいます。疑問に思ったらすぐに質問して確かめましょう。

 

 もうひとつよく行われる統計手法として、サブグループ解析があります。プライマリーエンドポイントには有意差がなかったが、サブグループ解析をしたら男性のみでは有意差があったとか、出生体重1000g未満では有意差があったとかいうものですが、これも統計の多重性に触れてしまいます。こういった解析は、その可能性があるから、更に検討してみる価値がある程度のものと考えた方がよいと思います。多くの場合発表者は、有意差を見つけて発表にこぎ着けたり、自分の治療の正当性を証明したくて都合のいいようにデータをいじくる傾向があります。

 

 サブグループ解析は数が増えるほど偶然の可能性が高くなる。それは、1)差がないのにあるとしてしまう可能性と、2)差があるのにないとしてしまう可能性の両方があるということを知った上で文献を読むと間違った解釈の仕方を信じてしまう可能性が減少します。