はじめに



 統計といってもχ2検定や、t 検定程度までなら誰でもそれなりに理解できますが、そこから先は結構難しい分野です。t 検定しか知らない人はやたらt 検定を行いますが、パラメトリック検定とノンパラメトリック検定、対応のある検定とない検定、分散分析などを理解すると自分の統計に多くの誤りがあることに気付くことが多いと思います。さらに、ロジスティック回帰分析、生存分析、ANCOVA、重回帰分析などを理解することによりデータ解析の質がより深まります。
 最近の外国の論文ではロジスティック回帰分析が当たり前のように登場します。また、生存分析の分野ではコックス回帰分析の知識が不可欠と思われます。これらの統計手法が使えないまでも、それらが理解できないと文献内容を理解するのは難しいです。
 医学統計の教科書は数多く発行されており、それらを読めばなんとかなるかもしれません。事実私も数多くの教科書や統計ソフトの解説本を購入してみました。しかし、統計の専門家が書いた本は初心者にはとても理解できないものもよくあります。統計を理解するのに電卓で計算してみたり、細かな数式まで理解する必要はないでしょう。必要なのは、手元にあるデータを分析するのにもっとも適した統計手法は何か、その統計手法の利用できる条件を満たしているかどうかではないでしょうか。
 ただし、統計のより基本的なことを理解することは、単に統計手法をいくつか知ることよりも重要です。特に、母集団とサンプルの関係、p値の意味すること、統計の多重性、95%信頼区間の理解、サンプル数の影響などは是非理解しておきたいと思います。また、近年ロジスティック回帰分析も数多く文献にみられるようになりましたが、複雑な統計手法はちょっと手を加えるだけで結果が大きくことなってくることもあります。単変量解析で有意でなかったが多変量解析をしたら有意になることはよくありますが、臨床的に手応えがないようなことを統計で有意差を作り出して説明を加えるようなことは避けたいものです。

 少し前に、このホームページをいったん閉鎖しましたが、もう一度公開してほしいとの依頼があり再公開することにしましたが、ここ数年疑問に思っていたことなどを書き足したり、手直ししたりしていく予定です。

 

平成27年7月28日

 

 茨城県立こども病院 新井 順一