重回帰分析(Multiple regression analysis)

回帰分析は、あるデータ(説明変数)から目的のもの(目的変数)を推定する回帰式を求めるものである.

Y=β+aX1+bX2+cX3+....
Y:目的変数または従属変数
Xi:説明変数または独立変数


通常の回帰分析(単回帰)は説明変数が一個の場合である.
このように説明変数が複数ある場合には、重回帰分析と呼ばれる.


目的変数:輸血回数
説明変数:性、月齢、出生体重、在胎週数、出生時ヘマトクリット、アプガースコアー

この場合、説明変数が多い方がいいかというとそうではない.目的変数に影響しないような説明変数は加えない方がよい.また、GOTとGPTのような相関の著しいものもどちらかひとつにした方がいい場合がある.
説明変数の選択方法に、目的変数に大きく影響する説明変数を選択して回帰式を求める
変数選択法(Stepwise regression)がある.ステップワイズは、統計ソフトが自動的に行ってくれるものが多い.
一方、いくつかの因子を調整して目的の因子が有意かどうかを知りたい時には、Hierarchical stepwise multiple regression analysesを用いる.


重回帰分析でも、単回帰分析と同様、重相関係数(R)、決定係数(R)が計算され回帰分析のP値が求められる.また、それぞれの説明変数に対する回帰係数が計算されその有意性が検定される.

重回帰分析における
目的変数は正規分布をとる連続変数が原則である.しかし、説明変数はカテゴリー変数であってもよい.例えば性別を説明変数として使用したい場合には女性=0,男性=1というように置き換えればよい.しかし、3つ以上のカテゴリーの場合には注意が必要である.例えば、軽症=0、中等症=1,重症=2のように数字の間にある程度の比例関係があればよいが、A地区=0,B地区=1,C地区=2、D地区=3のような置き換えは0〜3の間に順序関係がないため誤りである.この場合は、ダミー変数を使ったカテゴリー化が必要になる.

重回帰分析は、回帰式を求めることも目的であるが、ある説明変数が有意な影響を与えるかどうかを知ることもできる.上の例題で、アプガースコアーの回帰係数が有意でなかったとすると「アプガースコアーは、輸血回数に有意な影響を与えなかった」ことになる.