多項ロジスティック回帰モデルについて / 多値選択モデル

 多項ロジスティック回帰モデル(multinomial logistic regression)は、3つ以上の選択を説明する多値選択モデルだロジスティック回帰モデルの発展系でもある。モデルの数式が少々わかりにくいが、次の4段階で作っていくとわかりやすくなる。

 「①基準カテゴリの設定」「②確率比率の設定」「③確率の和=1」「④確率比率から確率に変換」という4段階だ。選択肢の数が大文字のJ個、1以外の任意の選択肢の番号をjとすると、次のように多項ロジスティック回帰モデルを作ることができる。

$$① 基準カテゴリをY=1とし、その確率比率P^*_1を1とする$$

$$②Y=jの確率比率P^*_jをP^*_j=e^{(\beta_{j0}+\beta_{j1}X_1+\cdots +\beta_{jk} X_k)}とする$$

$$③P_1+P_2+ \cdots + P_J=1であるのでP_j=\frac{P^*_j}{P^*_1+P^*_2+ \cdots + P^*_J}$$

$$④P_j=\frac{e^{(\beta_{j0}+\beta_{j1} X_1 +\cdots + \beta_{jk} X_k)}}{1+\sum\limits_{h=2}^J e^{(\beta_{h0}+\beta_{h1} X_1 +\cdots + \beta_{hk} X_k)}}$$

 

 確率比率を用いると多項ロジスティック回帰モデルは、ロジスティック回帰モデルの単純な拡張とみなせる。確率比率をもちいた4段階で、ロジスティック回帰モデルは次のように説明できる。多項ロジスティック回帰モデルは、考える確率比率の数を増やしただけだ。

$$① 基準カテゴリをY=0とし、その確率比率P^*_0を1とする$$

$$②Y=1の確率比率P^*_1をP^*_1=e^{(\beta_0+\beta_1X_1+\cdots +\beta_k X_k)}とする$$

$$③P_0+P_1=1であるのでP_1=\frac{P^*_1}{P^*_0+P^*_1}$$

$$④P_1=\frac{e^{(\beta_0+\beta_1X_1+\cdots +\beta_k X_k)}}{1+e^{(\beta_0+\beta_1X_1+\cdots +\beta_k X_k)}}$$