多項ロジスティック回帰モデル(multinomial logistic regression)は、3つ以上の選択を説明する多値選択モデルだ。ロジスティック回帰モデルの発展系でもある。モデルの数式が少々わかりにくいが、次の4段階で作っていくとわかりやすくなる。
「①基準カテゴリの設定」「②確率比率の設定」「③確率の和=1」「④確率比率から確率に変換」という4段階だ。選択肢の数が大文字のJ個、1以外の任意の選択肢の番号をjとすると、次のように多項ロジスティック回帰モデルを作ることができる。
$$① 基準カテゴリをY=1とし、その確率比率P^*_1を1とする$$
$$②Y=jの確率比率P^*_jをP^*_j=e^{(\beta_{j0}+\beta_{j1}X_1+\cdots +\beta_{jk} X_k)}とする$$
$$③P_1+P_2+ \cdots + P_J=1であるのでP_j=\frac{P^*_j}{P^*_1+P^*_2+ \cdots + P^*_J}$$
$$④P_j=\frac{e^{(\beta_{j0}+\beta_{j1} X_1 +\cdots + \beta_{jk} X_k)}}{1+\sum\limits_{h=2}^J e^{(\beta_{h0}+\beta_{h1} X_1 +\cdots + \beta_{hk} X_k)}}$$
確率比率を用いると、多項ロジスティック回帰モデルは、ロジスティック回帰モデルの単純な拡張とみなせる。確率比率をもちいた4段階で、ロジスティック回帰モデルは次のように説明できる。多項ロジスティック回帰モデルは、考える確率比率の数を増やしただけだ。
$$① 基準カテゴリをY=0とし、その確率比率P^*_0を1とする$$
$$②Y=1の確率比率P^*_1をP^*_1=e^{(\beta_0+\beta_1X_1+\cdots +\beta_k X_k)}とする$$
$$③P_0+P_1=1であるのでP_1=\frac{P^*_1}{P^*_0+P^*_1}$$
$$④P_1=\frac{e^{(\beta_0+\beta_1X_1+\cdots +\beta_k X_k)}}{1+e^{(\beta_0+\beta_1X_1+\cdots +\beta_k X_k)}}$$