外生性(exogeneity)は回帰モデルで最も重要な仮定だ。外生性とは、誤差項と説明変数が無相関であることを意味する。より正確には、外生性とはk種の説明変数Xで条件付けられた誤差項Uの期待値が0である。
$$モデル Y=\beta_0 +\beta_1 X_1 + \cdots + \beta_k X_k+U$$
$$外生性 E(U|X_1,X_2 \cdots X_k)=0$$
外生性が重要な理由は、データ分析者最後の希望を実現するために必要だからだ。統計モデルの究極的な目標は、目的変数Yの母集団分布の推定だが、それは難しい。なぜなら、確率分布の特定は、1次のモーメントである期待値、(期待値周りの)2次のモーメントである分散、(期待値周りの)3次のモーメントである歪度などの、すべての次数のモーメントを推定することを意味するからだ。それは不可能だ。そこで、データ分析者は、せめて1次のモーメントである期待値の予測はやりましょうと考える。これでも、モデルの外でXが決まれば、モデルの内でYの期待値が決定するので意義深い。
$$母集団モデル Y=f(X ,\beta)+U$$
$$究極的な目標 Y|Xの分布推定 $$
$$現実的な目標 E(Y|X)の推定$$
データ分析者である《私》最後の希望を実現するために、外生性が必要だ。以下の数式からわかる通り、誤差項がモデルの外から決まってくれないと、目的変数Yの条件付き期待値の予測ができない。外生性が成り立たないと、データ分析者である《私》はすべての次数のモーメントどころか、1次のモーメントの推定すらできないポンコツとなってしまう。
$$母集団モデル E(Y|X)$$
$$=E [f(X ,\beta)+U|X]$$
$$=f(X ,\beta) +E[U|X]$$
$$E[U|X]=0なら、期待値の予測ができる$$
$$E[U|X]≠0なら、期待値の予測ができない$$
【追記】
外生性がないと、最小二乗(OLS)推定量は不偏性・一致性を失う。その点で、計量経済学が重視するβの推定でも、外生性がないと大問題となる。この記事では、機械学習が重視する予測の観点で、外生性について論じてみた。
カテゴリー