内生性(endogeneity)への対処は、計量経済学者の主要な研究対象であり続けた。内生性とは、誤差項と説明変数が相関することを意味する。より正確には、外生性とはk種の説明変数Xで条件付けられた誤差項Uの期待値が0でないことである。
$$モデル Y=\beta_0 +\beta_1 X_1 + \cdots + \beta_k X_k+U$$
$$内生性 E(U|X_1,X_2 \cdots X_k)≠0$$
内生性への対処が研究課題となった理由は、回帰分析を因果関係の解明に用いる際、内生性が最大の障壁となるからだ。データ分析者が作った重回帰モデルには、説明変数X1が1増えると、目的変数Yがβ1増えるという因果関係が組み込まれている。ならば、β1をバイアスなしに推定しなければならない(不偏性)。サンプル・サイズを増やせば、β1に近い推定値が得られなければならない(一致性)。しかし、内生性があると、最小二乗推定量は不偏性も一致性も失うことが知られている。さらに、内生性は観測不能な誤差項に関する現象であるため、内生性があるのかないのかすらもデータからは判断できない。ゆえに、内生性は回帰分析を用いた因果推論にとって非常に大きな問題になる。
一見プラスの努力をしているようで周りめぐってマイナスになる可能性を、《私》は排除したい。内生性とは、その可能性が排除できてない場合である。つまり、データ分析結果では、β1がプラスなので、原因X1は結果Yにプラスな影響を与えているように見える。しかし、内生性が疑われるならば、原因X1が知らず知らずのうちに、誤差項Uにマイナスの影響を与えているかもしれない。このとき、最終的に、原因X1が結果Yに与える影響は、マイナスとなりえる。こんなようでは、適切なデータ分析が行われているとは言えない。
【追記】
内生性の問題を解決する手法として、最も有名なのが操作変数法だ。また、モデリングではなく、標本抽出の段階から内生性を解決しようとするのが、ランダム化比較試験(RCT)である。
カテゴリー