要約
操作変数推定量は、不偏性は持ちませんが、一致性を持ちます。
つまり、小標本ではバイアスがありますが、サンプル・サイズが大きければバイアスは小さくなっていきます。
全体像
(1)問題の構造
問いを「操作変数推定量に不偏性や一致性はあるのか?」に設定します。この問いは
①不偏性とは何か?
②一致性とは何か?
③操作変数モデルとは何か?
④操作変数推定量とは何か?
⑤証明に使う一般的な事実は何か?
⑥操作変数推定量の推定誤差は何か?
⑦操作変数推定量に不偏性はあるのか?
⑧操作変数推定量に一致性はあるのか?
と分解できます。
(2)前提の選択
①〜⑤を前提として選択します。
(3)論点の選択
⑥〜⑧を論点として選択します。
前提
不偏性と一致性
不偏性とは、バイアスがゼロのことです。バイアスとは、推定誤差の期待値です。
$$バイアス=E \big( \widehat{\theta} -\theta \big)=0$$
一致性とは、サンプル・サイズnが無限大のとき、推定量θ^がパラメーターθに確率収束することです。
$$n→∞のとき \widehat{\theta_n}→\theta_n$$
正確には、一致性とは↓です。
$$任意の\epsilon >0に対して、n→∞のとき$$
$$P(|\widehat{\theta}_n -\theta|>\epsilon )=0$$
操作変数モデル
操作変数モデルとは、内生性のある重回帰モデルで、操作変数のあるモデルです。例えば、次のモデルが操作変数モデルです。
$$Y=\beta_0+\beta_{1}X_{1}+U$$
$$内生性:E(U|X_1)≠0$$
$$X_1に対する操作変数Zが存在する$$
ただし、X1に対する操作変数Zは
$$外生性:誤差項Uと無相関 Cov(Z,U)=0$$
$$関連性:説明変数X_1と相関 Cov(Z,X_1)≠0$$
となります。操作変数モデルは、次の図で表せます。

β1は、X1がYに与える限界効果です。
$$\beta_1=\frac{Cov(Z,Y)}{ Cov(Z,X_1)}$$
$$ただしCov(A,B)とはAとBの母共分散$$
モデルについての詳細は「操作変数モデルとは」をご覧ください。
操作変数推定量
操作変数推定量とは
$$\widehat{\beta_{1,IV}}=\frac{cov(Z,Y)}{ cov(Z,X_1)}$$
$$ただしcov(A,B)とはAとBの標本共分散$$
です。操作変数をIV(Instrumental Variable)で表現しています。
事前知識
標本共分散は、次のように書けることが知られています。
$$cov(X_i,Y_i)= \frac{ 1} {n }\sum\limits_{i=1}^n(X_i-\overline{X})(Y_i-\overline{Y}) $$
$$= \frac{ 1} {n }\sum\limits_{i=1}^n(X_i-\overline{X})Y_i $$
また、標本共分散は一致性を持つことが知られています。
$$n→∞のとき 標本共分散cov(X_i,Y_i)→母共分散Cov(X_i,Y_i)$$
繰り返し期待値の法則が成り立つことが知られています。詳しくは「繰り返し期待値の法則」をご覧ください。
$$E(X)=E(E(X|Z))$$
結果
(1)推定誤差
操作変数推定量は次です。
$$\widehat{\beta_{1,IV}}=\frac{cov(Z,Y)}{ cov(Z,X_1)}$$
共分散の略式を使い、1/nを約分すると
$$=\frac{\sum\limits_{i=1}^n(Z_i-\overline{Z})Y_i } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i} }$$
Y=β0+β1X+Uを思い出して
$$=\frac{\sum\limits_{i=1}^n(Z_i-\overline{Z})(\beta_0+\beta_1 X_{1i}+U_i) } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i} }$$
Σを分割して
$$=\beta_0 \frac{\sum\limits_{i=1}^n(Z_i-\overline{Z}) } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i} }+\beta_1 \frac{\sum\limits_{i=1}^n(Z_i-\overline{Z}) X_{1i} } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i} }+\frac{\sum\limits_{i=1}^n(Z_i-\overline{Z})U_i } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i} }$$
合計と平均は等しいので引くと0、2項目は一気に約分できるので、
$$\widehat{\beta_{1,IV}}=0+\beta_1+\frac{\sum\limits_{i=1}^n(Z_i-\overline{Z})U_i } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i}}$$
よって、推定誤差は
$$\widehat{\beta_{1,IV}}-\beta_1=\frac{\sum\limits_{i=1}^n(Z_i-\overline{Z})U_i } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i}}$$
(2)不偏性はない
以上を踏まえて、操作変数推定量のバイアスを求めます。バイアスがゼロなら、不偏性があります。
$$バイアス=E \big( \widehat{\beta_{1,IV}} -\beta_1 \big)$$
本稿「(1)推定誤差」の結果より
$$=E \left(\frac{\sum\limits_{i=1}^n(Z_i-\overline{Z})U_i } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i}} \right)$$
繰り返し期待値の法則より
$$=E \left( E \bigg( \frac{\sum\limits_{i=1}^n(Z_i-\overline{Z})U_i } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i}} \bigg| Z_i,X_{1i} \bigg) \right) $$
ZとXの条件下では、ZとXは定数とみなせるので
$$=E \left( \frac{\sum\limits_{i=1}^n(Z_i-\overline{Z}) E(U_i | Z_i,X_{1i})} {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i}} \right) ・・・①$$
内生性のために、誤差項Uと説明変数X1の共分散はゼロではなく、両者は相関するので
$$E(U_i | Z_i,X_{1i})≠0$$
です。さらに、操作変数Zは分散を持つことを踏まえると、①式は0になりません。したがって、
$$バイアス=E \left(\widehat{\beta_{1,IV}} -\beta_1 \right)≠0$$
となります。操作変数推定量は不偏性を持ちません。
(3)一致性をもつ
サンプル・サイズnが無限大になったとき、推定誤差はどうなるでしょうか?
推定誤差は
$$\widehat{\beta_{1,IV}}-\beta_1=\frac{\sum\limits_{i=1}^n(Z_i-\overline{Z})U_i } {\sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i}}$$
ですから
$$=\frac{ \frac{1}{n}\sum\limits_{i=1}^n(Z_i-\overline{Z})U_i } {\frac{1}{n} \sum\limits_{i=1}^n(Z_i-\overline{Z})X_{1i}}$$
となり、分母・分子は標本共分散になります。
$$=\frac{cov(Z_i,U_i)}{cov(Z_i,X_i)}$$
さら、サンプル・サイズnが無限大になったとき、標本共分散はそれぞれ母共分散に確率収束します。ZとUの共分散はゼロ、ZとXの共分散はゼロでないことを思い出すと
$$n→∞のとき推定誤差 → \frac{Cov(Z_i,U_i)}{Cov(Z_i,X_i)} →0$$
と導けます。したがって、操作変数推定量は一致性を持ちます。
考察
(1)結論
操作変数推定量は、不偏性は持ちませんが、一致性を持ちます。
(2)妥当性評価
前提評価
不偏性、一致性、操作変数モデル、前提知識などを丁寧に拾っており、Goodです。
条件つき期待値についての記述が足りなかった点が、Badです。
結論評価
教科書通りの結果になってGoodです。
内生変数1、外生変数0、操作変数1の最も基本的な操作変数モデルについてしか記述できていない点がBadです。
(3)意義
因果推論で知名度の高い操作変数推定量の代表的な性質について議論できてよかったです。
カテゴリー