固定効果推定量について / パネルデータ分析

　固定効果推定量(FE：fixed effects estimator)は、固定効果モデルの回帰係数を推定する方法である。時間を通じて不変の固定効果（＝β0とα）そのものは推定できない。それでも、パネル・データの分析において、固定効果推定量はよく使われる。なぜなら、αとXが相関している場合、最小二乗法で推定すると内生性バイアスが発生するが、固定効果推定量はこのバイアスを回避できるからである。

$$固定効果モデル　Y_i=\beta_{0}+ \alpha_i+\beta_1 X_{1it} +\cdots + \beta_kX_{kit}+U_{it}$$

$$i：データ番号、t：時間、k：説明変数の数$$

　固定効果推定量では、まず、個体（i）ごとに時間平均をとり、変数から時間平均を引く（固定効果変換）。次に、定数項なしの最小二乗法を適用する。ここから得られた推定量が固定効果推定量だ。

$$X_{1it} の時間平均を \overline{X_{1i}} とすると$$

$$固定効果モデル　Y_{it}=\beta_{0}+ \alpha_i+\beta_1 X_{1it} +\cdots + \beta_kX_{kit}+U_{it}$$

$$固定効果変換後　(Y_i-\overline{Y_{i}})=\beta_1 (X_{1it}-\overline{X_{1i}}) +\cdots + \beta_k (X_{kit}-\overline{X_{ki}})+(U_{it}-\overline{U_{i}})$$

　パネルデータがあるなら、固定効果推定量が便利だ。固定効果モデルの詳細は「固定効果モデルについて」をご覧頂きたい。

問1：R言語で固定効果法を実践する
問２：推定量
補足

問1：R言語で固定効果法を実践する

問1：R言語で固定効果法を実践する際のRコードを書け。

（解答）

　固定効果法は、パッケージplmで計算できる。まずデータをパネルデータとして認識させ、次に固定効果推定量を求める。下のRコードでの推定モデルは以下の通り。

$$固定効果モデル　Y_i=\beta_{0}+ \alpha_i+\beta_1 X_{1it} + \beta_2 X_{2it}+U_{it}$$

#（必要な人のみ）パッケージのインストール
install.packages("plm")

#パッケージの呼び出し
library(plm)

#パネルデータへの変換
Data1 #元のデータ
Data2 <- pdata.frame(Data1, index = c("個体番号i","時間変数t")) 

#固定効果推定
plm(formula = Y ~X1 + X2,model="within",data=Data2)  #推定
model_FE <- plm(formula = Y ~X1 + X2,model="within",data=Data2)  #推定結果の代入
summary(model_FE)  #推定結果の詳細

問２：推定量

問２：固定効果推定量は、固定効果のどんな難点について、どの点に着目し、どのように解決したか。

（解答）

　固定効果推定量は、固定効果の「個体によって異なり、観測できない欠落変数」という難点について「時間によっても変化しない」という点に着目し「個体ごとに時間平均を引いてやることで、欠落変数を除去する」という方法で解決した。

補足

・固定効果推定量が一致性、漸近正規性を持つための仮定について：少なくとも強外生性(strict exogeneity)が必要である。強外生性とは、個体i、時点tの誤差項Uitが、個体iのすべての時点t=1,2,・・・Tの説明変数Xと相関を持っていないという仮定である。

$$強外生性E(U_{it}|\{ X_{1it},\cdots , X_{kit}\}_{t=1,2 \cdots T})=0$$

・標準誤差について：クラスター構造に頑健な標準誤差(cluster robust standard error)を使用するべきだ。パネルデータは、時系列データと同じで、誤差項が自己相関していると考えられる。同一個体の異なる時点間の誤差項同士が相関しているからだ。なお、クラスター構造に頑健な標準誤差はHAC標準誤差（不均一分散と自己相関がある場合でも一致性を持つ漸近分散推定量に基づく標準誤差）である。

・最小二乗法について：パネル・データに最小二乗法(OLS)を適用する際は、特別にプーリングOLSと言う。上で見たように固定効果推定量は、結局は最小二乗法で計算するからだ。「プーリングOLSとしての最小二乗法」と「固定効果推定としての最小二乗法」は区別したい。

・プーリングOLSについて：αをコントロールできる欠落変数さえ見つかり、内生性の問題が回避できるならば、プーリングOLSを用いてよい。プーリングOLSだと、定数項もわかるので、予測ができる。仮定も強外生性ではなく、外生性でよい。

$$重回帰モデル　Y_i=\beta_{0}+\beta_1 X_{1it} +\cdots + \beta_kX_{kit}+(U_{it}+\alpha_i)$$

$$外生性E(U_{it}+\alpha_i| X_{1it},\cdots , X_{kit})=0$$

・変量効果推定量について：「αが説明変数と相関していない」なら、変量効果推定量が使える。なお、固定効果推定量は「αが説明変数と相関している」「αが説明変数と相関していない」の両方とも使えるので、変量効果推定量よりも頑健性を持つ。