一致性

 一致性について説明します。

要約

 一致性とは

$$標本の数nが無限大のとき$$

$$推定量\widehat{\theta}_nがパラメーター\thetaに確率収束する$$

です。

一致性

(1)母数に収束(nが無限大で)

 一致性とは

$$標本の数nが無限大のとき$$

$$推定量\widehat{\theta}_nがパラメーター\thetaに確率収束する$$

です。一致性の正確な定義は

$$すべての\epsilon >0に対して、n→∞のとき$$

$$P(|\widehat{\theta}_n -\theta|>\epsilon )=0$$

 ただし

$$n:標本の数、\widehat{\theta}_n:標本の数nの推定値、\theta:パラメーター$$

$$P(A>B):AがBより大きい確率$$

$$|X|:Xの絶対値$$

です。

(2)母数に収束(nを増やすと)

 一致性がある場合、標本を増やしていくと、推定値がパラメーターと近い確率がどんどん増えていきます。これは次のように表せます。標本を増やすと、推定量がどんどんパラメーターに近く分布していくのがわかります。

(3)漸近バイアス

 なお、標本の数が大きくなって確率収束する推定量とパラメーターの差を、漸近バイアスと言います。

$$漸近バイアス=\widehat{\theta}_∞ -\theta$$

一致性の図解

(1)一致性がある例

 標本平均という推定量は次で表せます。

$$\widehat{\theta}=\frac{X_1+X_2+\cdots + X_n}{n}$$

$$n:標本の数、X:データ$$

 標本平均は一致性を持つことが知られています。母平均4の乱数を1万回生成して、その標本平均の分布を調べます。標本の数n=5、50、500、50000で、それぞれシミュレーションします。

 シミュレーション結果が上です。標本が大きくなると、母平均である4に標本平均が確率収束していくのがよくわかると思います。これが一致性です。

(2)一致性がない例

 単回帰分析で求めた回帰係数は、外生性の仮定※が成り立たないと、一致性を持たないことが知られています。(※誤差項uの条件付き期待値がゼロ)

 母回帰係数が4であり、外生性がない場合の乱数を1000回生成して、その標本回帰係数の分布を調べます。標本の数n=10、1000で、それぞれシミュレーションします。

 シミュレーション結果が上です。標本が大きくなっても、母回帰係数である4に標本回帰係数が確率収束していっていないことがわかります。また、漸近バイアスがあることが見て取れます。

Rコード

trial_number <- 10000
sample_number <- 50000

mean0 <- rep(NA, trial_number)

for(i in 1:trial_number){
  x <- rnorm(n=sample_number, mean =4, sd=2)
  answer <- mean(x)
  mean0[i] <- answer
}

hist(mean0,breaks = 50,xlim=c(0,8))
mean(mean0)

コメント欄 お気軽にコメントをお寄せください!

タイトルとURLをコピーしました