K%信頼区間のK%は何を意味するのか?

 K%信頼区間というとき、K%について説明します。

要約

(1)問い

 K%信頼区間というときのK%は何でしょうか?

(2)結論

 K%は信頼水準または信頼係数です。

 すでに計算されたK%信頼区間のK%は、確率ではありません。

(3)意義

 以上を知っておけば、計算された95%信頼区間(A,B)について「パラメーターがA以上B以下になる確率は95%です」と言ってしまい、「確率じゃねえよ」と炎上するリスクを回避できます。なお、「確率じゃねえよ」という人は俗に信頼区間警察と呼称されます。

前提

 問いを「K%信頼区間というときのK%は何か」とします。

 これに際して、次の定義・仮定・事実を用います。

(1)定義

K%信頼区間

 K%信頼区間[A, B]とは

  • 標本抽出を何回も繰り返して、それぞれで信頼区間を計算したとき、パラメーターθが含まれる割合がK%であるような区間

です。この割合K%を、信頼水準または信頼係数と言います。

95%信頼区間

 例えば、100回標本抽出して、信頼区間(A, B)を100回計算したとします。パラメーターθを含む○/含まない×で分類して

$$[A_1,B_1] →含む◯$$

$$[A_2,B_2]→含まない×$$

$$[A_3,B_3]→含む◯$$

$$\cdots$$

$$[A_{99},B_{99}]→含む◯$$

$$[ A_{100},B_{100} ] →含まない×$$

となったときに、含む◯が95回であるような区間が、95%信頼区間です。

(2)仮定する条件

 次のことを仮定します。

  • 母集団で成立しているパラメーターは、定数である。つまり、確率変数ではない
  • 母集団に課した仮定が正しい
  • 標本は無作為抽出ができている

方法

 この記事では

  1. 計算結果としての信頼区間(標本抽出した後)
  2. 計算手法としての信頼区間(標本抽出する前)

で場合分けして考えます。それぞれ「結果 <標本抽出後>」「結果 <標本抽出前>」をご覧ください。

結果 <標本抽出後>

(1)K%は確率ではない

 計算結果としてのK%信頼区間におけるK%は、確率ではありません。

(2)理由

 背理法で考えましょう。

前提

  • 信頼区間[A, B]が計算された
  • A、Bは定数 
  • パラメーターθは定数 (←仮定より)

とします。

背理法

 もし

  • K%が確率Pである

を仮定すると、つぎの事実1と事実2が互いに矛盾します。

  • 事実1:「θがA以上B以下の確率P」=0か1
  • 事実2:K%には95%がよく使われる

 したがって、K%は確率Pではありません。

(3)応用例

 統計ソフトで計算された信頼区間は

  • 標本抽出した後の信頼区間

ですから「0か1の確率でパラメーターを含む」です。

 だから「出力された信頼区間を見てください。95%の確率で、パラメーターはこの間にあります」と言うと、信頼区間警察に怒られます。

結果 <標本抽出前>

(1)K%は確率とも解釈できる

 計算手法としてのK%信頼区間におけるK%は、確率と解釈できます。

(2)理由

 標本抽出前であれば、信頼区間[A、B]のAとBは確率変数です。したがって、パラメーターが信頼区間に含まれる確率は、0か1以外にもなり得ます。

 例えば、95%信頼区間の場合、これから計算できるのが[A1、B1なのか[A89,B89]なのか確定していません。

$$[A_1,B_1] →含む◯$$

$$[A_2,B_2]→含まない×$$

$$[A_3,B_3]→含む◯$$

$$\cdots$$

$$[A_{99},B_{99}]→含む◯$$

$$[ A_{100},B_{100} ] →含まない×$$

 そして、無作為抽出を仮定しているので、どれになるかは「等確率」「同様に確からしい」です。つまり、含む○になる頻度は95%です。頻度95%は、確率95%と解釈できます。

 したがって、標本抽出前の計算手法としてのK%信頼区間のK%は確率と解釈できます。

※実際に95%を計算する際に拠り所になるのが「母集団に課した仮定の正しさ」です。

(3)応用例

 教科書にある手法としてのK%信頼区間は

  • 標本抽出する前の信頼区間

ですから「K%の確率でパラメーターを含む」と考えて問題ないです。

考察

(1)結論

 K%は信頼水準または信頼係数です。

 標本抽出前のK%信頼区間における信頼水準K%は、確率です。

 標本抽出後のK%信頼区間における信頼水準K%は、確率ではありません。

(2)前提評価

 「パラメーターは定数」を仮定しているので、信頼区間はベイズ統計学の概念ではありません。

(3)意義

 以上を知っておけば、

「データから計算した結果、95%信頼区間は[A、B]でした。つまり、パラメーターがA以上B以下の確率は95%です」

「は? 95%は確率じゃねえよ」

という炎上リスクを回避できます。なお、「95%は確率じゃないよ」と指摘する方は、面白がって「信頼区間警察」を自称します。

 ちなみに、Wikipedia「信頼区間」には次のような記述があります。

この記事は、ほとんどの読者が理解するにはあまりにも技術的かもしれません。(2021年3月)

Wikipedia「Confidence interval

 マニアックな議論してすみませんでした。

コメント欄 お気軽にコメントをお寄せください!

タイトルとURLをコピーしました