仮説検定のロジック

 仮説検定について、背理法と比較しながら説明します。

要約

(1)問い

 仮説検定は、論理はどうなっているのか?

(2)結論

 仮説検定は、確率を用いた背理法と考えることができます。

(3)意義

 仮説検定と背理法の関係性がわかると、仮説検定の理解がしやすくなります。

前提

 問いは「仮説検定は、論理はどうなっているのか?」です。

 これに際して、次の定義・事実を用います。

(1)定義

母集団と標本

 母集団は、知りたい対象そのものですが、観察できる対象ではありません。母集団の性質を表す数値を、パラメーターと言います。

 標本は、観察できる対象ですが、知りたい対象そのものではありません。標本から導けるのは、パラメーターの推定値です。

帰無仮説と対立仮説

 仮説検定では、母集団のパラメーターについて互いに排反な仮説を立てます。それが

  • 帰無仮説:棄却したい仮説。「無」に「帰」したい仮説
  • 対立仮説:採択したい仮説。帰無仮説に「対立」している仮説

です。例えば

$$帰無仮説:母回帰係数=0$$

$$対立仮説:母回帰係数≠0$$

有意水準

 有意水準とは「あり得る」か「あり得ない」かを判断する確率です。一般に0.05に設定されます。

 有意水準が0.05であることは

  • 95%の確率でよく起こる現象 → 「あり得る」
  • 5%の確率でしか起こらない現象 → 「あり得ない」

を意味します。

 例えば「世界中の犯罪者数百人が次々にに心臓発作で死亡した」とします。これが偶然に起こる確率は、0ではありませんが限りなく低いです。「偶然ではなく、何か意味が有る」と考えるのが自然でしょう。この偶然で起こる範囲と起こらない範囲の境目が、有意水準です。ちなみに、上の事例はマンガ『デスノート』と同じ状況です。

検定統計量

 検定統計量は、確率を判断するための指標です。

 例えば、標準正規分布に従うZ統計量が

$$-1.96≦Z統計量≦1.96$$

になる確率は95%です。この「1.96」はよく登場する数値です。↓

 なお、検定統計量が厳密に機能するには

  • 母集団に課した仮定が正しく、適切な検定統計量が選択されている
  • 無作為抽出が行われている

という仮定が必要です。

P値

 P値とは「あり得なさ」を意味する数値です。正確には、「帰無仮説が正しいとして」「検定統計量より極端な値を得られる確率」をP値といいます。

 例えば(両側検定で)Z統計量が1.55だとすると、P値は0.12です。

 例えば(両側検定で)Z統計量がー2.17だとすると、P値は0.03です。

仮説検定

 仮説検定とは、次の手順で行う検定です。

 第一に、母集団について

  • 帰無仮説(棄却したい仮説)
  • 対立仮説(採択したい仮説)

を立てます。

 第二に、使用する

  • 有意水準(あり得る/あり得ないの基準)
  • 検定統計量(確率の判断指標)

を設定します。

 第三に、帰無仮説が正しいと仮定して、検定統計量を計算します。

 第四に、帰無仮説が正しいと仮定して、計算された検定統計量より極端な値を得られる確率を計算します。この確率が、P値です。

 第五に、

  • P値 ≦ 有意水準 ならば、帰無仮説を棄却し、対立仮説を採択する
  • P値 > 有意水準 ならば、どちらの仮説も採択しない

 前者の場合を「統計的に有意」と言います。

(2)仮定する条件

 この記事では、検定統計量が厳密に機能することを仮定します。これは

  • 母集団に課した仮定が正しく、適切な検定統計量が選択されている
  • 無作為抽出が行われている

を仮定する必要があります。

(3)事実

 次の論法を背理法と言います。

  1. 命題Xが正しいことを示したい
  2. 命題Xが正しくないと仮定する
  3. 命題Xが正しくないなら、矛盾が生じることを示す
  4. よって、命題Xは正しい

方法

 仮説検定の手順と背理法の手順を比較します。

結果

(1)ロジックの共通点

 比較結果が下表です。

 「示したいものの真逆を仮定する出発点」と「その仮定することで導ける『矛盾』や『P値(あり得なさ)』を判断に使う終着点」は同じ構造であることがわかります。

(2)ロジックの相違点

 一方で、「論理 vs 検定統計量」「矛盾 vs P値」に相違点があります。この相違点は確率をロジックの中核にしているか否かから生まれています。検定統計量はP値を導く概念ですし、確率と関係しています。

考察

(1)結論

 仮説検定は、確率を用いた背理法と考えることができます。

(2)前提評価

 確率のロジックが通るには、検定統計量が厳密に機能する必要があります。今回は前提にて

  • 母集団に課した仮定が正しく、適切な検定統計量が選択されている
  • 無作為抽出が行われている

を仮定されていますからよいですが、実際のデータ分析では上の2つの仮定が成り立つかどうかを考えなくてはいけません。

(3)意義

 仮説検定ってわかりにくいですけれど、背理法との共通点・相違点が明確になると、理解しやすくなるのではないでしょうか。

付録:Rコード

 作図は、R言語を用いて行いました。R言語については「しまうまのRでデータ分析入門」をご覧ください。

 美しい図示のため、パッケージとしてggplot2を用いました。

#パッケージの呼び出し。未インストールならインストール!
library(ggplot2) 

 Rで有意水準0.05の標準正規分布を作図します。↓

#パッケージの呼び出し。インストールしていない人はインストールしてください。
library(ggplot2)
#有意水準を設定
a <- 0.05
 
#検定統計量を求める
p1 <- a/2
p2 <- 1-a/2
q <- qnorm(c(p1,p2))
 
#描画
ggplot(data = data.frame(X = c(-3, 3)), aes(x = X))+ #-3〜3の範囲
  stat_function(fun = dnorm)+ #標準正規分布の確率密度を描画
 
  xlab("")+ #以下は色塗り
  geom_ribbon(data=data.frame(X=x<-seq(q[1],q[2],len=101), Y=dnorm(x)),aes(x=X, ymin=0, ymax=Y),fill="green",alpha=0.3)+ 
 
  geom_ribbon(data=data.frame(X=x<-seq(q[2],   3,len=101), Y=dnorm(x)),aes(x=X, ymin=0, ymax=Y),fill="red",alpha=0.6)+
 
  geom_ribbon(data=data.frame(X=x<-seq(  -3,q[1],len=101), Y=dnorm(x)),aes(x=X, ymin=0, ymax=Y),fill="red",alpha=0.6)

コメント欄 お気軽にコメントをお寄せください!

タイトルとURLをコピーしました