仮説検定のロジックは、背理法と似ているか?

要約

 仮説検定は、背理法のロジックと似ています。

全体像

(1)問題の構造

 問い「仮説検定のロジックは、背理法と似ているか?」を、次のように分解します。

①仮説検定とは何か→(②母集団と標本とは、③帰無仮説と対立仮説とは、④有意水準とは、⑤検定統計量とは、⑥P値とは、⑦仮説検定の手順とは)

⑧背理法のロジックとは

⑨仮説検定と背理法のロジックは似ているか

(2)前提の選択

 ①〜⑧を前提として選択します。

(3)論点の選択

 ⑨を論点として選択します。

(4)付録一覧

 冗長さを避けて、可読性を上げるために、以下の内容は付録に回します。

「Rコード」

前提

①仮説検定とは

 仮説検定とは、パラメーターについての帰無仮説と対立仮説を検証する統計学の手法です。

②母集団、パラメーター、標本、推定値とは

 母集団は、知りたい対象そのものですが、観察できる対象ではありません。母集団の性質を表す数値を、パラメーターと言います。

 標本は、観察できる対象ですが、知りたい対象そのものではありません。標本から導けるのは、パラメーターの推定値です。

③帰無仮説と対立仮説とは

 仮説検定では、母集団のパラメーターについて互いに排反な仮説を立てます。それが

・帰無仮説:棄却したい仮説。「無」に「帰」したい仮説

・対立仮説:採択したい仮説。帰無仮説に「対立」している仮説

です。例えば

$$帰無仮説:母回帰係数=0$$

$$対立仮説:母回帰係数≠0$$

④有意水準とは

 有意水準とは「偶然であり得る」か「偶然ではあり得ない」かを判断する確率です。一般に0.05に設定されます。

 有意水準が0.05であることは

・95%の確率でよく起こる現象 → 「偶然であり得る」

・5%の確率でしか起こらない現象 → 「偶然ではあり得ない」 → 「意味がある」

と判断することを意味します。

⑤検定統計量とは

 検定統計量は、確率を判断するための指標です。

 例えば、標準正規分布に従うZ統計量が

$$-1.96≦Z統計量≦1.96$$

になる確率は95%です。この「1.96」はよく登場する数値です。↓

 なお、検定統計量が厳密に機能するには

・母集団についてのモデルや仮定が正しく、適切な検定統計量が選択されている

・無作為抽出が行われている

という仮定が必要です。

⑥P値とは

 P値とは「あり得なさ」を意味する数値です。正確には、「帰無仮説が正しいとして」「検定統計量より極端な値を得られる確率」をP値といいます。

 例えば(両側検定で)Z統計量が1.55だとすると、P値は0.12です。

 例えば(両側検定で)Z統計量がー2.17だとすると、P値は0.03です。

⑦仮説検定の手順とは

 仮説検定とは、次の手順で行う検定です。

 第一に、母集団について、帰無仮説と対立仮説を立てます。

 第二に、使用する有意水準と検定統計量を設定します。

 第三に、帰無仮説が正しいと仮定して、検定統計量を計算します。

 第四に、帰無仮説が正しいと仮定して、計算された検定統計量より極端な値を得られる確率を計算します。この確率が、P値です。

 最後に、

・P値 ≦ 有意水準 ならば、帰無仮説を棄却し、対立仮説を採択する

・P値 > 有意水準 ならば、どちらの仮説も採択しない

とします。前者の場合を「統計的に有意」と言います。

⑧背理法とは

 次の論法を背理法と言います。

 第一に、命題についての仮説を立てます。

 第二に、命題が正しくないと仮定します。

 第三に、命題が正しくないなら矛盾が生じるかを調べます。

 最後に

・矛盾が生じるなら、もともとの命題は真

・矛盾が生じないなら、もともとの命題の真偽は不明

とします。

方法

 仮説検定の手順と背理法の手順を比較します。

結果

 比較結果が下表です。

 「示したいものの真逆を仮定する出発点」と「その仮定することで導ける『矛盾』や『P値(あり得なさ)』を判断に使う終着点」は同じ構造であることがわかります。

考察

(1)結論

 仮説検定は、確率を用いた背理法と考えることができます。

(2)妥当性評価

 確率のロジックが通るには、検定統計量が厳密に機能する必要があります。今回は前提にて

  • 母集団に課した仮定が正しく、適切な検定統計量が選択されている
  • 無作為抽出が行われている

を仮定されていますからよいですが、実際のデータ分析では上の2つの仮定が成り立つかどうかを考えなくてはいけません。

(3)意義

 頻出かつ全体がみえにくい仮説検定について理解できました。

付録:Rコード

 作図は、R言語を用いて行いました。R言語については「しまうまのRでデータ分析入門」をご覧ください。

 美しい図示のため、パッケージとしてggplot2を用いました。

#パッケージの呼び出し。未インストールならインストール!
library(ggplot2) 

 Rで有意水準0.05の標準正規分布を作図します。↓

#パッケージの呼び出し。インストールしていない人はインストールしてください。
library(ggplot2)
#有意水準を設定
a <- 0.05
 
#検定統計量を求める
p1 <- a/2
p2 <- 1-a/2
q <- qnorm(c(p1,p2))
 
#描画
ggplot(data = data.frame(X = c(-3, 3)), aes(x = X))+ #-3〜3の範囲
  stat_function(fun = dnorm)+ #標準正規分布の確率密度を描画
 
  xlab("")+ #以下は色塗り
  geom_ribbon(data=data.frame(X=x<-seq(q[1],q[2],len=101), Y=dnorm(x)),aes(x=X, ymin=0, ymax=Y),fill="green",alpha=0.3)+ 
 
  geom_ribbon(data=data.frame(X=x<-seq(q[2],   3,len=101), Y=dnorm(x)),aes(x=X, ymin=0, ymax=Y),fill="red",alpha=0.6)+
 
  geom_ribbon(data=data.frame(X=x<-seq(  -3,q[1],len=101), Y=dnorm(x)),aes(x=X, ymin=0, ymax=Y),fill="red",alpha=0.6)

コメント欄 お気軽にコメントをお寄せください!

タイトルとURLをコピーしました