要約
仮説検定は、背理法のロジックと似ています。

全体像
(1)問題の構造
問い「仮説検定のロジックは、背理法と似ているか?」を、次のように分解します。
①仮説検定とは何か→(②母集団と標本とは、③帰無仮説と対立仮説とは、④有意水準とは、⑤検定統計量とは、⑥P値とは、⑦仮説検定の手順とは)
⑧背理法のロジックとは
⑨仮説検定と背理法のロジックは似ているか
(2)前提の選択
①〜⑧を前提として選択します。
(3)論点の選択
⑨を論点として選択します。
(4)付録一覧
冗長さを避けて、可読性を上げるために、以下の内容は付録に回します。
「Rコード」
前提
①仮説検定とは
仮説検定とは、パラメーターについての帰無仮説と対立仮説を検証する統計学の手法です。
②母集団、パラメーター、標本、推定値とは
母集団は、知りたい対象そのものですが、観察できる対象ではありません。母集団の性質を表す数値を、パラメーターと言います。
標本は、観察できる対象ですが、知りたい対象そのものではありません。標本から導けるのは、パラメーターの推定値です。

③帰無仮説と対立仮説とは
仮説検定では、母集団のパラメーターについて互いに排反な仮説を立てます。それが
・帰無仮説:棄却したい仮説。「無」に「帰」したい仮説
・対立仮説:採択したい仮説。帰無仮説に「対立」している仮説
です。例えば
$$帰無仮説:母回帰係数=0$$
$$対立仮説:母回帰係数≠0$$
④有意水準とは
有意水準とは「偶然であり得る」か「偶然ではあり得ない」かを判断する確率です。一般に0.05に設定されます。
有意水準が0.05であることは
・95%の確率でよく起こる現象 → 「偶然であり得る」
・5%の確率でしか起こらない現象 → 「偶然ではあり得ない」 → 「意味がある」
と判断することを意味します。
⑤検定統計量とは
検定統計量は、確率を判断するための指標です。
例えば、標準正規分布に従うZ統計量が
$$-1.96≦Z統計量≦1.96$$
になる確率は95%です。この「1.96」はよく登場する数値です。↓

なお、検定統計量が厳密に機能するには
・母集団についてのモデルや仮定が正しく、適切な検定統計量が選択されている
・無作為抽出が行われている
という仮定が必要です。
⑥P値とは
P値とは「あり得なさ」を意味する数値です。正確には、「帰無仮説が正しいとして」「検定統計量より極端な値を得られる確率」をP値といいます。
例えば(両側検定で)Z統計量が1.55だとすると、P値は0.12です。

例えば(両側検定で)Z統計量がー2.17だとすると、P値は0.03です。

⑦仮説検定の手順とは
仮説検定とは、次の手順で行う検定です。
第一に、母集団について、帰無仮説と対立仮説を立てます。
第二に、使用する有意水準と検定統計量を設定します。
第三に、帰無仮説が正しいと仮定して、検定統計量を計算します。
第四に、帰無仮説が正しいと仮定して、計算された検定統計量より極端な値を得られる確率を計算します。この確率が、P値です。
最後に、
・P値 ≦ 有意水準 ならば、帰無仮説を棄却し、対立仮説を採択する
・P値 > 有意水準 ならば、どちらの仮説も採択しない
とします。前者の場合を「統計的に有意」と言います。
⑧背理法とは
次の論法を背理法と言います。
第一に、命題についての仮説を立てます。
第二に、命題が正しくないと仮定します。
第三に、命題が正しくないなら矛盾が生じるかを調べます。
最後に
・矛盾が生じるなら、もともとの命題は真
・矛盾が生じないなら、もともとの命題の真偽は不明
とします。
方法
仮説検定の手順と背理法の手順を比較します。
結果
比較結果が下表です。

「示したいものの真逆を仮定する出発点」と「その仮定することで導ける『矛盾』や『P値(あり得なさ)』を判断に使う終着点」は同じ構造であることがわかります。
考察
(1)結論
仮説検定は、確率を用いた背理法と考えることができます。
(2)妥当性評価
確率のロジックが通るには、検定統計量が厳密に機能する必要があります。今回は前提にて
- 母集団に課した仮定が正しく、適切な検定統計量が選択されている
- 無作為抽出が行われている
を仮定されていますからよいですが、実際のデータ分析では上の2つの仮定が成り立つかどうかを考えなくてはいけません。
(3)意義
頻出かつ全体がみえにくい仮説検定について理解できました。
付録:Rコード
作図は、R言語を用いて行いました。R言語については「しまうまのRでデータ分析入門」をご覧ください。
美しい図示のため、パッケージとしてggplot2を用いました。
#パッケージの呼び出し。未インストールならインストール!
library(ggplot2)
Rで有意水準0.05の標準正規分布を作図します。↓
#パッケージの呼び出し。インストールしていない人はインストールしてください。
library(ggplot2)
#有意水準を設定
a <- 0.05
#検定統計量を求める
p1 <- a/2
p2 <- 1-a/2
q <- qnorm(c(p1,p2))
#描画
ggplot(data = data.frame(X = c(-3, 3)), aes(x = X))+ #-3〜3の範囲
stat_function(fun = dnorm)+ #標準正規分布の確率密度を描画
xlab("")+ #以下は色塗り
geom_ribbon(data=data.frame(X=x<-seq(q[1],q[2],len=101), Y=dnorm(x)),aes(x=X, ymin=0, ymax=Y),fill="green",alpha=0.3)+
geom_ribbon(data=data.frame(X=x<-seq(q[2], 3,len=101), Y=dnorm(x)),aes(x=X, ymin=0, ymax=Y),fill="red",alpha=0.6)+
geom_ribbon(data=data.frame(X=x<-seq( -3,q[1],len=101), Y=dnorm(x)),aes(x=X, ymin=0, ymax=Y),fill="red",alpha=0.6)
コメント欄 お気軽にコメントをお寄せください!