定量分析

シミュレーション

バタフライ・エフェクトとは初期値鋭敏性の文学的表現である

要約  バタフライ・エフェクトとは、一般には、カオス現象の初期値鋭敏性についての文学的表現です。初期値鋭敏性とは、初期状態がほんの少し違うだけで長期的な結果が全く異なる性質のことです。下図がその例です。 全体像...
データ分析

身長が正規分布に従うことはデータから導ける

要約  身長の分布は正規分布に従っています。図の実線が実際の17歳男女のデータです。色塗り領域が平均と標準偏差を調整した正規分布です。実線と色塗り領域はほぼ重なっていることがわかるでしょう。 ※アイキャッチ画像出典(U...
モデル

多項ロジスティック回帰モデルとは、多値選択モデルである

要約  多項ロジスティック回帰モデルとは、目的変数Yが複数の選択肢のうち、どれになるのかを説明するモデルです。説明変数Xによって、選択肢をとる確率が変わるモデルです。  例えば、下図の多項ロジスティック回帰モデルもあり...
モデル

ロジスティック回帰モデルとは、2値選択モデルである

要約  ロジスティック回帰モデルとは、目的変数Yが0か1を取るモデルの一つです。説明変数Xの値を変えると、Y=1になる確率が定まります。あくまで確率が定まるだけなので、Yが0か1は不確定です。  例えば、曲線がY=1を...
データ分析

単回帰分析のt検定で因果関係に迫れる(?)

要約  単回帰分析のt検定では「説明変数Xが目的変数Yに影響を与えているか」という問いに「迫ること」ができます。なぜなら、XがYに影響を与える際、次のモデルにて「β1≠0」であると考えられ、これはt検定で検証している...
データ分析

サンプルサイズが大きいとき、単回帰分析における最小二乗推定量は近似的に正規分布に従う

要約  サンプル・サイズが大きいとき、最小二乗法(OLS)によって計算される標本回帰係数は、近似的に正規分布に従います。つまり、単回帰分析における最小二乗推定量は、漸近正規性を持ちます。ただし、外生性といった条件を満たす必要...
シミュレーション

東大生の身長分布は、女子比率が低すぎて悲しい分布になっている

要約  2022年度の東大生の身長分布を予測すると、次の分布になりました。女子学生が少ないですね...  ちなみに慶應について同様のシミュレーションを行うと、次のようになりました。 全体像 (1)問...
データ分析

中心極限定理は、すごい法則なのか?

要約  中心極限定理は偶然性の法則の一つで「一定の条件下で、Xの母集団分布が何であっても、Xの平均は正規分布に従う」という法則です。 ・「Xの母集団分布が何であっても」という非常にゆるい条件で ・「平均は正規分布...
データ分析

回帰分析において不均一分散に頑健な標準誤差を用いるべきか?

要約  回帰分析では、不均一分散に頑健な標準誤差を用いるべきです。  なぜなら、誤差項が不均一分散でも、不均一分散に頑健な標準誤差(赤)は、標本回帰係数の標準偏差(黒)を一致性を持って推定できま...
モデル

単回帰モデルとは、一次関数の単純なモデルである

要約  単回帰モデルとは、説明変数Xによって目的変数Yが大まかに決まるモデルの一つです。Y=aX+bのような一次関数で期待値が表せるので、最も単純なモデルです。例えば、下図があります。 ...
タイトルとURLをコピーしました