仮説検定とは
仮説検定は、ある事象や主張に対して「それが偶然の産物か、統計的に意味があるのか」を判断するために用いられます。具体的には、まず検定したい仮説 (帰無仮説) を立て、その仮説がデータに基づいて棄却できるかどうかを判断します。
データアナリストは日々あらゆる仮説を立てながら業務を進めます。その仮説が正しいと言えるかどうかを検証する際に仮設検定は活用されます。
仮説検定の基本的な手順
帰無仮説
有意水準
検定統計量は、データの結果を数値化したもので、標準化された尺度に従って仮説を評価します。例えば、
t検定を用いた問題例
問題
ある学校で、毎日行われる英単語テストの平均点が
75, 68, 72, 71, 73, 77, 69, 74, 70, 71,
72, 65, 78, 73, 67, 76, 69, 71, 72, 74,
75, 66, 70, 71, 73, 74, 69, 75, 70, 72
手順
帰無仮説と対立仮説の設定
帰無仮説
対立仮説
有意水準の設定
検定統計量の計算 (
はサンプルの平均点 は帰無仮説での期待平均値 点 はサンプルの標準偏差 はサンプルサイズ
自由度
自由度
結論の出力
有意水準
解説
この
仮説検定の種類
仮説検定にはいくつかの種類があり、目的やデータの性質に応じて使い分けられます。以下に代表的な検定方法を紹介します。
母分散が分かっている: 検定
基本的にはサンプルサイズが十分に得られている場合に使用します。標準正規分布を基準に検定統計量を算出し、それに基づいて帰無仮説を評価します。
:サンプルの平均 :母集団の平均(帰無仮説で仮定する平均) :母集団の標準偏差(既知) :サンプルサイズ
母分散が分かっていない: 検定
小さなサンプルサイズでも有効です。
標本 検定: 一つの標本の平均値が、既知の値と異なるかどうかを検定します。- 対応のあるt検定: 同じ被験者に対して異なる条件でデータを取得した場合に、それらの条件間で差があるかを検定します。
- 対応のないt検定: 異なる
つのグループ間の平均値に差があるかを検定します。
:サンプルの平均点 :母集団の平均 :サンプルの標準偏差 :サンプルサイズ
カテゴリカルデータの場合:カイ二乗検定
たとえば、観測されたデータが期待される割合からどの程度ずれているかを評価します。この検定は、適合度検定や独立性の検定で使用され、例えばアンケート調査などのカテゴリデータに対して有効です。
:観測された値(実際に得られたデータ) :期待値(理論上予想される値)
仮説検定における誤り
仮説検定には
- 第
種の誤り( エラー)
帰無仮説が正しいにもかかわらず、それを誤って棄却してしまう誤りです。有意水準を低く設定することで、この誤りのリスクを減らせます。 - 第
種の誤り( エラー)
対立仮説が正しいにもかかわらず、帰無仮説を棄却できない誤りです。サンプルサイズを大きくすることで、第2種の誤りを減らすことができます。
まとめ
仮説検定は、データに基づいて意思決定を行うための強力な手法です。
帰無仮説と対立仮説を明確にし、
さいごまで読んでいただきありがとうございました!
『統計の扉』で書いている記事
- 高校数学の解説
- 公務員試験の数学
- 統計学(統計検定2級レベル)
ぜひご覧ください!
数学でお困りの方は、コメントやXでご連絡ください。(Xはこちら)
私自身、数学が得意になれたのはただ運が良かったんだと思っています。たまたま親が通塾させることに積極的だったり、友達が入るって理由でそろばんに入れたり、他の科目が壊滅的だったおかげで数学が(相対的に)得意だと勘違いできたり。
”たまたま”得意になれたこの恩を、今数学の学習に困っている人に還元できたらなと思っています。お金は取りません。できる限り(何百人から連絡が来たら難しいかもですが…)真摯に向き合おうと思っていますのでオアシスだと思ってご連絡ください。