メニュー
統計学の基礎の「キ」を知りたい方へ
1.
→統計の考え方を学びたい方向け

2.
→ビジネスでのデータ分析プロジェクトの流れを知りたい方向け
統計学を本格的に学びたい方へ〉
1.
→困ったときに引く統計学の辞書

2.
→5年間分の過去問が収録されています。

カテゴリー
yu-to
ブログ運営
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
LINE無料相談こちらをクリック

【確率分布と統計的推測】仮設検定

  • URLをコピーしました!
目次

仮説検定とは

仮説検定(かせつけんてい)は、統計学において、ある主張や仮説がデータに基づいて正しいかどうかを検証する手法です。これは、科学実験や社会調査、品質管理など、多くの分野で広く使われています。

仮設検定は高校生で学習する単元「確率分布と統計的な推測」に含まれています。今回は一部高校の範囲を逸脱した内容になっていますが、仮設検定の具体的な活用方法が載せられていますので、わからない言葉はGoogleで検索しながら進めてみてください!

では早速ですが、仮説検定は基本的に以下のステップに従って行われます。

仮説検定のステップ

  1. 帰無仮説(\(H_0\))と対立仮説(\(H_1\))の設定
    • 帰無仮説(\(H_0\)):通常、何も効果がない、差がないとする仮説。
    • 対立仮説(\(H_1\)):帰無仮説に対して、効果がある、差があるとする仮説。
  2. 有意水準(\(\alpha\))の設定
    • 通常、\(0.05\)(\(5%\))や \(0.01\)(\(1%\))が使われます。この値は、帰無仮説が正しいときに、誤ってそれを棄却する確率を示します。
  3. 検定統計量の計算
    • データから計算される統計量で、これを基に仮説を検証します。
  4. 棄却域の決定
    • 検定統計量がどの範囲に入ると帰無仮説を棄却するかを決めます。
  5. 結論の導出
    • 検定統計量が棄却域に入る場合、帰無仮説を棄却し、対立仮説を採択します。入らない場合、帰無仮説を棄却しません。

仮説検定の種類

仮説検定にはいくつかの種類があります。ここでは、代表的なものをいくつか紹介します。

  1. \(Z\)検定:標本が正規分布に従い、母分散が既知の場合に使われます。
  2. \(t\) 検定:標本が正規分布に従い、母分散が未知の場合に使われます。
  3. カイ二乗検定:カテゴリーデータの検定に使われます。
  4. \(F\) 検定:2つの分散が等しいかどうかを検定します。

例題:平均の検定(\(t\) 検定)

ここでは、具体的な例を使って \(t\) 検定を説明します。

例題

ある学校で新しい数学の教科書を使った場合、生徒の平均点が75点より高くなるかどうかを検定します。ここでは、10人の生徒のテスト結果が以下の通りだったとします。

$$70, 72, 68, 75, 78, 74, 80, 71, 69, 77$$

ステップ1:仮説の設定

  • 帰無仮説(\(H0\)):新しい教科書は効果がない(生徒の平均点は75点以下)。
  • 対立仮説(\(H1\)):新しい教科書は効果がある(生徒の平均点は75点より高い)。

「帰無仮説」は棄却したいもの。示したいものとは逆のものを設定することが基本です!今回は、教科書が効果がある。ことを示したいのでその逆を設定します。

ステップ2:有意水準の設定

  • 有意水準(\(\alpha\))を0.05に設定します。

有意水準は扱うデータや目的によって変わります!

ステップ3:検定統計量の計算

まず、標本平均(\(\bar{x}\))と標本標準偏差(\(s\))を計算します。

$$\bar{x} = \frac{70 + 72 + 68 + 75 + 78 + 74 + 80 + 71 + 69 + 77}{10} = 73.4$$

次に、標本標準偏差(\(s\))を計算します。

\begin{eqnarray} s &=& \sqrt{\frac{\sum_{i=1}^{n} (x_i – \bar{x})^2}{n-1}}\\ &=& \sqrt{\frac{(70-73.4)^2 + (72-73.4)^2 + … + (77-73.4)^2}{9}}\\ &=& 4.02 \end{eqnarray}

次に、\(t\) 値を計算します。

\begin{eqnarray} t &=& \frac{\bar{x} – \mu_0}{s / \sqrt{n}}\\ &=& \frac{73.4 – 75}{4.02 / \sqrt{10}}\\ &=& -1.25 \end{eqnarray}

\(t\)値(検定統計量)がなぜこういう計算をするのか?まではひとまずは理解する必要はありません。ステップ3の有意水準を満たすか否かの基準として都合良いんだなくらいに思っておいてください!

ステップ4:棄却域の決定

自由度(\(df\))は、\(n−1=10−1=9\) です。有意水準0.05で片側検定を行う場合、\(t\) 分布表を使って棄却域の値を求めます。この場合、\(t\) 値が \(-1.833\) 以下であれば帰無仮説を棄却します。

ステップ5:結論の導出

計算した \(t\) 値は \(-1.25\) で、棄却域に入っていません。
したがって、帰無仮説である「新しい教科書が効果がない」を棄却することができません。つまり、まだ新しい教科書は効果がない可能性もあるから効果があるとは言い切れない。となります。

ここで重要なのは、「効果がない。」と断定するのではなく、「効果があるとは言えない。」と判断する点です。

まとめ

仮説検定は、データに基づいてある主張が正しいかどうかを検証するための重要な方法です。仮説を設定し、有意水準を決め、データを基に検定統計量を計算し、その結果から結論を導きます。仮説検定は、科学研究、品質管理、社会調査など、さまざまな分野で広く応用されています。具体例を通じて、その基本的な流れと考え方を理解することで、データに基づいた意思決定ができるようになります。

さいごまで記事を読んでいただきありがとうございました!

「30分で集中力が切れてしまう方へ」

勉強の集中力UPのために

子供に集中して宿題をさせるために

会議やプレゼンのタイムマネジメントのために

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

質問や感想はコメントへ!

コメントする

目次