メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー

【データの分析】『分散と標準偏差とは?』分散と標準偏差の違い

  • URLをコピーしました!

分散と標準偏差の違い

この記事では、分散と標準偏差の違いについて整理していきます。

実際の問題では、「分散を求めなさい」や「標準偏差を求めなさい」のように問題文に書いてあるので混乱することはないかもしれません。しかし、どういう場面でどっちを扱うのか。というのは数学を深める上で重要な部分になります。

すこし玄人向けの内容にはなりますが、ぜひ読んでみてください!

分散と標準偏差の公式

分散 s2

s2=1n{(x1x¯)2+(x2x¯)2++(xnx¯)2}

また、s2=x2¯(x¯)2 で計算できる。

標準偏差 s

s=1n{(x1x¯)2+(x2x¯)2++(xnx¯)2}

=x2¯(x¯)2

分散と標準偏差の公式の違い

上記の公式をよく見ると、=() となっていることがわかると思います。

分散は標準偏差を 2 乗した値です。どちらもほぼ同じ公式ですが、どのように使い分けられるのでしょうか?

ここから、例題を用いて使い分けについて書いていきますが、まずは結論から…

分散は 2 乗してしまっていて、元のデータよりも大きな値が算出されてしまうので一般的には標準偏差が用いられる。

では、例題を見ながら紐解いていきましょう!

分散と標準偏差の違い〜例題〜

例題)クラス A 生徒 5 人の数学のテストが 25, 56, 68, 76, 92 のとき、分散、標準偏差どちらを用いるのが一般的に適切か。

それぞれのデータの値を x1, x2, x3, x4, x5 とし、平均値を x¯ とする。

x¯=25+56+68+76+925=63.4
※ 以下 63 として計算します。

〈分散〉

15{(2563)2+(5663)2+(6863)2+(7663)2+(9263)2}

=15{(38)2+(7)2+52+132+292}
=152528=505.6

〈標準偏差〉

505.6=22.48

さて、分散と標準偏差の値をそれぞれ求めましたが、どちらが適切でしょうか?

適切なのは、標準偏差です!

今回扱っているデータは、テストの点数です。テストと言えば一般的には 0100 の間で表されます。 5 人の点数がどれだけ散らばっているかという値が分散の 505.6 というのは直感的に大きすぎる気がしませんか?そこでその平方根である標準偏差 22.48 を扱った方が適切だと言えます。

分散の計算式を見ると、途中で ()2 という部分があると思います。これは 2 乗しないと散らばりが 0 になってしまうことを防ぐための計算ですが、これが直感以上に値が大きくなってしまう原因です。

おわりに

今回は分散と標準偏差の違い(使い分け)について書いてきました。

データによって使い分けは変わってきますが、一般的には直感に即した標準偏差が使われることが多いでしょう。

さいごまで読んでいただきありがとうございました!

『統計の扉』で書いている記事

  • 高校数学の解説
  • 公務員試験の数学
  • 統計学(統計検定2級レベル)

ぜひご覧ください!

数学でお困りの方は、コメントやXでご連絡ください。(Xはこちら

私自身、数学が得意になれたのはただ運が良かったんだと思っています。たまたま親が通塾させることに積極的だったり、友達が入るって理由でそろばんに入れたり、他の科目が壊滅的だったおかげで数学が(相対的に)得意だと勘違いできたり。

”たまたま”得意になれたこの恩を、今数学の学習に困っている人に還元できたらなと思っています。お金は取りません。できる限り(何百人から連絡が来たら難しいかもですが…)真摯に向き合おうと思っていますのでオアシスだと思ってご連絡ください。

  • URLをコピーしました!