メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー

【データの分析】分散と標準偏差、相関係数

  • URLをコピーしました!

分散と標準偏差

分散と標準偏差の公式

変量 x についてのデータの値が、n 個の値 x1, x2, , xn の平均値を x とする。

① 分散:s2

偏差の 2 乗の平均値であり

 s2=1n{(x1x)2+(x2x)2++(xnx)2}

また、s2=x2(x)2 で計算できる。

② 標準偏差

分散の正の平方根であり

 s=1n{(x1x)2+(x2x)2++(xnx)2}
  =x2(x)2

分散を求める手順

① 平均値を求める
② 偏差(各データ 平均値)を求める
③ 偏差の二乗の平均(= 分散)を求める

分散と標準偏差の例題と解説

次のデータは、ある商品 A, B5 日間の売り上げ個数である。

A5, 7, 4, 3, 6
B4, 6, 8, 3, 9 (単位は個)

A, B の変量をそれぞれ x, y とするとき、次の問いに答えよ。

(1) x, y のデータの平均値、分散、標準偏差をそれぞれ求めよ。ただし、標準偏差については小数第2 位を四捨五入せよ。
(2) x, y のデータについて、標準偏差によってデータの平均値からの散らばりの度合いを比較せよ。


(解説)

(1)

x, y のデータの平均値をそれぞれ x, y とすると

 x=15(5+7+4+3+6)= 5
 y=15(4+6+8+3+9)= 6

x, y のデータの分散をそれぞれ sx2, sy2 とすると

 sx2=x2(x)2 より
 sx2=15(52+72+42+32+62)52= 2

 sy2=y2(y)2 より
 sx2=15(42+62+82+32+92)62= 5.2

よって、標準偏差は、

 sx=2=1.4 よって、1.4
 s7=5.2=2.3 よって、2.3

(2)

(1) から、sy>sx

ゆえに、y のデータの方が散らばりの度合いが大きい。

相関係数

相関係数の公式

相関係数 r

 r=SxySxSy

Sxyxy の共分散
Sxx の標準偏差
Syy の標準偏差

相関係数の例題と解説

次の表は、学生 5 名の身長 x(cm)と体重 y (kg)を測定した結果である。xy の相関係数 r を求めよ。

ABCDE
身長 x (cm)181167173169165
体重 y (kg)7559636761

(解説)

x, y のデータの平均をそれぞれ x, y とすると

 x=15(181+167+173+169+165)=171
 y=15(75+59+63+67+61)=65

※ 分母の標準偏差、分子の共分散それぞれを直接計算しても良い。

ゆえに、相関係数 r

 r=140160×160
  =140160
  =0.875

強い正の相関があるようですね!

おわりに

さいごまで読んでいただきありがとうございました!

『統計の扉』で書いている記事

  • 高校数学の解説
  • 公務員試験の数学
  • 統計学(統計検定2級レベル)

ぜひご覧ください!

数学でお困りの方は、コメントやXでご連絡ください。(Xはこちら

私自身、数学が得意になれたのはただ運が良かったんだと思っています。たまたま親が通塾させることに積極的だったり、友達が入るって理由でそろばんに入れたり、他の科目が壊滅的だったおかげで数学が(相対的に)得意だと勘違いできたり。

”たまたま”得意になれたこの恩を、今数学の学習に困っている人に還元できたらなと思っています。お金は取りません。できる限り(何百人から連絡が来たら難しいかもですが…)真摯に向き合おうと思っていますのでオアシスだと思ってご連絡ください。

  • URLをコピーしました!