メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー
統計学初学者サポートこちらをクリック

【データの分析】分散と標準偏差、相関係数

目次

データアナリストへの道

少し数字に強い理系大学卒から駆け出しデータアナリストになるまでに、実際に読んだ50冊以上の本から厳選して、基本的な理論から実践的スキルまでを身につけられるようにデータ分析初学者向けにまとめました。>>記事を読む

分散と標準偏差

分散と標準偏差の公式

変量 \(x\) についてのデータの値が、\(n\) 個の値 \(x_1\), \(x_2\), \(\cdots\), \(x_n\) の平均値を \(\overline{x}\) とする。

① 分散:\(s^2\)

偏差の \(2\) 乗の平均値であり

 \(s^2=\displaystyle\frac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots +(x_n-\overline{x})^2\}\)

また、\(s^2=\overline{x^2}-(\overline{x})^2\) で計算できる。

② 標準偏差

分散の正の平方根であり

 \(s=\sqrt{\displaystyle\frac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots +(x_n-\overline{x})^2\}}\)
  \(=\sqrt{\overline{x^2}-(\overline{x})^2}\)

分散を求める手順

① 平均値を求める
② 偏差(各データ \(-\) 平均値)を求める
③ 偏差の二乗の平均(\(=\) 分散)を求める

分散と標準偏差の例題と解説

次のデータは、ある商品 \(A\), \(B\) の \(5\) 日間の売り上げ個数である。

\(A\):\(5\), \(7\), \(4\), \(3\), \(6\)
\(B\):\(4\), \(6\), \(8\), \(3\), \(9\) (単位は個)

\(A\), \(B\) の変量をそれぞれ \(x\), \(y\) とするとき、次の問いに答えよ。

(1) \(x\), \(y\) のデータの平均値、分散、標準偏差をそれぞれ求めよ。ただし、標準偏差については小数第\(2\) 位を四捨五入せよ。
(2) \(x\), \(y\) のデータについて、標準偏差によってデータの平均値からの散らばりの度合いを比較せよ。


(解説)

(1)

\(x\), \(y\) のデータの平均値をそれぞれ \(\overline{x}\), \(\overline{y}\) とすると

 \(\overline{x}=\displaystyle\frac{1}{5}(5+7+4+3+6)=\) \(5\)
 \(\overline{y}=\displaystyle\frac{1}{5}(4+6+8+3+9)=\) \(6\)

\(x\), \(y\) のデータの分散をそれぞれ \(s_x^2\), \(s_y^2\) とすると

 \(s_x^2=\overline{x^2}-(\overline{x})^2\) より
 \(s_x^2=\displaystyle\frac{1}{5}(5^2+7^2+4^2+3^2+6^2)-5^2=\) \(2\)

 \(s_y^2=\overline{y^2}-(\overline{y})^2\) より
 \(s_x^2=\displaystyle\frac{1}{5}(4^2+6^2+8^2+3^2+9^2)-6^2=\) \(5.2\)

よって、標準偏差は、

 \(s_x=\sqrt{2}=1.4\cdots\) よって、\(1.4\)
 \(s_7=\sqrt{5.2}=2.3\cdots\) よって、\(2.3\)

(2)

(1) から、\(s_y>s_x\)

ゆえに、\(y\) のデータの方が散らばりの度合いが大きい。

相関係数

相関係数の公式

相関係数 \(r\)

 \(r=\displaystyle\frac{S_{xy}}{S_{x}S_{y}}\)

\(S_{xy}\):\(x\) と \(y\) の共分散
\(S_{x}\):\(x\) の標準偏差
\(S_{y}\):\(y\) の標準偏差

相関係数の例題と解説

次の表は、学生 \(5\) 名の身長 \(x\)(cm)と体重 \(y\) (kg)を測定した結果である。\(x\) と \(y\) の相関係数 \(r\) を求めよ。

ABCDE
身長 \(x\) (cm)181167173169165
体重 \(y\) (kg)7559636761

(解説)

\(x\), \(y\) のデータの平均をそれぞれ \(\overline{x}\), \(\overline{y}\) とすると

 \(\overline{x}=\frac{1}{5}(181+167+173+169+165)=171\)
 \(\overline{y}=\frac{1}{5}(75+59+63+67+61)=65\)

※ 分母の標準偏差、分子の共分散それぞれを直接計算しても良い。

ゆえに、相関係数 \(r\) は

 \(r=\displaystyle\frac{140}{\sqrt{160\times 160}}\)
  \(=\displaystyle\frac{140}{160}\)
  \(=0.875\)

強い正の相関があるようですね!

おわりに

さいごまで読んでいただきありがとうございました!

このブログは統計学を学びたい学生/社会人向けに記事を書いています。

【最新】こちらの記事がおすすめ!

>>

  • URLをコピーしました!
目次