分散と標準偏差
分散と標準偏差の公式
変量 \(x\) についてのデータの値が、\(n\) 個の値 \(x_1\), \(x_2\), \(\cdots\), \(x_n\) の平均値を \(\overline{x}\) とする。
① 分散:\(s^2\)
偏差の \(2\) 乗の平均値であり
\(s^2=\displaystyle\frac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots +(x_n-\overline{x})^2\}\)
また、\(s^2=\overline{x^2}-(\overline{x})^2\) で計算できる。
② 標準偏差
分散の正の平方根であり
\(s=\sqrt{\displaystyle\frac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots +(x_n-\overline{x})^2\}}\)
\(=\sqrt{\overline{x^2}-(\overline{x})^2}\)
分散を求める手順
① 平均値を求める
② 偏差(各データ \(-\) 平均値)を求める
③ 偏差の二乗の平均(\(=\) 分散)を求める
分散と標準偏差の例題と解説
次のデータは、ある商品 \(A\), \(B\) の \(5\) 日間の売り上げ個数である。
\(A\):\(5\), \(7\), \(4\), \(3\), \(6\)
\(B\):\(4\), \(6\), \(8\), \(3\), \(9\) (単位は個)
\(A\), \(B\) の変量をそれぞれ \(x\), \(y\) とするとき、次の問いに答えよ。
(1) \(x\), \(y\) のデータの平均値、分散、標準偏差をそれぞれ求めよ。ただし、標準偏差については小数第\(2\) 位を四捨五入せよ。
(2) \(x\), \(y\) のデータについて、標準偏差によってデータの平均値からの散らばりの度合いを比較せよ。
(解説)
(1)
\(x\), \(y\) のデータの平均値をそれぞれ \(\overline{x}\), \(\overline{y}\) とすると
\(\overline{x}=\displaystyle\frac{1}{5}(5+7+4+3+6)=\) \(5\)
\(\overline{y}=\displaystyle\frac{1}{5}(4+6+8+3+9)=\) \(6\)
\(x\), \(y\) のデータの分散をそれぞれ \(s_x^2\), \(s_y^2\) とすると
\(s_x^2=\overline{x^2}-(\overline{x})^2\) より
\(s_x^2=\displaystyle\frac{1}{5}(5^2+7^2+4^2+3^2+6^2)-5^2=\) \(2\)
\(s_y^2=\overline{y^2}-(\overline{y})^2\) より
\(s_x^2=\displaystyle\frac{1}{5}(4^2+6^2+8^2+3^2+9^2)-6^2=\) \(5.2\)
よって、標準偏差は、
\(s_x=\sqrt{2}=1.4\cdots\) よって、\(1.4\)
\(s_7=\sqrt{5.2}=2.3\cdots\) よって、\(2.3\)
(2)
(1) から、\(s_y>s_x\)
ゆえに、\(y\) のデータの方が散らばりの度合いが大きい。
相関係数
相関係数の公式
相関係数 \(r\)
\(r=\displaystyle\frac{S_{xy}}{S_{x}S_{y}}\)
\(S_{xy}\):\(x\) と \(y\) の共分散
\(S_{x}\):\(x\) の標準偏差
\(S_{y}\):\(y\) の標準偏差
相関係数の例題と解説
次の表は、学生 \(5\) 名の身長 \(x\)(cm)と体重 \(y\) (kg)を測定した結果である。\(x\) と \(y\) の相関係数 \(r\) を求めよ。
A | B | C | D | E | |
身長 \(x\) (cm) | 181 | 167 | 173 | 169 | 165 |
体重 \(y\) (kg) | 75 | 59 | 63 | 67 | 61 |
(解説)
\(x\), \(y\) のデータの平均をそれぞれ \(\overline{x}\), \(\overline{y}\) とすると
\(\overline{x}=\frac{1}{5}(181+167+173+169+165)=171\)
\(\overline{y}=\frac{1}{5}(75+59+63+67+61)=65\)
※ 分母の標準偏差、分子の共分散それぞれを直接計算しても良い。
ゆえに、相関係数 \(r\) は
\(r=\displaystyle\frac{140}{\sqrt{160\times 160}}\)
\(=\displaystyle\frac{140}{160}\)
\(=0.875\)
強い正の相関があるようですね!
おわりに
さいごまで読んでいただきありがとうございました!
【最新】こちらの記事がおすすめ!