メニュー
統計学の基礎の「キ」を知りたい方へ
1.
→統計の考え方を学びたい方向け

2.
→ビジネスでのデータ分析プロジェクトの流れを知りたい方向け
統計学を本格的に学びたい方へ〉
1.
→困ったときに引く統計学の辞書

2.
→5年間分の過去問が収録されています。

カテゴリー
yu-to
ブログ運営
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
LINE無料相談こちらをクリック

【データの分析】『データの代表値と散らばり』まとめと例題

  • URLをコピーしました!
目次

データの整理

度数分布表

階級:データの値の範囲を区切った区間。
階級の幅:階級としての区間の幅。
階級値:階級の真ん中の値。
度数:各階級に入るデータの個数。
度数分布表:各階級に度数を対応させた表。

相対度数分布表

相対度数:各階級の度数の全体に対する割合。
累積度数:各階級に対し、度数を最初の階級からその階級の値まで合計したもの。
累積相対度数:相対度数についての累積度数

ヒストグラム

度数分布表に整理された資料を柱状のグラフで表したもの。

データの整理の例題

(例題①)

次のデータは、ある月の \(A\) 市の毎日の最高気温の記録である。

\(20.7\), \(20.1\), \(14.5\), \(10.9\), \(12.1\), \(19.1\), \(16.3\), \(13.1\), \(14.6\), \(20.2\)
\(23.2\), \(14.3\), \(20.1\), \(17.4\), \(11.2\), \(7.4\), \(11.5\), \(16.5\), \(19.9\), \(18.1\)
\(25.5\), \(14.2\), \(10.1\), \(16.7\), \(16.7\), \(19.9\), \(15.7\), \(15.4\), \(23.4\), \(20.1\)
(単位は \({}^{\circ} C\))

(1) 階級の幅を \(2\) \({}^{\circ} C\) として、度数分布表を作れ。ただし、階級は \(6^{\circ} C\) から区切り始めるものとする。
(2) (1) で作った度数分布表をもとにして、ヒストグラムをかけ。

解説

(1) 階級の区切り始めと階級の幅から、各階級に入るデータの数を数え、表にする。

階級度数
\(6\) 以上 \(8\) 未満1
\(8\) 〜 \(10\)0
\(10\) 〜 \(12\)4
\(12\) 〜 \(14\)2
\(14\) 〜 \(16\)6
\(16\) 〜 \(18\)5
\(18\) 〜 \(20\)4
\(20\) 〜 \(22\)5
\(22\) 〜 \(24\)2
\(24\) 〜 \(26\)1
30

(2) (1) の度数分布表をもとに、柱状のグラフにして表す。ヒストグラムの各長方形の高さは、各階級の度数を表す。

(例題②)

次のデータは、\(A\) 班 \(5\) 人、\(B\) 班 \(6\) 人の、\(10\) 点満点のテストの結果である。

\(A\) 班:\(5\), \(7\), \(8\), \(4\), \(9\)
\(B\) 班:\(7\), \(10\), \(9\), \(4\). \(8\), \(6\)
(単位は点)

(1) \(A\) 班と \(B\) 班を合わせた \(11\) 人のデータの平均値を求めよ。
(2) \(A\) 班のデータの中央値と \(B\) 班のデータの中央値をそれぞれ求めよ。

解説

(1) \(A\) のデータの平均値は

 \(\displaystyle\frac{1}{5}(5+7+8+4+9)=\frac{33}{5}=6.6\) (点)

\(B\) のデータの平均値は

 \(\displaystyle\frac{1}{5}(7+10+9+4+8+6)=\frac{44}{6}=7.333…\)
 よって、約 \(7.3\) (点)

(2) \(A\) 班のデータを小さい方から順に並べると

 \(4\), \(5\), \(7\), \(8\), \(9\)

\(3\) 番目が中央値であるから \(7\) 点

\(B\) 班のデータを小さい方から順に並べると

 \(4\), \(6\), \(7\), \(8\), \(9\), \(10\)

\(3\) 番目と \(4\) 番目の平均をとって、中央値は

 \(\displaystyle\frac{7+8}{2}=7.5\) (点)

データの代表値

平均値 \(\overline{x}\)

大きさ \(n\) のデータの値を \(x_1\), \(x_2\), \(\cdots\), \(x_n\) とするとき

\(\overline{x}=\displaystyle\frac{1}{n}(x_1+x_2+\cdots +x_n)\)

中央値(メジアン)

データを値の大き沙の順に並べたとき、中央の位置にくる値。

最頻値(モード)

データが度数分布表に整理されているときは、度数が最も大きい階級の階級値を最頻値とする。

データの代表値の例題

(例題)

次のデータは、\(11\) 人の、\(10\) 点満点のテストの結果である。

\(5\), \(7\), \(8\), \(5\), \(9\), \(7\), \(9\), \(9\), \(4\), \(8\), \(6\)(単位は点)

(1) 平均値を求めよ
(2) 中央値を求めよ
(3) 最頻値を求めよ

(1)

\(\displaystyle\frac{1}{11}(5+7+8+5+9+7+9+9+4+8+6)=7\)

(2)

データを大きい順に並べると、

\(4\), \(5\), \(5\), \(6\), \(7\), \(7\), \(8\), \(8\), \(9\), \(9\), \(9\)(単位は点)

データの大きさが奇数より中央値は \(7\)

(3)

データを大きい順に並べると、

\(4\), \(5\), \(5\), \(6\), \(7\), \(7\), \(8\), \(8\), \(9\), \(9\), \(9\)(単位は点)

よって、最頻値は \(9\)

理系大学レベル別おすすめ数学テキスト
>>

データの散らばりと四分位範囲

範囲

データの最大値と最小値の差。

四分位数

データを大きさの順に並べたとき、\(4\) 等分する位置にくる \(3\) つの値。小さい方から、第 \(1\) 四分位数、第 \(2\) 四分位数、第 \(3\) 四分位数といい、これらを順に \(Q_1\), \(Q_2\), \(Q_3\) で表す。第 \(2\) 四分位数は中央値である。

四分位数範囲、四分位偏差

四分位範囲:\(Q_3-Q_1\)
四分位偏差:\(\displaystyle\frac{Q_3-Q_1}{2}\)

箱ひげ図

データの最小値、第 \(1\) 四分位数、中央値、第 \(3\) 四分位数、最大値を箱と線(ひげ)で表現する図。なお、平均値を記入することもある。

データの散らばりと四分位範囲の例題

(例題)

次のデータは、\(10\) 人の \(7\) 日間の勉強時間の合計を調べたものである。

\(5\), \(15\), \(17\), \(11\), \(18\), \(22\), \(12\), \(9\), \(14\), \(4\)(単位は時間)

(1) データの範囲を求めよ。
(2) データの第 \(1\) 四分位数 \(Q_1\), 第 \(2\) 四分位数 \(Q_2\), 第 \(3\) 四分位数 \(Q_3\) を求めよ。
(3) データの四分位範囲、四分位偏差を求めよ。

データを大きい順に並び替えると

\(4\), \(5\), \(9\), \(11\), \(12\), \(14\), \(15\), \(17\), \(18\), \(22\)(単位は時間)

(1)

よって、\(22-4=18\)

(2)

第 \(1\) 四分位数:\(9\)
第 \(2\) 四分位数:\(13\)
第 \(3\) 四分位数:\(17\)

(3)

四分位範囲:\(13-9=4\)

四分位偏差:\(\displaystyle\frac{13-9}{2}=2\)

おわりに

さいごまで記事を読んでいただきありがとうございました!

「30分で集中力が切れてしまう方へ」

勉強の集中力UPのために

子供に集中して宿題をさせるために

会議やプレゼンのタイムマネジメントのために

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

質問や感想はコメントへ!

コメントする

目次