メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー

【データの分析】『データの代表値と散らばり』まとめと例題

  • URLをコピーしました!

データの整理

度数分布表

階級:データの値の範囲を区切った区間。
階級の幅:階級としての区間の幅。
階級値:階級の真ん中の値。
度数:各階級に入るデータの個数。
度数分布表:各階級に度数を対応させた表。

相対度数分布表

相対度数:各階級の度数の全体に対する割合。
累積度数:各階級に対し、度数を最初の階級からその階級の値まで合計したもの。
累積相対度数:相対度数についての累積度数

ヒストグラム

度数分布表に整理された資料を柱状のグラフで表したもの。

データの整理の例題

(例題①)

次のデータは、ある月の A 市の毎日の最高気温の記録である。

20.7, 20.1, 14.5, 10.9, 12.1, 19.1, 16.3, 13.1, 14.6, 20.2
23.2, 14.3, 20.1, 17.4, 11.2, 7.4, 11.5, 16.5, 19.9, 18.1
25.5, 14.2, 10.1, 16.7, 16.7, 19.9, 15.7, 15.4, 23.4, 20.1
(単位は C

(1) 階級の幅を 2 C として、度数分布表を作れ。ただし、階級は 6C から区切り始めるものとする。
(2) (1) で作った度数分布表をもとにして、ヒストグラムをかけ。

解説

(1) 階級の区切り始めと階級の幅から、各階級に入るデータの数を数え、表にする。

階級度数
6 以上 8 未満1
8100
10124
12142
14166
16185
18204
20225
22242
24261
30

(2) (1) の度数分布表をもとに、柱状のグラフにして表す。ヒストグラムの各長方形の高さは、各階級の度数を表す。

(例題②)

次のデータは、A5 人、B6 人の、10 点満点のテストの結果である。

A 班:5, 7, 8, 4, 9
B 班:7, 10, 9, 4. 8, 6
(単位は点)

(1) A 班と B 班を合わせた 11 人のデータの平均値を求めよ。
(2) A 班のデータの中央値と B 班のデータの中央値をそれぞれ求めよ。

解説

(1) A のデータの平均値は

 15(5+7+8+4+9)=335=6.6 (点)

B のデータの平均値は

 15(7+10+9+4+8+6)=446=7.333
 よって、約 7.3 (点)

(2) A 班のデータを小さい方から順に並べると

 4, 5, 7, 8, 9

3 番目が中央値であるから 7

B 班のデータを小さい方から順に並べると

 4, 6, 7, 8, 9, 10

3 番目と 4 番目の平均をとって、中央値は

 7+82=7.5 (点)

データの代表値

平均値 x

大きさ n のデータの値を x1, x2, , xn とするとき

x=1n(x1+x2++xn)

中央値(メジアン)

データを値の大き沙の順に並べたとき、中央の位置にくる値。

最頻値(モード)

データが度数分布表に整理されているときは、度数が最も大きい階級の階級値を最頻値とする。

データの代表値の例題

(例題)

次のデータは、11 人の、10 点満点のテストの結果である。

5, 7, 8, 5, 9, 7, 9, 9, 4, 8, 6(単位は点)

(1) 平均値を求めよ
(2) 中央値を求めよ
(3) 最頻値を求めよ

(1)

111(5+7+8+5+9+7+9+9+4+8+6)=7

(2)

データを大きい順に並べると、

4, 5, 5, 6, 7, 7, 8, 8, 9, 9, 9(単位は点)

データの大きさが奇数より中央値は 7

(3)

データを大きい順に並べると、

4, 5, 5, 6, 7, 7, 8, 8, 9, 9, 9(単位は点)

よって、最頻値は 9

データの散らばりと四分位範囲

範囲

データの最大値と最小値の差。

四分位数

データを大きさの順に並べたとき、4 等分する位置にくる 3 つの値。小さい方から、第 1 四分位数、第 2 四分位数、第 3 四分位数といい、これらを順に Q1, Q2, Q3 で表す。第 2 四分位数は中央値である。

四分位数範囲、四分位偏差

四分位範囲:Q3Q1
四分位偏差:Q3Q12

箱ひげ図

データの最小値、第 1 四分位数、中央値、第 3 四分位数、最大値を箱と線(ひげ)で表現する図。なお、平均値を記入することもある。

データの散らばりと四分位範囲の例題

(例題)

次のデータは、10 人の 7 日間の勉強時間の合計を調べたものである。

5, 15, 17, 11, 18, 22, 12, 9, 14, 4(単位は時間)

(1) データの範囲を求めよ。
(2) データの第 1 四分位数 Q1, 第 2 四分位数 Q2, 第 3 四分位数 Q3 を求めよ。
(3) データの四分位範囲、四分位偏差を求めよ。

データを大きい順に並び替えると

4, 5, 9, 11, 12, 14, 15, 17, 18, 22(単位は時間)

(1)

よって、224=18

(2)

1 四分位数:9
2 四分位数:13
3 四分位数:17

(3)

四分位範囲:139=4

四分位偏差:1392=2

おわりに

さいごまで読んでいただきありがとうございました!

『統計の扉』で書いている記事

  • 高校数学の解説
  • 公務員試験の数学
  • 統計学(統計検定2級レベル)

ぜひご覧ください!

数学でお困りの方は、コメントやXでご連絡ください。(Xはこちら

私自身、数学が得意になれたのはただ運が良かったんだと思っています。たまたま親が通塾させることに積極的だったり、友達が入るって理由でそろばんに入れたり、他の科目が壊滅的だったおかげで数学が(相対的に)得意だと勘違いできたり。

”たまたま”得意になれたこの恩を、今数学の学習に困っている人に還元できたらなと思っています。お金は取りません。できる限り(何百人から連絡が来たら難しいかもですが…)真摯に向き合おうと思っていますのでオアシスだと思ってご連絡ください。

  • URLをコピーしました!