メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー
統計学初学者サポートこちらをクリック

【データの分析】『中央値』代表値とは?データ分析の基本!中央値がとりうる値

目次

データアナリストへの道

少し数字に強い理系大学卒から駆け出しデータアナリストになるまでに、実際に読んだ50冊以上の本から厳選して、基本的な理論から実践的スキルまでを身につけられるようにデータ分析初学者向けにまとめました。>>記事を読む

データの代表値(中央値)

今回は、中央値についての問題です。

突然ですが、\(1\), \(3\), \(6\), \(10\), \(24\) の真ん中の値はなに?と聞かれたら、\(6\)  だと容易に答えることができますね?

これが中央値です。

中央値は、データの代表値の内の1つです。シンプルなようですが、問題になると厄介です。しっかりと理解して問題を解けるようにしましょう。

代表値とは

データの代表値とは、データ全体の特徴を適当な1つの数値で表すときの値のことです。

みなさんも学校で経験があるのではないでしょうか?

テストを返却するぞ〜

このときに、クラス全体の点数が他のクラスと比べてどうだったかを伝えるときに、

今回は、A が 62点で、B が87点で、C が24点で…

と全員分の点数は伝えないでしょう?全員分の点数を伝えると、

「80点以上が多いような気がする」「赤点が結構多いな」

というなんとなくのクラス全体の点数が把握できますが、非常に効率が悪いです。(そもそもプライバシーの侵害?笑)なので一般的には、

今回は、クラスの平均点は62点でした!

と全体を表す代表値を用いて伝えることが多いでしょう。このように、1つの値で複数のデータを表す際に代表値は用いられます。

平均値は代表値の代表例で、他にも中央値や最頻値が挙げられます。

平均値、中央値、最頻値

平均値 \(\bar{x}\)

大きさ \(n\) のデータの値を \(x_1\), \(x_2\), \(\cdots\), \(x_n\) とするとき、

\(\bar{x}=\displaystyle\frac{1}{n}(x_1+x_2+\cdots +x_n)\)

中央値(メジアン)

データを値の大きさの順に並べたとき、中央の位置にくる値。

〈データの大きさが奇数の場合〉

\(x_1\), \(x_2\), \(x_3\), \(x_4\), \(x_5\) の場合

(中央値)\(=x_3\) (ちょうど真ん中の値)

〈データの大きさが偶数の場合〉

\(x_1\), \(x_2\), \(x_3\), \(x_4\), \(x_5\), \(x_6\)

(中央値)\(\displaystyle\frac{x_3+x_4}{2}\)

最頻値(モード)

データにおいて最も個数の多い値。

データが度数分布表に整理されているときは、度数が最も大きい階級の階級値を最頻値とする。

中央値を用いた問題

学生 \(9\) 人を対象に試験を行った結果、それぞれ\(50\), \(57\), \(60\), \(42\), \(x\), \(73\), \(80\), \(35\), \(68\) 点だった。\(0\) 以上 \(100\) 以下の整数 \(x\) の値がわからないとき、このデータの中央値として何通りの値がありうるか。

答案の例

\(x\) 以外の値を小さい順に並べると、

\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)

\(x\) は \(0\leq x\leq 100\) なので、\(x\) を \(0\) から大きくしながら場合分けをしていきます。

[1] \(0\leq x\leq 56\) のとき、中央値は (57\)

[2] \(x=57\) のとき、中央値は \(57\)

[3] \(57<x<60\) のとき、中央値は \(x\)

[4] \(x=60\) のとき、中央値は \(60\)

[5] \(x>60\) のとき、中央値は \(60\)

[1]〜[5] より、中央値は、\(57\), \(x\), \(60\) となる。

\(57<x<60\) より中央値は、\(57\), \(58\), \(59\), \(60\) なので、\(4\) 通り

解説

中央値は、データの大きさ(個数)によって、求め方が異なります。

今回のデータの大きさ(データの個数)は、\(9\) なので、中央値は \(5\) 番目の数字になります。

\(x\) 以外の値を小さい順に並べると、

\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)

\(x\) は \(0\leq x\leq 100\) なので、\(x\) を \(0\) から大きくしながら場合分けをしていきます。

[1] \(0\leq x\leq 56\) のとき

\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)
左側に \(x\) が配置されるので、中央値は、\(57\)

[2] \(x=57\) のとき

\(35\), \(42\), \(50\), \(57\), \(57\), \(60\), \(68\), \(73\), \(80\)
中央値は、\(57\)

[3] \(57<x<60\) のとき

\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)
この間に \(x\) が配置されるので、
中央値は、\(x\)

[4] \(x=60\) のとき

\(35\), \(42\), \(50\), \(57\), \(60\), \(60\), \(68\), \(73\), \(80\)
中央値は、\(60\)

[5] \(x>60\) のとき

\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)
左側に \(x\) が配置されるので、中央値は、\(60\)

[1]〜[5] より、中央値は、\(57\), \(x\), \(60\) となる。

\(57<x<60\) より中央値は、\(57\), \(58\), \(59\), \(60\) なので、\(4\) 通り

おわりに

今回は、中央値についての問題でした。

さいごまで読んでいただきありがとうございました!

このブログは統計学を学びたい学生/社会人向けに記事を書いています。

【最新】こちらの記事がおすすめ!

>>

  • URLをコピーしました!
目次