データの代表値(中央値)
今回は、中央値についての問題です。
突然ですが、\(1\), \(3\), \(6\), \(10\), \(24\) の真ん中の値はなに?と聞かれたら、\(6\) だと容易に答えることができますね?
これが中央値です。
中央値は、データの代表値の内の1つです。シンプルなようですが、問題になると厄介です。しっかりと理解して問題を解けるようにしましょう。
代表値とは
みなさんも学校で経験があるのではないでしょうか?
テストを返却するぞ〜
このときに、クラス全体の点数が他のクラスと比べてどうだったかを伝えるときに、
今回は、A が 62点で、B が87点で、C が24点で…
と全員分の点数は伝えないでしょう?全員分の点数を伝えると、
「80点以上が多いような気がする」「赤点が結構多いな」
というなんとなくのクラス全体の点数が把握できますが、非常に効率が悪いです。(そもそもプライバシーの侵害?笑)なので一般的には、
今回は、クラスの平均点は62点でした!
と全体を表す代表値を用いて伝えることが多いでしょう。このように、1つの値で複数のデータを表す際に代表値は用いられます。
平均値は代表値の代表例で、他にも中央値や最頻値が挙げられます。
平均値、中央値、最頻値
平均値 \(\bar{x}\)
大きさ \(n\) のデータの値を \(x_1\), \(x_2\), \(\cdots\), \(x_n\) とするとき、
\(\bar{x}=\displaystyle\frac{1}{n}(x_1+x_2+\cdots +x_n)\)
中央値(メジアン)
データを値の大きさの順に並べたとき、中央の位置にくる値。
〈データの大きさが奇数の場合〉
\(x_1\), \(x_2\), \(x_3\), \(x_4\), \(x_5\) の場合
(中央値)\(=x_3\) (ちょうど真ん中の値)
〈データの大きさが偶数の場合〉
\(x_1\), \(x_2\), \(x_3\), \(x_4\), \(x_5\), \(x_6\)
(中央値)\(\displaystyle\frac{x_3+x_4}{2}\)
最頻値(モード)
データにおいて最も個数の多い値。
データが度数分布表に整理されているときは、度数が最も大きい階級の階級値を最頻値とする。
中央値を用いた問題
学生 \(9\) 人を対象に試験を行った結果、それぞれ\(50\), \(57\), \(60\), \(42\), \(x\), \(73\), \(80\), \(35\), \(68\) 点だった。\(0\) 以上 \(100\) 以下の整数 \(x\) の値がわからないとき、このデータの中央値として何通りの値がありうるか。
>>詳細はこちらから
答案の例
\(x\) 以外の値を小さい順に並べると、
\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)
\(x\) は \(0\leq x\leq 100\) なので、\(x\) を \(0\) から大きくしながら場合分けをしていきます。
[1] \(0\leq x\leq 56\) のとき、中央値は (57\)
[2] \(x=57\) のとき、中央値は \(57\)
[3] \(57<x<60\) のとき、中央値は \(x\)
[4] \(x=60\) のとき、中央値は \(60\)
[5] \(x>60\) のとき、中央値は \(60\)
[1]〜[5] より、中央値は、\(57\), \(x\), \(60\) となる。
\(57<x<60\) より中央値は、\(57\), \(58\), \(59\), \(60\) なので、\(4\) 通り
解説
中央値は、データの大きさ(個数)によって、求め方が異なります。
今回のデータの大きさ(データの個数)は、\(9\) なので、中央値は \(5\) 番目の数字になります。
\(x\) 以外の値を小さい順に並べると、
\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)
\(x\) は \(0\leq x\leq 100\) なので、\(x\) を \(0\) から大きくしながら場合分けをしていきます。
[1] \(0\leq x\leq 56\) のとき
\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)
左側に \(x\) が配置されるので、中央値は、\(57\)
[2] \(x=57\) のとき
\(35\), \(42\), \(50\), \(57\), \(57\), \(60\), \(68\), \(73\), \(80\)
中央値は、\(57\)
[3] \(57<x<60\) のとき
\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)
この間に \(x\) が配置されるので、中央値は、\(x\)
[4] \(x=60\) のとき
\(35\), \(42\), \(50\), \(57\), \(60\), \(60\), \(68\), \(73\), \(80\)
中央値は、\(60\)
[5] \(x>60\) のとき
\(35\), \(42\), \(50\), \(57\), \(60\), \(68\), \(73\), \(80\)
左側に \(x\) が配置されるので、中央値は、\(60\)
[1]〜[5] より、中央値は、\(57\), \(x\), \(60\) となる。
\(57<x<60\) より中央値は、\(57\), \(58\), \(59\), \(60\) なので、\(4\) 通り
おわりに
今回は、中央値についての問題でした。
さいごまで読んでいただきありがとうございました!
【最新】こちらの記事がおすすめ!