メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー

【データの分析】『データの修正』平均値・分散の変化

  • URLをコピーしました!

データの修正(平均値と分散)

今回はデータが修正された時に平均値・分散がどのように変化するのかを解説していきます。

解説する前に、使用する公式の確認をしましょう。大きさ n のデータの値を x1, x2, , xn とするとき、

平均値 x¯
 x¯=1n(x1+x2++xn)

分散 s2
 s2=1n{(x1x¯)2+(x2x¯)2++(xnx¯)2}
また、s2=x2¯(x¯)2 で計算できる。

データの修正の問題

次のデータは、ある都市のある年の月ごとの最高気温を並べたものである。

5, 4, 8, 12, 17, 24, 27, 28, 22, 30, 9, 6 (単位は C

(1) このデータの平均値を求めよ

(2) このデータの中で入力ミスが見つかった。30C となっている月の最高気温は正しくは 18C であった。この入力ミスを修正すると、このデータの平均値は修正前より何度減少するか。

(3) このデータの中で入力ミスが見つかった。正しくは 6C10C, 30C26C であった。この入力ミスを修正すると、このデータの平均値は(ア)し、分散は(イ)する。

(ア),(イ)に当てはまるものを次の ①, ②, ③ から選べ。

 ① 修正前より増加
 ② 修正前より減少
 ③ 修正前より一致

解説

(1) このデータの平均値を求めよ

112(5+4+8+12+17+24+27+28+22+30+9+6)
=112×192=16

(2) このデータの中で入力ミスが見つかった。30C となっている月の最高気温は正しくは 18C であった。この入力ミスを修正すると、このデータの平均値は修正前より何度減少するか。

平均値 =

平均値の変化はデータの総和の変化に注目。

データの総和は 12C 減少するから、データの平均値は修正前より

1212=1 (C) 減少する。

(別解)

30C18C に変更して再度平均値を計算することで求めることもできます。

112(5+4+8+12+17+24+27+28+22+18+9+6)
=112×180=15

(3) このデータの中で入力ミスが見つかった。正しくは 6C10C, 30C26C であった。この入力ミスを修正すると、このデータの平均値は(ア)し、分散は(イ)する。

(ア)

修正前:6C30C
修正後:10C26C

修正前と修正後を比べると、6+30=10+26 となるので、答えは ③

(別解)

修正後の値で再度平均値を計算することで求めることもできます。

6C10C 増加し、30C26C に減少するので、

112(5+4+8+12+17+24+27+28+22+26+9+10)

=112×192=16

(イ)ミスが起こった部分に着目し、偏差の2乗の和を計算してみる。

分散 = 2

分散の変化は偏差の 2 乗の総和の変化に注目。

修正前:(616)2+(3016)2=296
修正後:(1016)2+(2616)2=136

ゆえに、偏差の2乗の和は減少するから、分散は修正前より減少する。

よって、②

おわりに

今回は、データが修正された時の平均値・分散がどのように変化するのかを例題を使って解説してきました!

さいごまで読んでいただきありがとうございました!

『統計の扉』で書いている記事

  • 高校数学の解説
  • 公務員試験の数学
  • 統計学(統計検定2級レベル)

ぜひご覧ください!

数学でお困りの方は、コメントやXでご連絡ください。(Xはこちら

私自身、数学が得意になれたのはただ運が良かったんだと思っています。たまたま親が通塾させることに積極的だったり、友達が入るって理由でそろばんに入れたり、他の科目が壊滅的だったおかげで数学が(相対的に)得意だと勘違いできたり。

”たまたま”得意になれたこの恩を、今数学の学習に困っている人に還元できたらなと思っています。お金は取りません。できる限り(何百人から連絡が来たら難しいかもですが…)真摯に向き合おうと思っていますのでオアシスだと思ってご連絡ください。

  • URLをコピーしました!