メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー

【データの分析】『分散』データAの分散とデータBの分散から全体データの分散を求める問題

  • URLをコピーしました!

2つの分散から1つの分散を求める

今回は、2つのグループの平均値と分散が与えられているとき、その2つを合わせた全体集合の平均値を分散を求める問題です。

平均値は代表値の1つであり、分散はデータの散らばりを表しています。データの散らばりを計算する方法はいくつか種類がありますが、その中でも分散は、各データが平均値からどれくらい離れているか(散らばっているか)を表す値です。

代表値を扱った問題にチャレンジしてみたい方はこちらをチェック

平均値と分散/標準偏差

大きさ n のデータの値を x1, x2, , xn とするとき、

x¯=1n(x1+x2++xn)

大きさ n のデータの値を x1, x2, , xn とするとき、

分散 s2

 s2=1n{(x1x¯)2+(x2x¯)2++(xnx¯)2}

また、s2=x2¯(x¯)2 で計算できる。

標準偏差 s

  s=1n{(x1x¯)2+(x2x¯)2++(xnx¯)2}=x2¯(x¯)2

分散や標準偏差の計算が不安な方はこちらをチェック!

分散と標準偏差の違いがピンとこない方はこちらをチェック!

平均値・分散の問題

ある集団はAとBの2つのグループで構成されている。データを集計したところ、それぞれのグループの個数、平均値、分散は右の表のようになった。このとき、集合全体の平均値と分散を求めよ。

グループ個数平均値分散
A201624
B601228

平均値・分散の問題(答案の例)

 グループ A の総和は、16×20=320
 グループ B の総和は、12×60=720

したがって、全データの総和は、320+720=1040 。以上のことから平均を求める。

1040÷80=104080=13

グループ A の変量を a でデータの値を、

 a1, a2, , a20

グループ B の変量を b でデータの値を、

 b1, b2, , b60

とおき、それぞれの分散を sa, sb とおくと、sa=a2¯(a¯)2 より

a2¯=sa+(a¯)2=24+162=280

ここで、a2¯=120(a12+a22++a202) より

a12+a22++a202=280×20=5600

同様にして、sb=b2¯(b¯)2 より

 b2¯=sb+(b¯)2=28+122=172

ここで、b2¯=160(b12+b22++b602) より

b12+b22++b602=172×60=10320

以上のことから、

a12+a22++a202+b12+b22++b602=5600+10320

よって、

180×(a12+a22++a202+b12+b22++b602)=180×(5600+10320)=5600+1032080=70+129=199

したがって、199169=30(分散)

平均値・分散の問題(解説)

データの総和は、(平均値)×(個数)で求めることが出来る。

よって、

 グループ A の総和は、16×20=320
 グループ B の総和は、12×60=720

したがって、全データの総和は、320+720=1040。以上のことから平均を求める。

1040÷80=104080=13

また、全体の分散は、全体のデータの変量を x とすると、

 (分散)=x2¯(x¯)2

となる。

(x¯)2=132=169 なので、x2¯ を求める必要がある。

x2¯=180(x12+x22++x802)

と表すこともできる。

勝手に文字を出現させられないので、各文字の説明をしながら問題を解き進めて行きましょう!

グループ A の変量を a でデータの値を、

 a1, a2, , a20

グループ B の変量を b でデータの値を、

 b1, b2, , b60

とおくと、

x12+x22++x802=a12+a22++a202+b12+b22++b602

と表すことができる。それぞれの分散を sa, sb とおくと、sa=a2¯(a¯)2 より

a2¯=sa+(a¯)2=24+162=280

ここで、a2¯=120(a12+a22++a202) より

a12+a22++a202=280×20=5600

同様にして、sb=b2¯(b¯)2 より

b2¯=sb+(b¯)2=28+122=172

ここで、b2¯=160(b12+b22++b602) より

b12+b22++b602=172×60=10320

以上のことから、

x12+x22++x802=a12+a22++a202+b12+b22++b602=5600+10320

よって、※ に当てはめると、

x2¯=180×(5600+10320)=5600+1032080=70+129=199

したがって、(分散)=x2¯(x¯)2に当てはめると、199169=30(分散)

おわりに

今回は、2つのグループの平均値と分散が与えられているとき、その2つを合わせた全体集合の平均値を分散を求める問題でした。

さいごまで読んでいただきありがとうございました!

『統計の扉』で書いている記事

  • 高校数学の解説
  • 公務員試験の数学
  • 統計学(統計検定2級レベル)

ぜひご覧ください!

数学でお困りの方は、コメントやXでご連絡ください。(Xはこちら

私自身、数学が得意になれたのはただ運が良かったんだと思っています。たまたま親が通塾させることに積極的だったり、友達が入るって理由でそろばんに入れたり、他の科目が壊滅的だったおかげで数学が(相対的に)得意だと勘違いできたり。

”たまたま”得意になれたこの恩を、今数学の学習に困っている人に還元できたらなと思っています。お金は取りません。できる限り(何百人から連絡が来たら難しいかもですが…)真摯に向き合おうと思っていますのでオアシスだと思ってご連絡ください。

  • URLをコピーしました!