メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

高校数学の解説や公務員試験問題の解説、データサイエンスについての記事を書いていきます!

「データサイエンス×教育」に興味があり、日々勉学に励んでいます。

少しでも役に立つ情報の発信をしていきますのでぜひ読んでください。

また、同志からのお声がけはとても励みになります。ぜひ、コメントやメール、SNS等でご連絡ください!
カテゴリー

【データの分析】『相関係数』相関係数の公式を覚える以上に知っておくべきこと

  • URLをコピーしました!

相関係数の覚え方

今回は、データの分析『相関係数』についてまとめました。

相関係数は、データの分析の後半に出てくる公式で、数学の公式の中だとトップクラスに複雑です…

変数 x, y の相関係数を求めたいとする。

()=(xy)(x)×(y)

しかし、仕組みを理解していれば少しだけ覚えるのが楽になるかもしれません!

さらに、この公式を覚えていなくても解ける問題もたくさんあります!今回の記事を通して公式を覚えるだけでなく他にも大切なことがあることを知ってもらえたらと思います!

相関係数とは

相関係数とは、2 つの事柄の関係性の度合い(強さ)を表したものです。

2 つの事柄を、x, y とおくと、関係性には、3 種類あります。

① 正の相関
x が増えると、y も増える。かつ、x が減ると、y も減る。
このとき、2 つの事柄は正の相関がある。」という。

② 負の相関
x が増えると、y は減る。かつ、x が減ると、y は増える。
このとき、2 つの事柄は負の相関がある。」という。

③ 相関なし
xy に相関はない。」という。

関係性の3つの種類を述べましたが、それだけでなく、それぞれどのくらいの関係性なのか?というのを数値で表すことでより具体的に関係性の強さを比べることができます!

相関係数の計算

2 つのデータ xy に対する相関係数の計算方法をまとめました。

 ()=(xy)(x)×(y)

こんな感じで、最初のうちは日本語を交えてざっくりと覚えておきましょう!

 xx1, x2, , xn
 yy1, y2, , yn

 x¯x の平均
 y¯y の平均

 Sxx の標準偏差
 Syy の標準偏差
 Sxyxy の共分散

ここら辺の文字設定は、問題文に用意されていたり、文字ではなく数値を入れる場合もあります!

このとき、相関係数 r は、

 r=SxySxSy

細かく書いてみると、

r=1n{(x1x¯)(y1y¯)+(x2x¯)(y2y¯)++(xnx¯)(yny¯)}1n{(x1x¯)2+(x2x¯)2+(xnx¯)2}1n{(y1y¯)2+(y2y¯)2+(yny¯)2}

r は、1r1 の範囲の値になり、これらの値は散布図とリンクさせて出題されることがあります。

相関係数の計算(例題)

次の表は、学生 5 名の身長 x (cm) と体重 y (kg) を測定した結果である。 xy の相関係数 r を求めよ。

ABCDE
身長 x (cm)181167173169165
体重 y (kg)7559636761

(解説)

x, y のデータの平均をそれぞれ x, y とすると、

 x=15(181+167+173+169+165)
  =171

 y=15(75+59+63+67+61)
  =65

公式はこちらなので、

r=1n{(x1x¯)(y1y¯)+(x2x¯)(y2y¯)++(xnx¯)(yny¯)}1n{(x1x¯)2+(x2x¯)2+(xnx¯)2}1n{(y1y¯)2+(y2y¯)2+(yny¯)2}

必要なパーツを表でまとめます!

xxyy(xx)2(yy)2(xx)(yy)
A1010100100100
B46163624
C22444
D22444
E64361624
160160140

よって、相関係数 r は、

 r=140160×160=140160=0.875

散布図と相関係数

あるクラスの 10 人の数学のテストについて、テストまでの勉強時間を横軸、テストの点数を縦軸と仮定した時の散布図を描いてみると、

例①)正の相関
【解釈】 時間をかければかけた分だけ、テストの点数が高い。

f:id:smohisano:20210715154013p:plain

例②)負の相関
【解釈】 時間をかければかけた分だけ、テストの点数が低い。

f:id:smohisano:20210715154302p:plain

例③)相関なし
【解釈】 時間とテストの点数になにも関係はない。

f:id:smohisano:20210715175541p:plain

このように、2 つの事柄の点を集めてみると、2 つの事柄の関係性を見ることができます。

今回の散布図に関しては、例①)が直感的に正しい気がしませんか?

実際は直感的にわかるものばかりではないので、散布図を描くことによって 2 つの事柄の関係性を知ることができます

学習手順〜公式を覚えることが重要ではない!〜

STEP
相関係数の 3 種類の関係性を知る

① 正の相関
② 負の相関
③ 相関なし

STEP
数値から相関の強さを判断する

r1 に近いほど、「正の相関が強い」
r1 に近いほど、「負の相関が強い」
r0 に近いほど、「相関がない」

STEP
公式をざっくりと知る

日本語も交えながらざっくりと知りましょう!

()=(xy)(x)×(y)

STEP
計算ができるようになる

数字を当てはめて計算できるようになる!

おわりに

今回は、相関係数について押さえたいポイントをまとめました。

相関係数は、2 つの変数を分析するときに使われる統計手法です。大学進学後も、理系大学、文系大学関わらず度々扱うことになりますのでしっかりと理解しておきましょう〜!

さいごまで読んでいただきありがとうございました!

『統計の扉』で書いている記事

  • 高校数学の解説
  • 公務員試験の数学
  • 統計学(統計検定2級レベル)

ぜひご覧ください!

数学でお困りの方は、コメントやXでご連絡ください。(Xはこちら

私自身、数学が得意になれたのはただ運が良かったんだと思っています。たまたま親が通塾させることに積極的だったり、友達が入るって理由でそろばんに入れたり、他の科目が壊滅的だったおかげで数学が(相対的に)得意だと勘違いできたり。

”たまたま”得意になれたこの恩を、今数学の学習に困っている人に還元できたらなと思っています。お金は取りません。できる限り(何百人から連絡が来たら難しいかもですが…)真摯に向き合おうと思っていますのでオアシスだと思ってご連絡ください。

  • URLをコピーしました!