Q&Aでわかるデータ分析(No.4 相関係数)

Q&Aでわかるデータ分析

Q1. 相関係数ってなんですか?

A1.
相関係数とは、2つのデータの間に「どれくらい関係があるか」を示す数値です。
たとえば「気温が上がるとアイスの売上が増える」ような関係を数値で表します。
値の範囲は -1から+1 で、以下のような意味になります。

  • +1 に近い → 強い正の関係(片方が増えると、もう片方も増える)
  • 0 に近い → 関係がない
  • -1 に近い → 強い負の関係(片方が増えると、もう片方は減る)

Q2. どうやって計算するんですか?

A2.
相関係数(ピアソンの積率相関係数)は、以下のような式で計算されます。

とはいえ、実務では Excelや統計ソフトで一発で計算できるので、式を覚えるよりは使い方を知ることが大切です。
(Excelでは =CORREL(範囲1, 範囲2) という関数で計算できます)


Q3. 実際の例を教えてください!

A3.
たとえば、以下のような「気温」と「アイス売上」のデータがあったとします。

曜日気温(℃)アイス売上(個)
25100
27120
30150
28130
26110

この2列の相関係数をExcelで求めると「1」になります。
これは、気温が高いほどアイスが売れるという、非常に強い正の相関があるという意味です。


Q4. 相関係数が高ければ、必ず因果関係があるんですか?

A4.
いいえ、相関がある=因果関係があるとは限りません。
たとえば「かき氷の売上」と「日焼け止めの売上」も相関が高いかもしれませんが、これは「暑い日」という共通の原因があるだけで、お互いに影響しあっているわけではありません。

相関はあくまで「一緒に動いているかどうか」を見るだけなので、「なぜそうなるか」は別に考える必要があります。


Q5. 相関係数を使うと、どんなことに役立ちますか?

A5.
以下のような場面で役立ちます。

  • 売上と広告費の関係を見て、効果がありそうな施策を探る
  • 生徒の勉強時間とテストの点数の関係を見て、成績向上のヒントを得る
  • 気象データと商品売上を組み合わせて、需要予測に活かす

つまり、相関係数は「仮説を立てるヒント」や「データのつながりを見つける手がかり」として、とても便利なんです✨
私はデータ分析をしていて、相関を探るのがとても好きです。
「あっ、こんなものどうしに関係があるんだ~不思議だなあ!」ってよく思います。


まとめ

  • 相関係数は、2つのデータの関係性を数値で表す指標です
  • 値は -1〜+1の範囲で、±1に近いほど関係が強いです
  • 高い相関があっても、必ずしも因果関係があるわけではないです
  • 実務では =CORREL() を使えば簡単に求められます
  • 「何かと何かが関係してそう…」と思ったら、まず相関係数で確認してみましょう

相関係数について、詳しく別の記事(相関係数とは?Excelでデータの関係性を見抜く)で説明していますので、ご覧ください。

コメント

タイトルとURLをコピーしました