データ分析において、「売上と広告費の関係」や「気温とアイスの売上」など、ある変数が別の変数にどのような影響を与えているか を分析することが重要です。これを行う統計手法の1つが 回帰分析(Regression Analysis) です。本記事では、回帰分析の基本を理解し、Excelを使って簡単に予測モデルを作成する方法を解説します。
1. 回帰分析とは?
回帰分析 とは、2つ以上の変数の関係性を数式で表し、将来の予測や傾向分析を行う統計手法です。
回帰分析の種類
種類 | 説明 |
---|---|
単回帰分析 | 1つの説明変数を使って目的変数を予測する(例:広告費 → 売上) |
重回帰分析 | 複数の説明変数を使って目的変数を予測する(例:広告費 + 口コミ評価 → 売上) |
例えば、「広告費を増やしたら売上は上がるのか?」を調べたい場合、広告費を 説明変数、売上を 目的変数 として回帰分析を行います。
2. Excelで回帰分析を実施する方法
Excelには、回帰分析を簡単に行う 「データ分析ツール」 があります。
データ分析ツールを使った回帰分析の手順
- データを準備
- A列:広告費(説明変数)
- B列:売上(目的変数)
- 「データ」タブ → 「データ分析」 をクリック
- 「回帰分析」を選択し、「OK」 をクリック
- 入力範囲を設定
- 入力Y範囲(目的変数):B1:B10
- 入力X範囲(説明変数):A1:A10
- 「出力オプション」を指定(新しいシートに出力)
- 「OK」をクリックすると回帰分析の結果を表示
3. 回帰分析の結果を読むポイント
Excelの回帰分析結果には多くの情報が含まれていますが、特に重要な項目を解説します。
(1) 決定係数(R²)
- R²の値が1に近いほど、予測モデルが精度が高い ことを示します。
- R² = 0.8 なら、「広告費が売上を80%説明できる」と解釈できます。
(2) 回帰係数
- 広告費の回帰係数が 5000 なら、「広告費を1万円増やすと、売上が5万円増える」と予測できます。
- Excelでは 「係数」列 に表示される。
(3) p値(有意性の確認)
- p値が 0.05未満 なら、「広告費は売上に統計的に有意な影響を与える」と判断できます。
4. 回帰分析の活用例
(1) 売上予測
- 例:「広告費を増やしたら、売上がどのくらい増えるか?」
- 活用方法:広告戦略の最適化に利用する。
(2) 商品価格と売上の関係分析
- 例:「価格を下げたら、売上は増えるのか?」
- 活用方法:価格戦略の意思決定に活用する。
(3) 従業員数と生産量の関係
- 例:「従業員を増やすと、生産量はどのくらい増えるか?」
- 活用方法:人員配置の最適化に利用する。
5. 回帰分析の注意点
(1) 外れ値の影響
- 極端な値(外れ値)があると、回帰分析の結果が歪む可能性がある。
- 事前に 箱ひげ図や散布図 で外れ値を確認する。
(2) 相関と因果関係の違い
- 相関関係があるからといって、必ずしも因果関係があるとは限らない。
- 例:「アイスの売上と日焼け止めの売上が相関している」→ 夏の影響が共通要因 である可能性がある。
(3) 説明変数の選び方
- 不要な変数を入れると、精度が低下することがある。
- 重回帰分析を行う際は、変数選択を慎重に行う。
まとめ
- 回帰分析は、2つ以上の変数の関係性を明らかにし、予測を行う手法です。
- Excelのデータ分析ツールを使えば、簡単に回帰分析を実施できる。
- 決定係数(R²)、回帰係数、p値を確認し、モデルの精度を評価する。
- 外れ値や因果関係に注意しながら、適切に活用することが重要です。
私が初めてWEBの無料講座でデータ分析をした時に、Excelで行う回帰分析がありました。いろいろと関係性を試してみて、こんな者同士で関係があるんだと驚いたことがありました。回帰分析を活用して、いろいろな関係性をみつけてみましょう!
コメント