データ分析を行う際に、データがどのように分布しているかを知ることは非常に重要です。その中でも「正規分布」は、統計学やビジネス分析で頻繁に登場する概念です。本記事では、正規分布の基本を理解し、Excelを使ってヒストグラムを作成し、データの分布を視覚的に分析する方法を解説します。
1. 正規分布とは?
正規分布(Normal Distribution) とは、データの分布が左右対称の「ベル型(ガウス曲線)」を描く形のことを指します。以下のような特徴があります。
正規分布の特徴
- 左右対称:平均値を中心に、データが均等に分布する。
- 平均値・中央値・最頻値が一致:すべての中心が同じです。
- 標準偏差による分布:
- 平均 ± 1σ にデータの 68% が含まれる。
- 平均 ± 2σ にデータの 95% が含まれる。
- 平均 ± 3σ にデータの 99.7% が含まれる。
例えば、試験の点数や身長などは正規分布に従うことが多いです。
2. Excelで正規分布を視覚化する方法
Excelを使って、データが正規分布に従っているかをヒストグラムを使って確認してみましょう。
手順1:データを準備する
まず、ランダムな数値データ(例:テストの点数など)をExcelのA列に入力します。
手順2:ヒストグラムを作成する
- 「挿入」タブをクリック
- 「グラフ」セクションから「ヒストグラム」を選択
- データ範囲を選択(A列全体)
- グラフが自動生成される
これにより、データの分布が視覚的にわかるようになります。
3. Excelの関数を使って正規分布を計算する
NORM.DIST関数を使う
Excelの NORM.DIST
関数を使うと、特定の数値が正規分布のどの位置にあるかを計算できます。
=NORM.DIST(数値, 平均, 標準偏差, TRUE)
例えば、平均 50、標準偏差 10 のデータで、60 の値がどの確率に該当するかを求めるには、以下のようになります。
=NORM.DIST(60, 50, 10, TRUE)
標準正規分布(Zスコア)の計算
Zスコアとは、データが平均からどれだけ離れているかを表す値です。
=(A1 - 平均) / 標準偏差
これにより、各データが正規分布のどの位置にあるかを計算できます。
4. 正規分布の活用例
- 試験の偏差値計算:偏差値は正規分布を基に算出される。
- 品質管理:製品のばらつきを管理し、不良品を減らすために活用する。
- マーケティング:顧客データの分布を分析し、ターゲットを絞る。
5. まとめ
- 正規分布はデータ分析の基本概念であり、Excelで簡単に可視化できる。
- ヒストグラムを使うことでデータの分布を直感的に理解できる。
- ExcelのNORM.DIST関数やZスコアを活用すれば、より詳細な分析が可能です。
正規分布により、データの分布がよくわかります。右側に分布が偏っていたり、左側に分布が偏っていたり、正規分布をみるだけでも楽しめます。
正規分布を理解し、Excelを活用してデータ分析をより深めていきましょう!
コメント