正規分布とは?Excelでヒストグラムを作成して分布を見てみよう

Excelによるデータ分析

「このデータ、偏ってないかな?」
「平均的って、どうやって判断すればいいんだろう?」

Excelを使ってデータを整理したりグラフを作ったりしていると、ふとそんな疑問が湧くことがあります。
私自身も、数値は並べられるけど「分布の形」までは意識していなかったひとりです。

この記事では、そんな方に向けて「正規分布って何?」という基本から、
Excelでヒストグラムを作って分布を視覚的に確認する方法をわかりやすく解説します。

スクリーンショット付きで、手順も丁寧に紹介しているので、
「Excelがちょっと苦手…」という方でも安心して読み進められます。

ぜひ、あなたの業務や学習のヒントとして活用してみてください。

1. 正規分布とは?

正規分布(Normal Distribution) とは、データの分布が左右対称の「ベル型(ガウス曲線)」を描く形のことを指します。以下のような特徴があります。

正規分布の特徴

  • 左右対称:平均値を中心に、データが均等に分布する。
  • 平均値・中央値・最頻値が一致:すべての中心が同じです。
  • 標準偏差による分布
    • 平均 ± 1σ にデータの 68% が含まれる。
    • 平均 ± 2σ にデータの 95% が含まれる。
    • 平均 ± 3σ にデータの 99.7% が含まれる。

例えば、試験の点数や身長などは正規分布に従うことが多いです。

2. Excelで正規分布を視覚化する方法

Excelを使って、データが正規分布に従っているかをヒストグラムを使って確認してみましょう。

手順1:データを準備する

まず、ランダムな数値データ(例:身長など)をExcelのA列に入力します。

手順2:ヒストグラムを作成する

  • データ範囲を選択(A列全体)
  • 「挿入」タブをクリック
  • 「グラフ」セクションから「ヒストグラム」を選択
  • グラフが自動生成される

これにより、データの分布が視覚的にわかるようになります。
さらに、グラフ要素を変更(タイトル変更など)することでより、わかりやすくなります。

3. Excelの関数を使って正規分布を計算する

NORM.DIST関数を使う

Excelの NORM.DIST 関数を使うと、特定の数値が正規分布のどの位置にあるかを計算できます。

=NORM.DIST(数値, 平均, 標準偏差, TRUE)

例えば、平均 50、標準偏差 10 のデータで、60 の値がどの確率に該当するかを求めるには、以下のようになります。

=NORM.DIST(60, 50, 10, TRUE)

標準正規分布(Zスコア)の計算

Zスコアとは、データが平均からどれだけ離れているかを表す値です。

=(A1 - 平均) / 標準偏差

これにより、各データが正規分布のどの位置にあるかを計算できます。

4. 正規分布の活用例

  • 試験の偏差値計算:偏差値は正規分布を基に算出される。
  • 品質管理:製品のばらつきを管理し、不良品を減らすために活用する。
  • マーケティング:顧客データの分布を分析し、ターゲットを絞る。

5. まとめ

  • 正規分布はデータ分析の基本概念であり、Excelで簡単に可視化できる。
  • ヒストグラムを使うことでデータの分布を直感的に理解できる。
  • ExcelのNORM.DIST関数やZスコアを活用すれば、より詳細な分析が可能です。

正規分布により、データの分布がよくわかります。右側に分布が偏っていたり、左側に分布が偏っていたり、正規分布をみるだけでも楽しめます。

正規分布を理解し、Excelを活用してデータ分析をより深めていきましょう!

コメント

タイトルとURLをコピーしました