データ分析を行う際に、平均値・中央値・最頻値という指標をよく使います。
しかし、それぞれの意味や違いを正しく理解しないと、誤った判断をしてしまう可能性があります。
この記事では、これらの指標の違いをわかりやすく解説し、Excelで簡単に計算する方法を紹介します。
1. 平均値・中央値・最頻値とは?
1.1 平均値
平均とは、すべてのデータの合計をデータ数で割った値です。
例えば、データが 60, 70, 80, 90, 100 の場合、 80 が平均値です。
Excelで平均を求めるには、AVERAGE関数 を使います。
1.2 中央値
中央値とは、データを小さい順に並べたときにちょうど中央に位置する値です。
例えば、データが 60, 70, 80, 90, 100 の場合、真ん中の 80 が中央値です。
データの個数が偶数の場合は、中央の2つの値の平均を取ります。
Excelで中央値を求めるには、MEDIAN関数 を使います。
1.3 最頻値
最頻値とは、データの中で最も頻繁に出現する値です。
例えば、データが 60, 70, 80, 80, 90, 100 の場合、最頻値は 80 です(80が2回出現しているため)。
Excelで中央値を求めるには、MODE.SNGL関数 を使います。
2. 平均・中央値・最頻値の違いと使い分け
指標 | 使い方 | 例 |
---|---|---|
平均 | データの全体的な傾向を把握するのに適している | 社員の平均給与を求める |
中央値 | 外れ値(極端に大きい/小さい値)の影響を受けにくい | 家賃の中央値を調べる(極端に高い物件の影響を受けない) |
最頻値 | よく出現する値を知りたい場合に使う | 一番売れている商品の価格帯を知る |
例えば、ある会社の社員の年収データが 300万円、350万円、400万円、500万円、2000万円 だったとします。
- 平均 は 710万円(= (300+350+400+500+2000) / 5)となりますが、2000万円の影響で実態とかけ離れています。
- 中央値 は 400万円 となり、より一般的な水準を表します。
- 最頻値 は、すべての値が異なるため、存在しません。
3. Excelでの計算方法
Excelを使えば、これらの値を簡単に計算できます。
平均値=AVERAGE(A1:A5)
中央値=MEDIAN(A1:A5)

最頻値=MODE.SNGL(A1:A5)

それぞれ計算式を入力して、Enterを押します。
結果は以下のとおりです。

まとめ
- 平均値 はデータ全体の傾向を示しますが、外れ値の影響を受けやすいです。
- 中央値 は外れ値の影響を受けにくく、データの「真ん中」の値を示します。
- 最頻値 は最も頻繁に出現する値を示し、人気のある価格帯などを分析するのに便利です。
- Excelの関数(AVERAGE, MEDIAN, MODE.SNGL)を使えば、簡単に計算できます。
日頃、私たちがよく使うのは平均だと思います。しかし、統計を勉強してみると、平均以外にも、中央値や最頻値などあまり目にしませんが、大事な指標であることがわかります。
使い分けをするのはなかなか難しいですが、伝える内容に合わせて使い分けしてください。
コメント