Q&Aでわかるデータ分析(No.2 標準偏差)

Q&Aでわかるデータ分析

【Q】
標準偏差って何?

【A】
標準偏差とは、データの「ばらつきの大きさ」を表す指標です。
平均だけではデータの特徴は見えてこないことがあります。たとえば、平均が同じでも、それぞれの値が平均からどれくらい離れているかによって、データの印象はまったく変わります。


標準偏差は「ばらつきのものさし」

たとえば、以下の2つのクラスのテスト結果を見てみましょう。

  • クラスA:70点、70点、70点、70点、70点
  • クラスB:40点、60点、70点、80点、100点

どちらも平均は70点です。でも、クラスAは全員が70点で安定しています。一方クラスBは点数がバラバラです。この「バラバラ具合(ばらつき)」を数値で表すのが、標準偏差です。


どうやって計算するの?

標準偏差は以下の流れで求められます。

  1. 平均を求める
  2. それぞれの値と平均の差(偏差)を出す
  3. その差を2乗して足し合わせる(分散)
  4. 最後に平方根をとる → これが標準偏差!

数式にすると少し難しく見えますが、Excelならすぐに求められます。


Excelでの計算方法

Excelでは、以下の関数を使って標準偏差を求めます。

  • =STDEV.P() → 母集団すべてを使うとき
  • =STDEV.S() → 標本(データの一部)を使うとき(通常はこちらを使うことが多いです)

たとえば、セルA1~A5にデータが入っている場合は、

STDEV.S(A1:A5)

と入力すれば、すぐに結果が出ます。


標準偏差の見方

標準偏差が小さい → 平均値の近くにデータが集まっている(安定している)
標準偏差が大きい → 平均から離れているデータが多い(ばらつきが大きい)

たとえば、毎日の売上が平均5万円で、標準偏差が2万円だったら、3万〜7万円くらいまでバラついていることになります。

逆に、標準偏差が5000円だったら、ほとんどの日が4.5万〜5.5万円の範囲内に収まっているというイメージです。


どんなときに使うの?

標準偏差は、こんな場面で役立ちます。

  • 商品の売上の安定性を知りたいとき
  • テストの点数のバラつきを見たいとき
  • 顧客の購入金額の幅を確認したいとき

単に「平均」だけを見るよりも、「どれだけ差があるのか」を見ることで、現実的な判断ができます。


まとめ

標準偏差は「データのばらつき」を表す指標で、平均だけではわからないデータの特徴をつかむことができます。
なかなか標準偏差の説明をするのは私には表現が難しいですが、テストでいうと、データのばらつきが少ない場合は、「みんなが平均点と同じくらいの点数を取っている」ということになります。
Excelの関数で簡単に求められるので、まずは手元のデータで試してみてください!

標準偏差について、詳しく別の記事(標準偏差と分散とは?データのばらつきをExcelで分析する)で説明していますので、ご覧ください。

コメント

タイトルとURLをコピーしました