Q&Aでわかるデータ分析(No.7 有意差)

Q&Aでわかるデータ分析

Q:「有意差がある」ってどういう意味?


A:

データ分析の話になるとよく出てくるのが「有意差があるかどうか」という表現です。
たとえば「この施策で売上に有意な差が見られた」などです。
でも実際、「有意差って何?」「ただの違いとどう違うの?」と感じる人も多いのではないでしょうか。


● 「違い」と「有意差」は別もの?

まず、「AとBで売上に違いがあった」というだけなら、数字が違えば“差”があるのは当たり前です。
でもその差が偶然なのか、本当に意味のある差なのかはまた別問題。

その「意味のある差かどうか」を調べる方法が、『有意差検定(hypothesis testing)』です。


● t検定とは?

有意差を検定する方法の一つに「t検定(ティーけんてい)」があります。
これは、2つのグループの平均に“差があるか”を判断するための手法です。

たとえばこんな場面で使います。

  • 新しい広告Aと従来広告Bで、どちらが売上に効果的か比べたい
  • 薬Aと薬Bで、どちらが症状の改善に効果があるかを検証したい

このとき、ただの平均の差を見るだけでは不十分で、その差が「偶然ではない」と言えるかどうかが重要になります。


● 「P値(ピーバリュー)」って?

t検定を使うと、「P値」という数値が出てきます。
このP値が、小さければ小さいほど「偶然ではなさそう」という判断になります。

一般的な基準は以下のとおりです。

P値の大きさ解釈
0.05未満有意差あり(偶然とは言いにくい)
0.05以上有意差なし(偶然の可能性あり)

つまり、「P値が0.03」なら、「3%の確率で偶然かもしれないが、97%は意味のある差だと考えられる」ということになります。


● Excelでの実行例(T.TEST関数)

Excelにもt検定を実行できる関数があります。
たとえば、A列とB列に2つのグループのデータがある場合:

T.TEST(A2:A21, B2:B21, 2, 3)

これは、

  • 「2」→両側検定(差があるか)
  • 「3」→対応のない2群(独立したグループ)
    という意味です。

結果としてP値が出るので、それが0.05未満なら「有意差あり」と判断できます。


● まとめ

用語意味
有意差偶然とは考えにくい、意味のある差のこと
t検定2つの平均値に有意差があるかを検定する手法
P値有意差があるかを判断する数値。0.05未満が目安

コメント

タイトルとURLをコピーしました