Q:「有意差がある」ってどういう意味?
A:
データ分析の話になるとよく出てくるのが「有意差があるかどうか」という表現です。
たとえば「この施策で売上に有意な差が見られた」などです。
でも実際、「有意差って何?」「ただの違いとどう違うの?」と感じる人も多いのではないでしょうか。
● 「違い」と「有意差」は別もの?
まず、「AとBで売上に違いがあった」というだけなら、数字が違えば“差”があるのは当たり前です。
でもその差が偶然なのか、本当に意味のある差なのかはまた別問題。
その「意味のある差かどうか」を調べる方法が、『有意差検定(hypothesis testing)』です。
● t検定とは?
有意差を検定する方法の一つに「t検定(ティーけんてい)」があります。
これは、2つのグループの平均に“差があるか”を判断するための手法です。
たとえばこんな場面で使います。
- 新しい広告Aと従来広告Bで、どちらが売上に効果的か比べたい
- 薬Aと薬Bで、どちらが症状の改善に効果があるかを検証したい
このとき、ただの平均の差を見るだけでは不十分で、その差が「偶然ではない」と言えるかどうかが重要になります。
● 「P値(ピーバリュー)」って?
t検定を使うと、「P値」という数値が出てきます。
このP値が、小さければ小さいほど「偶然ではなさそう」という判断になります。
一般的な基準は以下のとおりです。
P値の大きさ | 解釈 |
---|---|
0.05未満 | 有意差あり(偶然とは言いにくい) |
0.05以上 | 有意差なし(偶然の可能性あり) |
つまり、「P値が0.03」なら、「3%の確率で偶然かもしれないが、97%は意味のある差だと考えられる」ということになります。
● Excelでの実行例(T.TEST関数)
Excelにもt検定を実行できる関数があります。
たとえば、A列とB列に2つのグループのデータがある場合:
T.TEST(A2:A21, B2:B21, 2, 3)
これは、
- 「2」→両側検定(差があるか)
- 「3」→対応のない2群(独立したグループ)
という意味です。
結果としてP値が出るので、それが0.05未満なら「有意差あり」と判断できます。
● まとめ
用語 | 意味 |
---|---|
有意差 | 偶然とは考えにくい、意味のある差のこと |
t検定 | 2つの平均値に有意差があるかを検定する手法 |
P値 | 有意差があるかを判断する数値。0.05未満が目安 |
コメント