活用テクニック2026年3月21日

一元配置分散分析(ANOVA)入門 — 3群以上の平均を同時に比較

一元配置分散分析(ANOVA)の仕組みをやさしく解説します。F統計量を用いて3群以上の平均値に差があるかを同時に検定する手法を学びましょう。

一元配置分散分析の概念図

一元配置分散分析(One-way ANOVA)は、3つ以上の群の平均値に統計的に有意な差があるかどうかを同時に検定する手法です。例えば「3つのマーケティング施策A・B・Cで売上に差はあるか?」「4種類の肥料で収穫量に違いはあるか?」といった、複数のグループを一度に比較したい場面で使います。

なぜt検定を繰り返してはいけないのか

3群を比較するとき、A対B、A対C、B対Cのように3回のt検定を行えばよいと思うかもしれません。しかし、検定を繰り返すとタイプIエラー(偶然の差を「有意な差」と判定する誤り)の確率が急増します。有意水準5%のt検定を3回行うと、少なくとも1回誤って有意と判定する確率は約14%にまで上がります。ANOVAは1回の検定で全群を同時に比較するため、この多重検定の問題を回避できます。

F統計量 — 群間のばらつきと群内のばらつきの比

ANOVAの検定統計量であるF値は、「群間の分散(各群の平均値がどれだけ散らばっているか)」を「群内の分散(各群の中でデータがどれだけ散らばっているか)」で割った値です。群間の分散が群内の分散に比べて十分に大きければ、「群ごとに平均が異なる」と結論づけます。F値が大きいほど、群間に差がある証拠が強いことを示します。

前提条件

ANOVAの前提条件は「各群のデータが正規分布に従う」「各群の分散が等しい(等分散性)」の2つです。正規性はShapiro-Wilk検定で、等分散性はLevene検定で確認できます。これらの前提が満たされない場合は、ノンパラメトリック版であるKruskal-Wallis検定を使いましょう。なお、ANOVAで有意な差が見つかった場合、「どの群間に差があるか」を特定するにはTukey HSDなどの事後検定が必要です。

Qast の EDA 機能では、カテゴリ変数と数値変数の関係分析時に自動でANOVAが実行されます。群が3つ以上ある場合、結果レポートにF統計量とp値が表示され、有意であれば事後検定の結果も併せて確認できます。

Qast を導入してみませんか?

導入のご相談やデモのご依頼は、お気軽にお問い合わせください。