活用テクニック2026年4月3日

MAE(平均絶対誤差)完全ガイド — 外れ値に強いロバストな誤差指標

「予測が平均的にいくらずれるか」を直感的に示す MAE。計算式・RMSE との違い・外れ値への頑健性・中央値回帰との関係を実例で解説します。

MAE(平均絶対誤差)の概念図

MAE(Mean Absolute Error / 平均絶対誤差)は、回帰モデルの予測誤差を評価する最も基本的な指標の一つです。「予測値が実際の値から平均的にどれだけずれているか」を、元のデータと同じ単位で直感的に示します。外れ値に対する頑健性が RMSE より高く、幅広い場面で信頼できる指標です。

MAE とは何か

MAE は Σ|yi - ŷi| / n で計算されます。yi は実際の値、ŷi は予測値、n はサンプル数です。各サンプルの誤差の絶対値を合計し、サンプル数で割った単純な平均です。値は 0 以上で、0 に近いほど良い予測です。

MAE の直感的な解釈

MAE は「予測がどれだけずれるか」の平均値そのものです。例えば、不動産価格予測で MAE = 300万円なら、「平均的に 300万円ずれる」ことを意味します。この直感的な解釈のしやすさが MAE の最大の利点です。非技術者への説明にも使いやすい指標です。

具体例: 不動産価格予測

5件の物件の実際価格が 3000万、4000万、5000万、3500万、4500万で、モデルの予測が 3200万、3800万、5500万、3400万、4600万だとします。各誤差の絶対値は 200万、200万、500万、100万、100万で、MAE = (200+200+500+100+100) / 5 = 220万円です。「平均的に 220万円ずれる」と解釈できます。

MAE の数学的性質 — 中央値との関係

MAE を最小化する予測値は条件付き中央値です(RMSE の場合は条件付き平均)。つまり、MAE を損失関数として学習したモデルは、データの中央値を予測する傾向があります。外れ値の影響を受けにくい中央値を基準とするため、MAE はロバストな指標なのです。

外れ値への頑健性

MAE が外れ値に強い理由は、誤差を二乗しないからです。例えば、1件の予測が 1000万円ずれた場合、MAE への寄与は 1000万円ですが、MSE への寄与は 1000万² = 1兆となり、他のサンプルの影響をかき消します。外れ値が多いデータでは MAE の方が安定した評価を提供します。

MAE vs RMSE の使い分け

  1. 1

    外れ値が多い → MAE

    データに外れ値が含まれる場合、MAE は外れ値の影響を受けにくく安定した評価を提供します。

  2. 2

    均一な誤差分布 → RMSE

    誤差の分布が均一で外れ値が少ない場合、RMSE の方が大きな誤差を適切にペナルティします。

  3. 3

    ビジネス報告 → MAE

    MAE は直感的な解釈がしやすく、非技術者への報告に適しています。

  4. 4

    モデル学習の損失関数 → MSE/RMSE

    MSE は微分が滑らかで勾配降下法と相性が良いため、学習の損失関数としてよく使われます。

MAE を損失関数として使う場合の注意点

MAE(L1 Loss)は原点で微分不可能という数学的性質があります。このため勾配降下法でゼロ付近の挙動が不安定になることがあります。実用上は Huber Loss(小さな誤差には MSE、大きな誤差には MAE を適用)が折衷案として使われます。また、L1 正則化(Lasso)とも関連が深い概念です。

Normalized MAE による異なるスケールでの比較

MAE はスケール依存のため、異なるタスク間の比較には Normalized MAE(NMAE)を使います。NMAE = MAE / (y_max - y_min) のように、目的変数の範囲で正規化することで、「売上予測の MAE」と「来客数予測の MAE」を比較可能になります。

Qast での活用

Qast のリーダーボードでは MAE が回帰指標の一つとして表示されます。RMSE と併せて確認し、MAE と RMSE の差が大きい場合は外れ値の影響が疑われます。外れ値が多いデータでは MAE でソートしてモデルを選択するのが効果的です。

外れ値が多いデータでは MAE を、均一な誤差分布では RMSE を重視しましょう。MAE と RMSE の差が大きければ、予測が大きく外れるサンプルが存在することを示唆します。

Qast を導入してみませんか?

導入のご相談やデモのご依頼は、お気軽にお問い合わせください。