活用テクニック2026年3月15日

回帰モデルの評価指標を完全解説 — MAE から決定係数まで

回帰モデルの予測精度を正しく評価するための指標を体系的に解説。RMSE、MAE、R²、MAPE など、各指標の数学的意味とビジネスでの使い分けを詳しく紹介します。

Qast の回帰モデル評価指標ダッシュボード

回帰モデルは連続的な数値を予測しますが、「どれだけ正確に予測できているか」を測るには目的に応じた適切な評価指標を選ぶ必要があります。この記事では、回帰モデルの主要な評価指標を数学的な意味からビジネスでの使い分けまで体系的に解説します。

残差(Residual)— すべての指標の出発点

残差とは「実測値 − 予測値」で計算される、個々の予測の誤差です。すべての回帰評価指標は、この残差を何らかの方法で集約したものです。残差が正なら過小予測、負なら過大予測を意味します。残差のプロット(残差プロット)を確認することで、モデルが特定の範囲で系統的に過大/過小予測していないかを視覚的に判断できます。

MAE(Mean Absolute Error / 平均絶対誤差)

残差の絶対値の平均で、「平均的にどれだけ予測がずれるか」を直感的に示す指標です。単位が予測対象と同じ(円、kg、℃など)であるため、ビジネス関係者にも説明しやすいのが大きな利点です。

  1. 1

    計算式

    MAE = (1/n) × Σ|実測値 − 予測値| で計算されます。

  2. 2

    特徴

    外れ値に対して頑健(すべての誤差を等しく扱う)。中央値回帰の損失関数に対応します。

  3. 3

    使いどころ

    「平均的な誤差」を報告したい場合。外れ値の影響を抑えた評価をしたい場合に適しています。

MSE(Mean Squared Error / 平均二乗誤差)

残差の二乗の平均です。大きな誤差により大きなペナルティを課すため、外れ値に敏感です。数学的に微分可能であり、多くの最適化アルゴリズムの損失関数として使用されます。ただし単位が「元の単位の二乗」になるため、直感的な解釈は RMSE のほうが適しています。

RMSE(Root Mean Squared Error / 二乗平均平方根誤差)

MSE の平方根で、MAE と同様に予測対象と同じ単位で誤差を表現できます。MSE と同じく大きな誤差に強いペナルティを課しますが、単位が直感的に解釈しやすいという利点があります。

  1. 1

    計算式

    RMSE = √(MSE) = √((1/n) × Σ(実測値 − 予測値)²) で計算されます。

  2. 2

    特徴

    大きな誤差に敏感(二乗のため)。常に MAE ≤ RMSE の関係が成り立ちます。

  3. 3

    RMSE と MAE の差

    RMSE と MAE の差が大きいほど、誤差のばらつきが大きい(一部の予測で大きく外している)ことを示します。

RMSE と MAE の両方をチェックしましょう。RMSE = 100, MAE = 90 なら誤差は比較的均一ですが、RMSE = 100, MAE = 30 なら一部の予測で非常に大きな誤差が発生しています。

R²(決定係数 / Coefficient of Determination)

モデルがデータの変動をどれだけ説明できるかを0〜1(通常)のスケールで表す指標です。R² = 1 はモデルが完全にデータを説明していることを意味し、R² = 0 はモデルが平均値を予測するのと同等であることを意味します。異なるスケールのデータ間でモデルの性能を比較する際に有用です。

  1. 1

    計算式

    R² = 1 − (SSres / SStot) で計算されます。SSres は残差の二乗和、SStot は全変動の二乗和です。

  2. 2

    解釈の目安

    R² > 0.9 は非常に良い、0.7〜0.9 は良い、0.5〜0.7 は普通、< 0.5 は改善の余地あり(あくまで一般論)。

  3. 3

    注意点

    特徴量を増やすと R² は必ず上昇するため、過学習の可能性を見落とすリスクがあります。調整済み R² の併用を推奨します。

調整済み R²(Adjusted R²)

R² にサンプル数と特徴量数による補正を加えた指標です。不要な特徴量を追加しても値が上がらない(むしろ下がる)ため、特徴量選択の判断材料として使えます。R² と調整済み R² の差が大きい場合は、モデルに不要な特徴量が含まれている可能性があります。

MAPE(Mean Absolute Percentage Error / 平均絶対パーセント誤差)

誤差を実測値に対するパーセンテージで表現する指標です。「予測が平均で何%ずれるか」という直感的な解釈ができ、ビジネスレポートでの利用に適しています。ただし、実測値が0に近い場合は値が爆発するため、売上が0の日があるデータなどでは注意が必要です。

  1. 1

    計算式

    MAPE = (100/n) × Σ|(実測値 − 予測値)/ 実測値| で計算されます。

  2. 2

    使いどころ

    スケールが異なる複数の予測タスクの精度を比較する場合。「何%の誤差か」で報告したい場合に適しています。

  3. 3

    代替手法: sMAPE

    実測値と予測値の平均で割る対称MAPE。実測値が0の問題を緩和しますが、解釈がやや複雑になります。

RMSLE(Root Mean Squared Log Error)

対数変換した値の RMSE です。「比率」で誤差を評価するため、予測対象のスケールが大きく異なるデータ(例:物件価格が100万円〜10億円)で有用です。過小予測と過大予測を非対称に扱い、過小予測により大きなペナルティを課す特徴があります。

Huber Loss — MAE と MSE のハイブリッド

小さな誤差にはMSE(二乗ペナルティ)を、大きな誤差にはMAE(線形ペナルティ)を適用するハイブリッドな損失関数です。閾値パラメータ δ により、外れ値への感度を制御できます。外れ値が存在するが完全に無視はしたくない場合に適しています。

タスクに応じた指標の選び方

  1. 1

    全般的な精度評価 → RMSE + MAE + R²

    この3つの組み合わせがもっとも一般的です。RMSE と MAE の差でエラーの均一性を、R² でモデルの説明力を把握します。

  2. 2

    外れ値が多い → MAE + Huber Loss

    外れ値に頑健な MAE を主指標とし、Huber Loss で学習の最適化を行います。

  3. 3

    ビジネスレポート向け → MAPE

    非技術者に「何%の誤差か」で報告できるため、経営層向けのレポートに適しています。

  4. 4

    スケールが大きく異なる → RMSLE

    予測対象の値の範囲が広い場合や、比率での誤差評価が適切な場合に使います。

Qast での回帰評価指標の活用

Qast のリーダーボードでは、RMSE、MAE、R²、MAPE を含むすべての回帰指標を一覧表示します。任意の指標でソートでき、各モデルのメトリクスを横断的に比較できます。また、残差プロットや予測 vs 実測プロットも自動生成され、モデルの振る舞いを視覚的に診断できます。

リーダーボードで RMSE が最小のモデルが、必ずしもビジネスに最適とは限りません。推論速度、モデルの解釈性、運用上の制約も考慮して総合的に判断しましょう。Qast では各モデルの推論時間も表示されるため、精度と速度のトレードオフを可視化できます。

Qast を導入してみませんか?

導入のご相談やデモのご依頼は、お気軽にお問い合わせください。