相対絶対誤差とは?求め方・仕組み・活用例をわかりやすく解説

相対絶対誤差とは?求め方・絶対誤差との違い・使いどころを解説

AIの初心者

「相対絶対誤差」って、何を表す指標なんですか?絶対誤差との違いもよくわかりません。

AI専門家

相対絶対誤差は、予測値が実際値からどれくらいずれたかを、実際値の大きさに対する割合で見る指標だよ。1000円の予測で100円ずれる場合と、10円の予測で1円ずれる場合は、どちらも10%のずれとして比べられるんだ。

AIの初心者

金額の差そのものではなく、元の値に対して何割ずれたかを見るんですね。

AI専門家

その通り。扱う値の規模が違うモデルを比較したいときに便利だよ。ただし、実際値が0に近いと不安定になるので、使いどころと注意点も一緒に押さえる必要があるね。

相対絶対誤差とは。

相対絶対誤差は、機械学習や統計で使われる評価指標のひとつです。予測値と実際値の差をそのまま見るのではなく、実際値の大きさに対する割合として誤差を表します。値の規模が異なるデータやモデルを比べるときに、誤差の意味をそろえて確認しやすくなる点が特徴です。

相対絶対誤差とは

相対絶対誤差の考え方を示す説明図

相対絶対誤差は、予測値と実際値のずれを「実際値に対する割合」で表す指標です。英語では Relative Absolute Error と表現され、文脈によっては1件ごとの相対誤差や、その平均値を指して使われます。

たとえば、実際値が1000で予測値が900なら、絶対誤差は100です。一方、実際値が10で予測値が9なら、絶対誤差は1です。差だけを見ると100と1で大きく違いますが、どちらも実際値に対して10%のずれです。このように、相対絶対誤差は値の大きさを考慮して予測のずれを比較します。

機械学習モデルでは、売上、価格、需要、アクセス数、センサー値など、対象によって値の桁が大きく変わります。絶対的な差だけで評価すると、大きな値を扱うモデルほど悪く見えやすくなります。そこで、割合に直して比較することで、データの規模に左右されにくい評価がしやすくなります。

観点 内容
何を測るか 予測値と実際値のずれが、実際値に対してどれくらい大きいか
値の見方 0に近いほど予測が実際値に近い。0.1ならおおむね10%のずれとして読める
向いている場面 異なる規模のデータやモデルを比較したい場面

絶対誤差との違い

絶対誤差と相対絶対誤差の違いを示す比較図

絶対誤差は、予測値と実際値の差の大きさをそのまま表します。実際値が100で予測値が90なら、絶対誤差は10です。実際値が1000で予測値が990の場合も、絶対誤差は同じく10です。

しかし、同じ10のずれでも、意味は同じではありません。実際値100に対する10のずれは10%ですが、実際値1000に対する10のずれは1%です。後者のほうが、実際値に対するずれの割合は小さいため、相対的には精度が高いと判断できます。

絶対誤差は「どれだけ離れたか」、相対絶対誤差は「基準の大きさに対してどれだけ離れたか」を見る指標です。単位を持つ誤差を直感的に知りたいときは絶対誤差が便利ですが、異なる規模の予測を比べるときは相対絶対誤差が役立ちます。

実際値 予測値 絶対誤差 相対絶対誤差
100 90 10 0.1(10%)
1000 990 10 0.01(1%)

相対絶対誤差の求め方

相対絶対誤差の計算手順を示す図

1件のデータに対する相対絶対誤差は、実際値と予測値の差の絶対値を、実際値の絶対値で割って求めます。実際値を \(y_i\)、予測値を \(\hat{y}_i\) とすると、基本形は次の通りです。

\(\mathrm{RAE}_i = \frac{|y_i – \hat{y}_i|}{|y_i|}\)

ここで \(|y_i – \hat{y}_i|\) は予測のずれの大きさです。絶対値を取るため、予測が実際値より大きくても小さくても、誤差の大きさとして扱えます。分母の \(|y_i|\) は基準となる実際値の大きさです。

複数のデータでモデル全体の傾向を見たい場合は、各データの相対絶対誤差を平均します。データ数を \(n\) とすると、平均的な相対絶対誤差は次のように表せます。

\(\frac{1}{n}\sum_{i=1}^{n}\frac{|y_i-\hat{y}_i|}{|y_i|}\)

たとえば、実際値1000に対して予測値900なら、誤差は100、相対絶対誤差は \(100/1000=0.1\) です。百分率で表すと10%です。実務では小数のまま比較することも、100を掛けてパーセントとして読むこともあります。

ただし、実際値が0の場合は分母が0になるため計算できません。実際値が0に近い場合も、わずかな誤差が極端に大きく見えることがあります。データに0が含まれるときは、対象データを分けて確認する、別の指標を併用する、業務上意味のある下限値を設けるなどの扱いが必要です。

機械学習での活用例

相対絶対誤差の活用例を示す分析ダッシュボード風の図

相対絶対誤差は、回帰モデルや時系列予測の評価で使いやすい指標です。とくに、予測対象の値の規模が大きく変わるデータで役立ちます。

売上予測では、月によって売上が数億円になることもあれば、数千万円にとどまることもあります。絶対誤差だけを見ると、売上規模が大きい月の誤差ばかりが目立ち、規模が小さい月の予測精度を見落とすことがあります。相対絶対誤差を使うと、各月の売上規模に対するずれとして評価できます。

需要予測や在庫予測でも同じです。販売数が多い商品と少ない商品を同じ絶対誤差で比べると、重要度を誤って判断することがあります。相対絶対誤差なら、商品ごとの販売規模を考慮して予測の良し悪しを確認できます。

また、複数の機械学習モデルを比較するときにも有効です。モデルAが大きな金額を予測し、モデルBが小さな数量を予測している場合、絶対誤差の大きさだけでは公平に比べられません。割合としてそろえることで、異なる規模の予測を同じ土俵で比較しやすくなるのです。

活用場面 相対絶対誤差が役立つ理由
売上予測 月や店舗によって売上規模が違っても、割合で誤差を確認できる
需要予測 販売数が多い商品と少ない商品の予測精度を比較しやすい
モデル比較 異なる規模のデータを扱うモデルの精度を評価しやすい

長所と短所

相対絶対誤差の長所と注意点を示す図

相対絶対誤差の長所は、値の規模が違っても誤差を比較しやすいことです。実際値に対する割合として見るため、100万円の予測と100円の予測を、単位の違いに引きずられずに評価できます。結果をパーセントで説明できるため、機械学習に詳しくない関係者にも伝えやすい点も利点です。

一方で、短所も明確です。最大の注意点は、実際値が0または0に近い場合に不安定になることです。実際値が小さいほど分母が小さくなるため、少しのずれでも相対絶対誤差が大きくなります。売上がほとんどない商品、発生頻度が低いイベント、ゼロを多く含むデータでは、指標が過敏に反応する可能性があります。

また、相対絶対誤差は大きな誤差を特別に重く扱う指標ではありません。重大な外れ値や大きな予測ミスを強く罰したい場合は、二乗誤差系の指標も確認したほうがよいでしょう。モデル評価では、相対絶対誤差だけで判断せず、データの分布や他の評価指標と合わせて読むことが重要です。

区分 内容
長所 値の規模が異なる予測を比較しやすい。割合で説明しやすい
短所 実際値が0または0に近いと計算不能または不安定になりやすい
確認したいこと 0を含むデータの扱い、外れ値、他の指標との整合性

他の評価指標との使い分け

機械学習モデルの評価では、目的に応じて複数の指標を使い分けます。相対絶対誤差は割合で見たいときに便利ですが、常に最適とは限りません。

平均絶対誤差(MAE)は、予測値と実際値の差を元の単位のまま平均します。売上なら円、気温なら度のように、業務上の単位で誤差を理解しやすい指標です。値の規模が大きいデータの影響を受けやすい反面、0に近い実際値があっても相対絶対誤差ほど不安定にはなりません。

二乗平均平方根誤差(RMSE)は、大きな誤差を重く評価したいときに使われます。大きな外れを避けたい予測、たとえば需要の大幅な読み違いが在庫切れや過剰在庫につながる場面では、RMSEも重要です。

MAPEは平均絶対パーセント誤差で、相対絶対誤差と同じくパーセントで誤差を読みやすい指標です。ただし、こちらも実際値が0に近いデータに弱いという注意点があります。名称や定義は文脈によって使い分けられるため、実務では計算式を明示してから比較するのが安全です。

指標 見方 向いている場面
相対絶対誤差 実際値に対する誤差の割合 規模の違う予測を比較したいとき
MAE 元の単位で見た平均的なずれ 業務上の単位で誤差を把握したいとき
RMSE 大きな誤差を重く見たずれ 大きな予測ミスを避けたいとき
MAPE 平均的なパーセント誤差 割合でわかりやすく説明したいとき

まとめ

相対絶対誤差は、予測値と実際値のずれを実際値に対する割合で表す評価指標です。絶対誤差だけでは比べにくい、規模の違うデータやモデルを比較するときに役立ちます。

計算は、実際値と予測値の差の絶対値を取り、それを実際値の絶対値で割るのが基本です。複数データでは、その値を平均することでモデル全体の傾向を見ます。結果をパーセントで読めるため、予測のずれを説明しやすい点も実用的です。

ただし、実際値が0または0に近い場合は計算が不安定になります。相対絶対誤差は便利な指標ですが、MAEやRMSEなどと併用し、データの性質に合った評価を行うことが大切です。

更新履歴

日付 内容
2025年2月1日 初回公開
2026年5月26日 計算式、比較指標、ゼロ付近の扱いを補って改稿