RMSPEとは?予測精度を割合で評価する指標をわかりやすく解説

RMSPEとは?予測精度を割合で評価する指標をわかりやすく解説

AIの初心者

RMSPEは、機械学習の予測精度を見る指標だと聞きました。何を表す数値なのですか?

AI専門家

簡単に言うと、予測値が実際の値からどれくらいずれたかを割合で見る指標だよ。100円の商品を110円と予測したら10%のずれ、1000円の商品を1010円と予測したら1%のずれ、というように規模に対する誤差を評価できるんだ。

AIの初心者

割合で見るのは分かりました。では、なぜ二乗したり平方根を取ったりするのでしょうか?

AI専門家

二乗すると、プラス方向の誤差とマイナス方向の誤差が打ち消し合わなくなる。さらに大きな誤差ほど強く反映できる。最後に平方根を取ることで、二乗した値を割合として読みやすい形に戻しているんだ。

RMSPEとは。

RMSPEは「Root Mean Squared Percentage Error」の略で、日本語では「平均二乗パーセント誤差の平方根」と訳されます。機械学習や統計の予測モデルで、実測値に対する予測誤差の大きさを割合として評価するための指標です。

RMSPEとは?予測誤差を割合で見る評価指標

RMSPEが実測値と予測値の割合誤差を評価する概念図

RMSPEは、予測値と実測値のずれを実測値に対する割合として計算し、その割合誤差を一つの数値にまとめる評価指標です。値が0%に近いほど予測は正確で、値が大きいほど予測のずれが大きいと考えます。

機械学習では、売上、需要、価格、アクセス数のように、対象によって実測値の大きさが大きく変わるデータを扱うことがあります。このとき、単純に「何個ずれたか」「何円ずれたか」だけを見ると、規模の大きい対象の誤差が目立ちやすくなります。

たとえば、実測値10に対して予測値11なら誤差は1ですが、割合では10%です。一方、実測値100に対して予測値101でも誤差は同じ1ですが、割合では1%です。RMSPEはこの違いを反映できるため、規模の異なるデータを比較するときに使いやすい指標です。

項目 内容
正式名称 Root Mean Squared Percentage Error
日本語名 平均二乗パーセント誤差の平方根
見るもの 実測値に対して予測値がどれくらい割合でずれているか
値の解釈 0%に近いほど予測が正確。大きいほど予測誤差が大きい
向いている場面 規模の異なる売上、需要、価格などを同じ基準で評価したい場合

RMSPEの計算方法と式の読み方

RMSPEの計算手順を示すフロー図

RMSPEは、各データ点で予測値と実測値の差を求め、その差を実測値で割って割合誤差にします。次に、割合誤差を二乗し、全データの平均を取り、最後に平方根を計算します。

\(RMSPE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}\left(\frac{\hat{y_i} – y_i}{y_i}\right)^2}\)

式の中で、\(n\) はデータ数、\(\hat{y_i}\) は予測値、\(y_i\) は実測値を表します。\(\frac{\hat{y_i} – y_i}{y_i}\) は、実測値を基準にした相対誤差です。

二乗する理由は、予測値が実測値より大きい場合と小さい場合の誤差が打ち消し合わないようにするためです。また、二乗によって大きな誤差の影響が強くなります。つまり、少しずつ外すモデルよりも、たまに大きく外すモデルを厳しく評価しやすい性質があります。

最後に平方根を取るのは、二乗した値を元の割合に近いスケールへ戻して読みやすくするためです。計算式だけを見ると難しく感じますが、実務では表計算ソフトやPythonなどで簡単に計算できます。

簡単な例で見るRMSPEの考え方

実測値10と100で同じ絶対誤差の割合が異なる例

RMSPEを理解するうえで重要なのは、絶対誤差ではなく相対誤差を見る点です。次のように、どちらも予測値が1だけ外れている例を考えます。

実測値 予測値 絶対誤差 相対誤差
10 11 1 10%
100 101 1 1%

絶対誤差だけを見ると、どちらも同じ「1のずれ」です。しかし、実測値10に対する1のずれはかなり大きく、実測値100に対する1のずれは比較的小さいずれです。RMSPEは、このような規模の違いを考慮して評価できます。

売上予測で考えると、月間10個売れる商品を11個と予測することと、月間1000個売れる商品を1001個と予測することは、同じ1個の誤差でも意味が異なります。RMSPEは、予測対象の規模に対して誤差がどれくらい大きいかを見たいときに役立ちます。

RMSE・MAE・MSEとの違い

RMSPEとRMSEやMAEなどの評価指標を比較する図

予測精度を測る指標には、RMSPEのほかにRMSE、MAE、MSE、決定係数などがあります。どの指標が優れているかを一律に決めるのではなく、データの性質と評価したい観点に合わせて選ぶことが重要です。

指標 評価するもの 特徴 向いている場面
RMSPE 実測値に対する割合誤差 規模の違うデータを比較しやすい 売上や需要など、値の大きさが対象ごとに異なる予測
RMSE 誤差の二乗平均平方根 大きな誤差を強く反映する 大きな外れを重く見たい予測
MAE 誤差の絶対値の平均 直感的で解釈しやすい 平均的にどれくらい外れるかを見たい場合
MSE 誤差の二乗平均 単位が二乗になるため解釈はやや難しい 学習時の損失関数として扱いやすい場面
決定係数 データのばらつきをどれだけ説明できるか 1に近いほど説明力が高い 回帰モデル全体の当てはまりを見たい場合

RMSPEの特徴は、誤差を実測値で割る点です。そのため、価格帯や販売数が大きく異なる対象を同じ土俵で見やすくなります。一方で、実測値が小さいデータに敏感になりやすいため、RMSEやMAEと併用して判断すると、モデルの癖をより正確に把握できます。

RMSPEが役立つ場面

RMSPEは、実測値のスケールが一定でない予測タスクで特に役立ちます。代表的なのは、商品の売上予測、店舗別の需要予測、価格予測、アクセス数予測などです。

たとえば、売上予測では、月に数十個しか売れない商品と、数万個売れる商品が同じデータセットに含まれることがあります。絶対誤差だけで評価すると、売上規模の大きい商品の誤差が目立ちやすくなります。RMSPEを使うと、それぞれの商品の規模に対して予測がどれくらい外れたかを比較しやすくなります。

需要予測でも同じです。季節、キャンペーン、天候、イベントなどによって需要が大きく変わる場合、誤差を割合で見ることで、需要が多い時期と少ない時期を同じ目線で評価しやすくなります。

分野 RMSPEを使う理由 確認したいこと
売上予測 商品ごとの販売規模が異なるため 規模に対してどれくらい予測が外れたか
需要予測 季節やイベントで需要が変動するため 需要量の増減に対して予測が安定しているか
価格予測 銘柄や商品によって価格帯が違うため 価格帯に対して誤差が大きすぎないか
アクセス数予測 ページごとの規模差が大きいため 小規模ページと大規模ページを公平に評価できるか

RMSPEを使うときの注意点

RMSPEでゼロ付近の値と外れ値に注意する図

RMSPEの大きな注意点は、実測値で割る指標であることです。実測値が0の場合は割り算ができません。また、実測値が0に近い場合は、少しの誤差でも相対誤差が非常に大きくなります。

たとえば、実測値が1で予測値が2なら絶対誤差は1ですが、相対誤差は100%です。一方、実測値が100で予測値が101なら、同じ絶対誤差1でも相対誤差は1%です。この性質はRMSPEの利点でもありますが、小さい値が多いデータでは評価を不安定にします。

また、RMSPEは二乗を含むため、大きな誤差や外れ値の影響も受けやすい指標です。データの一部に極端な値がある場合、その値が全体の評価を大きく動かすことがあります。ゼロ販売日、欠損値、異常値、記録ミスなどが含まれる場合は、計算前にデータを確認する必要があります。

注意点 起きる問題 対策の例
実測値が0 割り算ができない 対象データを分ける、別指標を併用する
実測値が0に近い 小さな誤差が極端に大きく見える しきい値を設ける、MAEやRMSEも確認する
外れ値がある 一部のデータが評価を強く左右する 外れ値の原因を調べ、必要に応じて除外や補正を行う
小規模データが多い モデルの実力以上に悪く見える場合がある セグメント別に評価し、業務上の重要度も確認する

RMSPEだけでモデルを判断しないために

RMSPEは便利な指標ですが、これだけで予測モデルの良し悪しを決めるのは危険です。RMSPEが低くても、特定のセグメントで大きく外している可能性があります。逆に、少数の小さい実測値の影響でRMSPEが高くなっていても、実務上は問題が小さい場合もあります。

モデルを評価するときは、RMSPE、MAE、RMSEなど複数の指標を並べて確認すると判断しやすくなります。さらに、予測値と実測値の散布図、誤差の分布、時系列でのずれ方などを確認すると、数値だけでは見えない問題を見つけやすくなります。

実務では、最終的に「どの誤差を減らしたいのか」を明確にすることが大切です。割合の誤差を重視するならRMSPEは有力な候補です。一方、在庫数や金額の絶対的なずれを重視するなら、MAEやRMSEの方が判断に合うこともあります。

まとめ

RMSPEは、予測値と実測値のずれを実測値に対する割合として評価する指標です。規模の異なるデータを比較しやすいため、売上予測、需要予測、価格予測などで役立ちます。

計算では、相対誤差を二乗し、平均を取り、平方根を計算します。二乗によって誤差の打ち消しを防ぎ、大きな誤差を強く反映できます。平方根を取ることで、割合として読みやすい値になります。

ただし、実測値が0または0に近いデータでは不安定になりやすく、外れ値の影響も受けます。RMSPEを使うときは、データの性質を確認し、RMSEやMAEなどの指標とあわせて見ることが重要です。

更新履歴

日付 内容
2025年2月1日 初回公開
2026年5月18日 式の読み方、指標比較、ゼロ付近の注意を補強

Weeybleの最新イベント

イベント一覧

イベント情報を読み込んでいます。

この記事の内容に興味を持った方へ

コワーキングスペース秋葉原Weeybleでは、AI、Web開発、クラウド、セキュリティなど、エンジニア向けの勉強会やもくもく会を開催しています。

もくもく作業したい方、技術について話したい方、これから学びたい方も歓迎です。

「もくもく会って何?」「初めて参加しても大丈夫?」という方は、もくもく会とは?意味や参加方法をわかりやすく解説の記事もあわせてご覧ください。

生成AI・AIエージェント開発のご相談

AWS Bedrockを活用したAI開発支援

業務システム自動化・エージェント開発に対応

PoC・技術検証・研究開発フェーズからご相談いただけます

学習