RMSEとは?計算式・意味・MAEとの違いを初心者向けに解説

RMSE:予測精度を測る尺度

AIの初心者

「RMSE」ってなんですか?機械学習の評価でよく見ますが、意味がまだつかめません。

AI専門家

RMSEは「二乗平均平方根誤差」のことで、予測値と実際の値が平均的にどれくらいずれているかを見る指標だよ。回帰モデルの予測精度を評価するときによく使われるんだ。

AIの初心者

ずれを測る指標なんですね。普通の平均誤差とは何が違うのでしょうか?

AI専門家

RMSEは誤差を二乗してから平均し、最後に平方根を取るんだ。大きく外れた予測ほど強く反映されるので、重大な予測ミスを見逃したくない場面で役立つよ。

RMSEとは。

RMSEは、機械学習や統計で使われる予測誤差の評価指標です。予測値と実測値の差を二乗し、その平均の平方根を取ることで、予測が平均的にどれくらい外れているかを表します。

予測値と実測値のずれを示すRMSEのイメージ

RMSEとは?予測精度を測る二乗平均平方根誤差

RMSE(Root Mean Squared Error)は、日本語で二乗平均平方根誤差と呼ばれる評価指標です。主に回帰モデルのように、数値を予測するモデルの精度を測るために使われます。たとえば、明日の気温、住宅価格、売上、株価、需要量などを予測したとき、予測値と実際の値のずれをまとめて評価できます。

RMSEの値は、基本的に小さいほど良いと考えます。気温予測でRMSEが2度なら、モデルの予測は平均的に数度程度ずれていると読み取れます。住宅価格の予測でRMSEが300万円なら、誤差の規模は価格と同じ「円」の単位で理解できます。このように、平方根を取ることで元のデータと同じ単位に戻るため、結果を現実の感覚に結びつけやすい点が特徴です。

ただし、RMSEは単に「小さければ必ず良い」とだけ覚えると誤解しやすい指標です。扱うデータの単位や範囲が変われば値の大きさも変わるため、違う種類の問題をそのまま比べることはできません。同じ目的変数、同じ評価データ、同じ前処理の条件でモデルを比較するときに、特に使いやすい指標です。

項目 説明
正式名称 Root Mean Squared Error(二乗平均平方根誤差)
主な用途 回帰モデルなど、数値予測モデルの精度評価
値の見方 同じ条件で比較する場合、値が小さいほど予測誤差が小さい
特徴 大きな誤差を強く反映し、結果を元データと同じ単位で読める

RMSEの計算式と計算手順

\(\mathrm{RMSE}=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2}\)

RMSEの計算手順を示すフロー図

RMSEの計算式は、実測値と予測値の差を1件ずつ求め、その差を二乗し、平均してから平方根を取る形です。式の中の n はデータの件数、y_i は実際の値、ŷ_i は予測値を表します。実測値から予測値を引いても、予測値から実測値を引いても、二乗するため最終的な値は同じです。

計算の流れは大きく4段階です。まず各データについて、予測値と実測値の差を出します。次に、その誤差を二乗します。二乗することで、プラスの誤差とマイナスの誤差が打ち消し合うのを防ぎ、大きな誤差ほど強く評価できます。その後、二乗した誤差をすべて足してデータ数で割ります。最後に平方根を取ることで、単位を元の予測対象に近い形へ戻します。

簡単な気温予測で考えてみましょう。実際の気温が20度、22度、25度で、予測が19度、24度、29度だった場合、誤差は1度、-2度、-4度です。これを二乗すると1、4、16になり、平均は7です。平方根を取ると約2.65なので、このモデルのRMSEは約2.65度と読めます。最後の1件の誤差が大きいため、RMSEはその影響をしっかり反映します。

手順 内容 意味
1 実測値と予測値の差を出す 各データの誤差を確認する
2 誤差を二乗する 符号を消し、大きな誤差を重く見る
3 二乗誤差の平均を取る 全体としての誤差の大きさをまとめる
4 平方根を取る 元のデータと近い単位で読み取れるようにする

RMSEの値はどう解釈するか

RMSEが小さい場合と大きい場合の比較

RMSEは、同じ条件で作ったモデル同士を比べるときに特に便利です。たとえば、同じ住宅価格データを使ってモデルAのRMSEが280万円、モデルBのRMSEが350万円なら、モデルAのほうが評価データ上では誤差が小さいと判断できます。機械学習では、複数のアルゴリズムや特徴量の組み合わせを試し、検証データのRMSEを比べて改善を進めることがよくあります。

一方で、RMSEには絶対的な「この値なら合格」という共通基準はありません。気温予測のRMSEが3度であれば大きく感じるかもしれませんが、住宅価格のRMSEが3円ならほとんど誤差がないと言えます。つまり、RMSEの良し悪しは予測対象の単位、業務上許される誤差、データのばらつきによって変わります。

実務では、RMSEを業務上の許容範囲と照らして読むことが大切です。売上予測なら、RMSEが在庫計画や人員配置にどれほど影響するかを考えます。医療や設備保全のように大きな誤差が深刻な判断ミスにつながる場面では、平均的な誤差だけでなく、大きく外れたケースがどれくらいあるかも確認する必要があります。

RMSEの長所と短所

RMSEの長所は、計算方法が比較的わかりやすく、大きな予測ミスを重視できることです。誤差を二乗するため、少しのずれよりも大きなずれが強く反映されます。これは、重大なミスを避けたい予測問題では有効です。たとえば需要予測で一部の商品だけ大きく外すと、欠品や過剰在庫につながることがあります。RMSEはそのような大きな外れを評価値に反映しやすい指標です。

また、平方根を取るため、結果が元の目的変数と同じ単位で読める点も扱いやすいところです。平均二乗誤差(MSE)は二乗された単位になるため、現場で解釈しづらいことがあります。RMSEなら「平均的に何円くらい」「何度くらい」「何件くらい」ずれているのかを説明しやすく、モデル評価を関係者に共有しやすくなります。

短所は、外れ値の影響を受けやすいことです。たとえば100件中99件はかなり正確でも、1件だけ極端に外れた予測があると、二乗の効果でRMSEが大きく悪化します。この性質は大きな誤差を見つけるうえでは利点ですが、外れ値が測定ミスや一時的な異常値である場合には、モデルの実力を必要以上に悪く見せることがあります。

観点 長所 注意点
大きな誤差 重大な予測ミスを強く反映できる 外れ値に引っ張られやすい
単位 元データと同じ単位で説明しやすい 異なる単位の問題同士は比較しにくい
モデル比較 同じデータ条件なら比較が簡単 データ分割や前処理が違う比較には向かない

MAE・MAPEとの違い

RMSEとMAEとMAPEの違いを示す比較イメージ

予測精度を測る指標には、RMSE以外にもMAEやMAPEがあります。どれか1つが常に正解というわけではなく、予測問題の性質に合わせて選びます。RMSEは大きな誤差を重く見たいとき、MAEは誤差の平均的な大きさを安定して見たいとき、MAPEは割合で誤差を見たいときに使われます。

MAE(Mean Absolute Error)は、誤差の絶対値を平均した指標です。二乗しないため、RMSEより外れ値の影響を受けにくい傾向があります。大きな誤差も小さな誤差も比較的そのまま扱うので、平均的なずれを素直に見たい場合に便利です。ただし、重大な誤差を強く罰したい場合には、RMSEのほうが目的に合うことがあります。

MAPE(Mean Absolute Percentage Error)は、誤差を実測値に対する割合で表す指標です。売上や需要などで「何パーセント外れたか」を説明したい場合に使いやすい一方、実測値がゼロに近いと値が非常に大きくなり、解釈が不安定になります。マイナスの値を含むデータやゼロが多いデータでは、別の指標を検討したほうがよい場合があります。

指標 計算の考え方 向いている場面 注意点
RMSE 誤差を二乗して平均し、平方根を取る 大きな誤差を重く評価したい 外れ値の影響を受けやすい
MAE 誤差の絶対値を平均する 平均的な誤差を安定して見たい 大きな誤差を強く罰しにくい
MAPE 誤差を実測値に対する割合で見る パーセントで説明したい 実測値がゼロに近いと不安定

RMSEが使われる場面

金融や天気予報などRMSEの活用場面

RMSEは、数値を予測する多くの分野で使われます。金融では株価や為替、リスク量の予測を評価するために使われます。予測誤差が金額に直結するため、大きく外れる予測を見つけやすいRMSEは、モデル改善やリスク確認の材料になります。

小売や製造では、売上、需要、在庫量、納期などの予測精度を見るときに役立ちます。需要予測で一部の商品を大きく外すと、欠品や廃棄につながるため、RMSEで大きな誤差を把握する意義があります。天気予報では気温や降水量、医療では検査値や治療効果の予測など、連続的な数値を扱う場面で使われます。

ただし、どの分野でもRMSEだけでモデルの良し悪しを決めるのは避けたほうが安全です。実際には、MAE、決定係数、残差プロット、業務上の損失額なども合わせて確認します。RMSEは強力な指標ですが、モデル評価の一部として使うことで、より納得しやすい判断につながります。

まとめ

RMSEは、予測値と実測値のずれを二乗し、平均して平方根を取ることで求める評価指標です。回帰モデルの予測精度を測る代表的な方法で、値が小さいほど同じ条件では誤差が小さいと判断できます。

RMSEを理解するポイントは、大きな誤差を重く見ること、元データと同じ単位で読めること、外れ値には注意が必要なことです。MAEやMAPEとあわせて使い分けると、予測モデルの強みと弱みをより立体的に把握できます。機械学習を学ぶときは、計算式を暗記するだけでなく、どのような誤差を重視したいのかという評価目的とセットで理解するとよいでしょう。

更新履歴

日付 内容
2025年2月1日 初回公開
2026年5月1日 RMSEの定義、計算式、値の解釈、MAE・MAPEとの違い、活用例を初心者向けに再構成