MedAEとは?中央絶対誤差の求め方・特徴・使いどころを初心者向けに解説

MedAEとは?機械学習で使う中央絶対誤差の意味

AIの初心者

『MedAE』(機械学習における中央絶対誤差)って、どういう意味ですか? 誤差は予測値から正解値を引いて計算するんですよね?

AI専門家

MedAEは、複数のデータで出た誤差の絶対値を並べ、その中央値を見る評価指標です。絶対値を取るので、正解値から予測値を引いても、予測値から正解値を引いても同じ結果になります。

AIの初心者

つまり、それぞれのデータで正解値と予測値のズレを絶対値にして、小さい順に並べたときの真ん中を見るということですね?

AI専門家

その通りです。データ数が偶数なら中央の2つの平均を使います。中央値に注目するため、外れ値の影響を受けにくい点が大きな特徴です。

MedAEとは。

MedAEは Median Absolute Error の略で、日本語では「中央絶対誤差」と呼ばれます。回帰モデルの予測値が実際の値からどれくらいずれているかを、絶対誤差の中央値で表す機械学習の評価指標です。

MedAEとは?中央絶対誤差の基本

MedAEの基本概念

MedAE(中央絶対誤差)は、各データの予測誤差を絶対値にし、その中央値を取る指標です。主に、売上、価格、需要、温度、距離のような連続値を予測する回帰モデルの評価で使われます。

たとえば、実測値が15、予測値が10なら差は5です。実測値から予測値を引いても、予測値から実測値を引いても、最後に絶対値を取るため誤差は5になります。このように、MedAEでは「どちらにずれたか」ではなく「どれくらいずれたか」を見ます。

MedAEの値は目的変数と同じ単位で読めます。住宅価格を万円で予測しているならMedAEも万円、気温を度で予測しているならMedAEも度です。そのため、数値の意味を直感的に理解しやすいという利点があります。

ただし、MedAEは中央値を使うため、誤差の分布全体を表す指標ではありません。外れ値に強い一方で、少数の非常に大きな失敗を見落としやすい面もあります。実務では、MedAEだけでなくMAEやMSE、RMSEなどとあわせて確認するのが基本です。

指標名 MedAE(Median Absolute Error / 中央絶対誤差)
目的 予測値と実測値の代表的なズレを測る
使う場面 回帰モデルの評価、外れ値を含むデータのモデル比較
特徴 絶対誤差の中央値を使うため、極端な誤差に引っ張られにくい

MedAEの計算方法と数式

\( \mathrm{MedAE}(y, \hat{y}) = \mathrm{median}(|y_1 – \hat{y}_1|, |y_2 – \hat{y}_2|, \ldots, |y_n – \hat{y}_n|) \)

MedAEの計算手順

MedAEの計算は、次の流れで行います。難しい処理に見えますが、考え方は「誤差を絶対値にする」「小さい順に並べる」「真ん中を選ぶ」の3段階です。

  1. 各データについて、実測値と予測値の差を計算する
  2. 差の絶対値を取り、絶対誤差にする
  3. 絶対誤差を小さい順に並べる
  4. データ数が奇数なら中央の値、偶数なら中央2つの平均をMedAEにする

たとえば、5件のデータの絶対誤差が「1、3、5、7、9」だった場合、中央にある値は5です。このときMedAEは5になります。データ数が奇数なら、並べたときの真ん中がそのままMedAEです。

一方、絶対誤差が「2、4、6、8」のように4件ある場合、中央の2つは4と6です。この2つの平均である5がMedAEになります。偶数個のデータでは、中央値の一般的な定義と同じく中央2つの平均を使います。

外れ値がある例も見てみましょう。絶対誤差が「1、2、3、4、100」だった場合、MedAEは3です。最後の100は非常に大きな誤差ですが、中央値は並び順の中央を見るため、MedAEは大きく変わりません。これが、MedAEが外れ値に強いといわれる理由です。

MAE・MSE・RMSEとの違い

MedAEとMAEやMSEの比較

MedAEを理解するには、似た回帰評価指標であるMAE、MSE、RMSEとの違いを押さえると分かりやすくなります。いずれも予測誤差を見る指標ですが、MedAEは中央値、MAEは平均、MSEとRMSEは二乗誤差に注目します。

MAE(平均絶対誤差)は、絶対誤差をすべて足してデータ数で割る指標です。単位が目的変数と同じで解釈しやすい一方、平均を使うため、大きな誤差があると値が押し上げられます。

MSE(平均二乗誤差)は、誤差を二乗して平均します。大きな誤差ほど二乗によって強く反映されるため、「大きなミスを重く罰したい」場合に向いています。ただし、外れ値にも非常に敏感です。RMSE(二乗平均平方根誤差)はMSEの平方根を取ったもので、単位を目的変数に戻して解釈しやすくした指標です。

たとえば、絶対誤差が「1、2、3、4、100」の場合、MedAEは3ですが、MAEは22になります。大きな外れ値を含むと、平均を使う指標は大きく変化します。MedAEはその影響を抑えた、より頑健な代表値として使えます。

指標 計算の考え方 外れ値の影響 向いている確認
MedAE 絶対誤差の中央値 受けにくい 外れ値に左右されにくい代表的な誤差
MAE 絶対誤差の平均 やや受ける 平均的にどれくらい外しているか
MSE 誤差を二乗した平均 強く受ける 大きな誤差を重く評価したい場合
RMSE MSEの平方根 強く受ける 大きな誤差を重視しつつ元の単位で見たい場合

MedAEが外れ値に強い理由

MedAEが外れ値に強い理由

MedAEが外れ値に強いのは、平均ではなく中央値を使うためです。平均はすべての値の合計から計算されるため、極端に大きい値が1つあるだけでも全体の値が引っ張られます。一方、中央値は小さい順に並べたときの中央だけを見るため、端にある外れ値の影響を受けにくくなります。

機械学習で扱う現実のデータには、入力ミス、計測ミス、一時的な異常、まれな高額取引などが混ざることがあります。こうしたデータが評価指標を大きく動かすと、モデルの通常時の性能を見誤る可能性があります。

MedAEは、典型的なデータに対してモデルがどの程度ずれているかを安定して見たい場合に有効です。特に、外れ値が少数だけ混ざっているデータや、ノイズが完全には取り除けない業務データでは、モデル比較の基準として役立ちます。

ただし、外れ値を無視してよいという意味ではありません。医療、金融、設備監視など、大きな誤差が重大な損失やリスクにつながる領域では、MedAEだけでは不十分です。大きな誤差を重く見るMSEやRMSE、最大誤差、誤差分布の可視化もあわせて確認する必要があります。

MedAEが向いている活用場面

MedAEの活用場面

MedAEは、外れ値やノイズが入りやすい回帰問題で特に使いやすい指標です。たとえば、不動産価格の予測では、特殊な立地や極端に高額な物件が混ざることがあります。平均系の指標だけを見ると、こうした少数の物件に評価が引っ張られることがありますが、MedAEなら典型的な物件に対する誤差を把握しやすくなります。

需要予測でもMedAEは役立ちます。キャンペーン、天候、イベント、在庫切れなどによって一部の日だけ需要が大きく変動する場合、外れ値に強い指標で通常時の予測精度を評価できます。センサーデータや設備監視のように、計測ノイズが混ざるデータにも相性があります。

また、複数のモデルを比較するときにもMedAEは有効です。あるモデルは平均誤差が小さくても一部の外れ値に弱く、別のモデルは典型的なケースで安定している、という違いが出ることがあります。MedAEを使うと、外れ値に左右されにくい観点からモデルを比較できます。

分野 MedAEが役立つ理由
不動産価格予測 特殊な高額物件や例外的な取引に評価を引っ張られにくい
需要予測 一時的なイベントや欠品による極端な変動の影響を抑えやすい
センサー監視 計測ノイズを含むデータでも代表的な誤差を見やすい
モデル比較 典型的なケースで安定しているモデルを見つけやすい

MedAEを使うときの注意点

MedAEは便利な指標ですが、万能ではありません。最も重要な注意点は、中央値だけでは誤差の分布全体が分からないことです。MedAEが小さくても、一部のデータで非常に大きな誤差が出ている可能性は残ります。

また、MedAEは絶対値を使うため、予測が実測値より大きく出がちなのか、小さく出がちなのかは分かりません。過大予測と過小予測の偏りを見たい場合は、平均誤差や残差プロットを確認する必要があります。

さらに、MedAEは主に回帰問題の評価指標です。分類問題で使うAccuracy、Precision、Recall、F1スコアとは役割が異なります。目的変数が連続値なのか、クラスラベルなのかを確認したうえで指標を選びましょう。

実務では、MedAEで外れ値に強い代表誤差を確認し、MAEで平均的な誤差、RMSEやMSEで大きな誤差への弱さを確認すると、モデルの性質をより立体的に把握できます。

まとめ

MedAEは、予測値と実測値の差の絶対値を並べ、その中央値を取る回帰モデルの評価指標です。中央値を使うため、少数の外れ値に影響されにくく、ノイズを含むデータで典型的な誤差を把握しやすいという特徴があります。

一方で、MedAEだけでは大きな失敗の発生状況や誤差の偏りは分かりません。MAE、MSE、RMSE、平均誤差、残差プロットなどと組み合わせることで、モデルの性能をより正しく評価できます。MedAEは「外れ値に強い代表的な誤差を見る指標」として理解すると、使いどころを判断しやすくなります。

更新履歴

日付 内容
2025年2月1日 初回公開
2026年5月1日 MedAEの定義、計算方法、MAE・MSE・RMSEとの違い、外れ値への強さ、活用場面と注意点を初心者向けに再構成