開発環境 中央絶対誤差:機械学習の評価指標
機械学習は、まるで人間の思考をまねるかのように、データから規則性を学び取る技術です。そして、学習した結果を基に未来の予測などを行います。この学習結果の良し悪しを測る物差しとなるのが、性能評価指標です。様々な指標が存在しますが、その中でも中央絶対誤差は、予測値と実際の値のズレを測る指標の一つです。
中央絶対誤差は、実際の値と予測値の差の絶対値を取り、その中央値を計算することで求めます。例えば、ある商品の売れ行きを予測する機械学習モデルを考えましょう。ある一週間の実際の売れ行きが、10個、12個、15個、8個、11個、9個、13個だったとします。そして、モデルが予測した売れ行きが、11個、13個、14個、7個、10個、10個、12個だったとします。それぞれの差の絶対値は、1, 1, 1, 1, 1, 1, 1となり、これらの値の中央値は1となります。つまり、この場合の中央絶対誤差は1です。
中央絶対誤差は、外れ値、つまり極端に大きな値や小さな値の影響を受けにくいという長所を持っています。売れ行き予測の例で考えてみましょう。ある一日だけ、通常では考えられないほどの大量の注文があったとします。このような外れ値は、予測モデルの評価を歪めてしまう可能性があります。しかし、中央絶対誤差を用いることで、このような極端な値の影響を軽減し、より安定した評価を行うことができます。
一方で、中央絶対誤差は、微分不可能であるという欠点も持っています。微分不可能とは、簡単に言うと、滑らかな曲線で表すことができないということです。このため、一部の最適化手法を用いることが難しい場合があります。
このように、中央絶対誤差には利点と欠点の両方があります。状況に応じて適切な指標を選び、モデルの性能を正しく評価することが、より良い機械学習モデルの開発へと繋がります。
