学習 平均絶対パーセント誤差とは?MAPEの求め方・計算方法・注意点を解説
機械学習の模型を作る上で、その模型がどれくらいうまく動くのかを確かめることはとても大切です。うまく動く模型を選ぶためにも、さらに良い模型を作るためにも、模型の働き具合を正しく測る必要があります。模型の働き具合を測る方法はたくさんありますが、その中で平均絶対パーセント誤差(略してMAPE)は、分かりやすく使いやすい測り方としてよく使われています。この文章では、MAPEとは何か、どんな良い点や悪い点があるのか、そして実際にどのように使うのかを詳しく説明します。MAPEを正しく理解すれば、機械学習の模型をもっとうまく評価できるようになります。
MAPEは、実際の値と模型が予測した値の差をパーセントで表したものです。例えば、ある商品の実際の売上が100個で、模型が110個と予測した場合、誤差は10個です。この誤差を実際の売上100個で割ってパーセントにすると、誤差は10%になります。MAPEは、複数のデータの誤差の絶対値を平均した値をパーセントで表すので、それぞれの誤差のプラスマイナスを気にせずに全体的な誤差の大きさを把握できます。このため、MAPEは非常に分かりやすく、ビジネスの現場などでも使いやすい指標となっています。
しかし、MAPEには実際の値がゼロに近い場合、誤差が無限大になってしまうという欠点があります。例えば、実際の売上が1個で、模型が10個と予測した場合、誤差は9個で、これを1個で割ると誤差は900%という大きな値になります。このような場合、MAPEは信頼できる指標とは言えません。また、MAPEは過小予測よりも過大予測を大きく評価するという性質も持っています。例えば、実際の売上が100個の場合、模型が90個と予測した場合の誤差は10%ですが、110個と予測した場合の誤差も10%です。しかし、MAPEは過小予測よりも過大予測を大きく評価してしまうため、この2つの場合の評価は同じになりません。
このように、MAPEにはいくつかの欠点もありますが、分かりやすさという点で大きな利点があります。MAPEを正しく理解し、その欠点に注意しながら使用することで、機械学習の模型の評価をより効果的に行うことができるようになります。
