
予測精度を測る指標:平均二乗パーセント誤差の平方根
機械学習は、まるで人のように学ぶことができる計算機を作る技術であり、様々な分野で応用されています。作った計算機の良し悪しを見極めることは、より良い計算機を作る上で欠かせません。そのためには、計算機の性能を正しく測る物差しが必要です。性能を測る物差しはたくさんありますが、その中で平均二乗パーセント誤差の平方根という物差しは、特に広く使われています。この物差しは、計算結果と実際値の差を割合で表すため、計算結果がどれくらい実際値からずれているかを直感的に理解しやすいという利点があります。例えば、商品の売れ行きを予測する計算機の場合、この物差しを使うことで、予測のずれが売上にどれくらい影響するかを簡単に把握できます。
この物差しは、計算結果と実際値の差を二乗し、その平均を計算した後に平方根を取るという手順で求められます。二乗する理由は、ずれの大きさを強調するためです。もし二乗しなければ、プラスのずれとマイナスのずれが相殺されてしまい、ずれの全体像を正しく捉えられません。また、割合で表すことで、異なる単位のデータでも比較できるようになります。例えば、商品の重さのような単位と、商品の値段のような単位を直接比べることはできませんが、割合に変換することで比較可能になります。
しかし、この物差しにも欠点があります。例えば、実際値がゼロに近い場合、計算結果が少しずれただけでも、物差しの値が非常に大きくなってしまうことがあります。これは、ゼロで割ることができないためです。このような場合は、物差しの値が正しく計算機の性能を反映しているとは言えません。また、この物差しはずれの大きさに重点を置いているため、ずれの方向(プラスかマイナスか)は考慮されません。つまり、計算結果が実際値よりも常に大きくても小さくても、物差しの値は同じになります。
このように、平均二乗パーセント誤差の平方根は、直感的に理解しやすいという長所を持つ一方で、実際値がゼロに近い場合に値が不安定になる、ずれの方向を考慮しないといった短所も持っています。そのため、この物差しを使う際は、これらの特徴を理解した上で、他の物差しと組み合わせて使うなど、状況に応じて適切に使うことが重要です。