平均二乗対数誤差

記事数:(2)

アルゴリズム

RMSLE入門とは?意味・計算式・RMSEとの違いをわかりやすく解説

機械学習を用いて作った予測の良し悪しを正しく見極めるには、目的に合った評価方法を選ぶことが大切です。評価方法には様々な種類があり、それぞれの特徴を理解して使う必要があります。今回は、正の値を予測する問題でよく使われる「平均二乗対数誤差(へいきんにじょうたいすうごさ)」、略して「RMSLE」について説明します。 RMSLEは、予測値と実際の値がどれくらい離れているかを相対的に評価する方法です。たとえば、100万円の売り上げを90万円と予測した場合と、10万円の売り上げを9万円と予測した場合を考えてみましょう。どちらも金額の差は10万円ですが、RMSLEでは後者の予測をより正確だと判断します。これは、RMSLEが実際の値の大きさではなく、予測値と実際の値の比率に着目しているためです。100万円の場合、予測は実際の値の90%ですが、10万円の場合は90%です。つまり、RMSLEは売り上げ規模の大小に関わらず、予測の精度を相対的に評価するのです。 RMSLEは、対数を使って計算します。まず、予測値と実際の値の比の対数を取り、その差を二乗します。次に、全てのデータについて二乗した差の平均値を計算し、最後にその平方根を求めます。数式で表現すると少し複雑に見えますが、基本的な考え方は、予測値と実際の値の比率がどれくらい1に近いのかを見るということです。 RMSLEは、特に実際の値の範囲が広い場合に有効です。例えば、不動産価格や商品の売り上げなど、桁が大きく異なる値を予測する際に、RMSLEを使うことで、小さな値の予測精度も適切に評価できます。一方、RMSLEは実際の値が0に近い場合や負の値をとる場合には使えません。そのような場合は、他の評価方法を検討する必要があります。
学習

MSLE(平均二乗対数誤差)とは?計算式とMSE・MAEとの違いを解説

平均二乗対数誤差(略して平均二乗対数誤差)は、機械学習モデルの良し悪しを測る物差しの一つです。特に、予想した値と本当の値の比率がどれくらい合っているかを重視したい時に使われます。例えば、お店の売り上げや株価の予想のように、予想した値と本当の値の大きさそのものよりも、その比率がどれほど正確かが大切となる場合に適しています。 この物差しは、予想した値と本当の値、それぞれを対数変換した後に、その差を二乗し、全てのデータの平均を取ることで計算されます。対数変換した値の差を使うことで、大きな値同士の差よりも、小さな値同士の差に敏感になります。つまり、比率の違いをより正確に捉えることができるのです。例えば、予想が本当の値の半分だった場合と、2倍だった場合のペナルティは同じになります。これは、100円の商品の売り上げを50円と予想するミスと、10円の商品の売り上げを20円と予想するミスを同じ重さで扱うことを意味します。 また、対数変換によって、値の範囲が狭まるため、極端に大きな値や小さな値といった外れ値の影響を少なくする効果も期待できます。例えば、ある月の売り上げが通常よりも極端に高い値だったとしても、対数変換によってその影響が和らげられ、モデルの評価が大きく歪められることを防ぎます。これは、モデルの安定性を高めることに繋がります。 平均二乗対数誤差は、正の値しか取らないデータに適用できます。売り上げや株価など、値が必ず正となるようなデータの予測に適しています。しかし、ゼロや負の値を含むデータには適用できないため、注意が必要です。そのような場合には、他の適切な評価指標を用いる必要があります。