アルゴリズム 残差平方和:モデルの精度を測る
統計や機械学習の世界では、作った模型がどれくらい実際のデータに合っているかを測ることはとても大切です。そのために「残差平方和」という尺度がよく使われます。これは、模型による予測値と、実際に観測された値との間のずれを測るものです。
まず、それぞれのデータについて、観測値と予測値の差を計算します。この差を「残差」といいます。残差が小さいということは、模型の予測が実際の値に近かったことを意味します。逆に残差が大きい場合は、予測が外れていたことを示します。
単純にそれぞれのデータの残差を足してしまうと、正の残差と負の残差が打ち消し合ってしまい、ずれの全体像を正しく捉えられません。そこで、それぞれの残差を二乗してから合計します。これが残差平方和です。二乗することによって、すべての残差が正の値になり、打ち消し合いの問題がなくなります。
残差平方和の値が小さいほど、模型の予測精度が高いと言えます。これは、観測値と予測値のずれが小さいことを意味するからです。逆に、残差平方和が大きい場合は、模型の予測精度が低いことを示します。
残差を二乗するもう一つの利点は、大きなずれをより強調できることです。例えば、残差が2倍になると、二乗した値は4倍になります。これは、大きなずれを持つデータが模型の精度に与える影響をより大きく反映させることを意味します。この性質は、外れ値と呼ばれる極端に大きなずれを持つデータの影響を評価する際に特に役立ちます。つまり、残差平方和は、模型の全体的な予測精度だけでなく、外れ値に対する感度も評価できる尺度なのです。
