アルゴリズム マージン最大化で分類精度向上
ものの見分けをするときに、異なる種類のもの同士を分ける線を考えるのは大切なことです。 この分け方次第で、新しいものに出会った時に、それがどれに当てはまるのかをうまく判断できるかどうかが決まります。ここで「間隔の最大化」という考え方が役に立ちます。
間隔の最大化とは、種類が違うものの集まりを分ける線を引くときに、その線とそれぞれのものの集まりとの間の距離をなるべく大きくするという考え方です。この、線とものの集まりとの間の距離を「間隔」と呼びます。間隔を広く取れば取るほど、新しいものに出会った時に、それがどの種類に当てはまるのかをより確実に見分けることができるようになります。
たとえば、二つのグループが縄張り争いをしているとしましょう。それぞれのグループの縄張りを分ける線を引くときに、どちらのグループにも属さない中間地帯をできるだけ広く取ると、縄張り争いが起きにくくなります。これは、グループのメンバーが誤って相手の縄張りに侵入してしまう可能性を減らすからです。この中間地帯こそが間隔に相当します。間隔が広ければ広いほど、より安全に、そして確実にそれぞれのグループを分けることができます。
間隔の最大化は、機械にものの見分け方を教えるときにも使われています。たとえば、手書きの文字を認識する機械を想像してみてください。たくさんの手書き文字のデータを使って機械に学習させるとき、間隔の最大化を使うことで、どの文字がどの文字なのかをより正確に見分けることができるようになります。これは、新しい手書き文字を見せられたときにも、それがどの文字なのかをより高い精度で判断できるようになることを意味します。このように、間隔の最大化は、ものの見分けの精度を向上させるための重要な技術なのです。
