アルゴリズム 距離学習:データの識別を容易にする手法
距離学習とは、ものごとの間にある隔たり、すなわち距離をコンピュータに学ばせる手法です。ものごとの間柄を理解しやすくするために、似たもの同士は近くに、似ていないもの同士は遠くに配置するよう、コンピュータに距離の測り方を覚えさせます。
たとえば、果物を分類する場合を考えてみましょう。りんご、みかん、バナナの絵をコンピュータに見せるとします。このとき、甘さ、酸味、色といったそれぞれの果物の特徴を数値で表します。これらの数値を特徴量と呼びます。距離学習では、りんご同士は近くに、りんごとは異なるバナナは遠くに配置されるように、甘さ、酸味、色といった特徴量の組み合わせ方をコンピュータが自動的に調整します。この調整によって、果物の種類をより正確に見分けられるようになります。
従来の方法では、人間がそれぞれの果物の特徴量の組み合わせ方を手作業で調整する必要がありました。たとえば、りんごを分類する場合、「赤色であること」を重視し、「甘さ」を軽視するといった具合です。しかし、この作業は大変な手間がかかり、人間の経験や勘に頼るため、必ずしも最良の結果が得られるとは限りませんでした。
一方、距離学習では、大量の果物のデータから、コンピュータが自動的に最適な特徴量の組み合わせ方を学習します。これにより、人間の手間を省くだけでなく、人間の勘に頼るよりも精度の高い分類が可能になります。また、果物だけでなく、様々な種類のデータに適用できるため、応用範囲の広い手法と言えるでしょう。たとえば、顔写真の分類、音声の認識、文字の識別などにも利用できます。距離学習は、今後ますます発展が期待される技術の一つです。
