特徴量学習

記事数:(2)

距離学習：データの識別を容易にする手法

距離学習とは、ものごとの間にある隔たり、すなわち距離をコンピュータに学ばせる手法です。ものごとの間柄を理解しやすくするために、似たもの同士は近くに、似ていないもの同士は遠くに配置するよう、コンピュータに距離の測り方を覚えさせます。たとえば、果物を分類する場合を考えてみましょう。りんご、みかん、バナナの絵をコンピュータに見せるとします。このとき、甘さ、酸味、色といったそれぞれの果物の特徴を数値で表します。これらの数値を特徴量と呼びます。距離学習では、りんご同士は近くに、りんごとは異なるバナナは遠くに配置されるように、甘さ、酸味、色といった特徴量の組み合わせ方をコンピュータが自動的に調整します。この調整によって、果物の種類をより正確に見分けられるようになります。従来の方法では、人間がそれぞれの果物の特徴量の組み合わせ方を手作業で調整する必要がありました。たとえば、りんごを分類する場合、「赤色であること」を重視し、「甘さ」を軽視するといった具合です。しかし、この作業は大変な手間がかかり、人間の経験や勘に頼るため、必ずしも最良の結果が得られるとは限りませんでした。一方、距離学習では、大量の果物のデータから、コンピュータが自動的に最適な特徴量の組み合わせ方を学習します。これにより、人間の手間を省くだけでなく、人間の勘に頼るよりも精度の高い分類が可能になります。また、果物だけでなく、様々な種類のデータに適用できるため、応用範囲の広い手法と言えるでしょう。たとえば、顔写真の分類、音声の認識、文字の識別などにも利用できます。距離学習は、今後ますます発展が期待される技術の一つです。

アルゴリズム

深層学習：未来を拓く人工知能技術

深層学習とは、人間の脳の仕組みを真似た学習方法をコンピュータにさせる技術です。人工知能の分野で近年著しい進歩を見せており、機械学習という大きな枠組みの中の一つに位置付けられます。人間の脳には、神経細胞と呼ばれるものが複雑につながり合った神経回路が存在します。深層学習では、この神経回路を模倣した「ニューラルネットワーク」という仕組みを使います。このニューラルネットワークは、幾重にも層が重なった構造をしています。ちょうど、何層にも重ねられたミルフィーユのようなイメージです。この層の多さが「深層」と呼ばれる所以です。コンピュータはこの多層構造を利用して、大量のデータから複雑なパターンや特徴を見つけ出すことができます。たとえば、たくさんの猫の画像をコンピュータに与えると、コンピュータは自ら「猫の特徴」を学習します。耳の形、目の形、ひげ、毛並みなど、様々な特徴を捉え、最終的に「これは猫だ」と判断できるようになるのです。従来の機械学習では、人間がコンピュータに「猫の特徴」を教え込む必要がありました。たとえば、「とがった耳」「丸い目」といった具合です。しかし、深層学習では、コンピュータが自ら特徴を見つけるため、人間の手間が省けるだけでなく、より複雑な問題にも対応できるようになりました。深層学習は、画像を見分ける、音声を聞き取る、言葉を理解するといった様々な分野で活用されています。例えば、写真のどこに人が写っているかを自動的に判断したり、人間の声を文字に変換したり、外国語を翻訳したりといったことが可能になります。深層学習は多くのデータと高い計算能力を必要としますが、その精度は人間に匹敵、あるいは人間を超えるほどになってきています。まさに、未来を担う技術と言えるでしょう。