リアルとシミュレーションのギャップ

実世界を学ぶAI：オフライン強化学習

人工知能、とりわけ強化学習は様々な分野でめざましい成果を見せてきました。自動で車を走らせる技術や病気を見つける技術、機械の動きを操る技術など、その活用範囲は実に多岐にわたります。しかしながら、これらの技術を実際に世の中の仕組みを操る場面で使うには、乗り越えなければならない大きな壁があります。それは、現実世界で学ぶ際に伴う危険性です。例えば、自動で車を走らせる仕組みを作る場合、試行錯誤を繰り返しながら学習させるのは、事故の危険があり現実的ではありません。実際の道路で車を走らせながら学習させれば、思わぬ事態が起こり、人々に危害を加える可能性があるからです。安全な場所で試験走行を繰り返すことはできますが、現実の道路の複雑さや予測不能な状況に対応できるだけの十分な学習を行うのは難しいでしょう。同じように、病気を見つける仕組みを患者さんに直接使って学習させることは倫理的に許されません。診断の正確さが保証されていない段階で、患者さんに適用することは、患者さんの健康を危険にさらす可能性があるからです。過去のデータを使って学習させることはできますが、現実の患者さんの状態は多様であり、過去のデータだけでは十分に対応できない場合も考えられます。このように、現実世界で人工知能を学習させる際には、様々な危険性が伴います。そのため、現実世界で起こりうる様々な状況を想定した模擬実験環境を作るなど、安全に学習を進めるための工夫が欠かせません。また、限られたデータから効率的に学習する方法や、人間の知識を人工知能に教え込む方法なども研究されています。これらの技術開発が進展することで、人工知能はより安全に、そしてより効果的に現実世界の問題を解決できるようになると期待されています。

2025.02.01

AI活用