アルゴリズム PSPNet:画像セグメンテーションの革新
写真の分割、つまり写真の中のものを一つ一つ区別して切り抜く技術は、コンピュータに目を持たせる研究の中でも特に難しい問題です。まるで人間が目で見て、それが何であるかを理解し、輪郭を正確に捉えるかのように、コンピュータにもそれをさせたいのですが、これが簡単ではありません。
まず、物の形や大きさは様々です。丸いボールもあれば、複雑な形の自転車もあります。大きな建物もあれば、小さな昆虫もいます。これらをすべて同じように認識させるのは至難の業です。
さらに、背景が複雑だと、写真の中のものを切り抜くのはさらに難しくなります。例えば、木々の葉っぱが重なり合っていたり、太陽の光が影を作っていたりすると、物体の境界線がぼやけてしまい、コンピュータが正しく認識できません。また、人物の手前に木の一部が重なっていた場合、コンピュータは木の一部を人物の一部と誤って認識してしまうかもしれません。人間であれば、経験や知識からそれが別々の物体だと判断できますが、コンピュータにはそれが難しいのです。
これまでの技術では、写真の一部分だけを見て判断していました。そのため、写真全体の状況を理解できず、間違った判断をしてしまうことがありました。例えば、木の一部だけを見ると建物の一部と似ているため、木を建物と間違えてしまうことがありました。また、人の腕が背景と似た色をしていた場合、腕を背景の一部と見なしてしまうこともありました。
このような問題を解決するために、周りの状況も理解しながら判断できる、より賢い技術が必要とされています。写真全体を見て、何が写っているのか、それぞれの物の関係はどうなっているのかを理解することで、より正確に物を切り抜けるようになると期待されています。
