本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 人は2次元の画像のみから物体の3次元情報を推定でき、その形状や位置関係、構成関係を認識することができる。さらに、物体をさまざまな視点から見れば、ほぼ完璧な3次元情報を得ることができる。例えば、部屋の中に入ってその中を歩き回って見ているうちに部屋の中のどの位置にどんな物体が置かれているのかという3次元地図ができてくる。このような3次元地図さえできれば、違う視点からどのように見えるのかを推定することもできる。

著者の岡野原大輔氏

 このような3次元構造の認識は多くのタスクの実現に重要でありこれまで多くの研究が存在する。複数視点の画像から3次元構造を推定するタスクはStructure From Motionと呼ばれる。この中で特に自己位置推定も同時にしながらオンラインで位置推定と3次元構造の推定を行うタスクはSLAMと呼ばれる。

この先は日経Robotics購読者限定です。