この記事は日経Robotics 有料購読者向けの記事ですが
日経Robotics デジタル版(電子版)』のサービス開始を記念して、特別に誰でも閲覧できるようにしています。
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 スポーツ選手が、コーチの示したお手本の動作を見て、自分でも真似して動作を改善していく─。

  スポーツの分野などで人間が自然と行っているこのようなトレーニングの形態を(図1)、ディープラーニングを応用してロボットで実現する技術が登場した。

 ロボット向けディープラーニング技術の世界的気鋭で、本誌でも度々登場しているUniversity of California Berkeley(UCB)准教授のSergey Levine氏らのグループが2018年2月に発表した技術である。

  Levine氏はUCBだけでなく、AI研究の世界トップ集団である米グーグルでもResearch Scientistを務め、英DeepMind社などとも連携してロボット向けディープラーニング技術を研究している、まさに世界の最先端を行く人物である。今回の技術は、そんな人物が満を持して発表したものだ。

図1 お手本の動作を見て自らの動作を改善する「模倣学習」
模倣学習は、スポーツなどにおいてコーチの動作を見ることで、選手が自らの動作を修正・改善するようなイメージで、ロボットへの教示を可能にする。
[画像のクリックで拡大表示]

例示から動作意図を獲得

 今回、Levine氏らが開発したのは「DAML(domain-adaptive meta-learning)」という技術である1)。名称はさも難しそうだが、要は実際の動作の例示(demonstration)を基にしてロボットが動作を獲得する「模倣学習(imitation learning)」という技術の一種である。

 模倣学習は本誌が2017年12月号のアセントロボティクスの記事でも紹介したように2)、「learning from demonstrations(LfD)」や「徒弟学習(apprenticeship learning)」とも呼ばれており、現在、ディープラーニングの領域で非常にホットになっているテーマだ。今回のDAMLは、模倣学習の中でも特にカメラで見た映像を基にして動作を真似ることから、「見まね学習(learning by watching)」と呼ばれるジャンルになる(図2)。模倣学習はロボットに所望の動作を効率的に獲得させられるため、実用化できれば産業用ロボットからサービスロボットまで幅広い範囲のロボットに影響を及ぼす。現状のロボットの煩雑な教示作業を根本から変える可能性を秘めている(表1)。

図2 人の振りを見てロボットが動作を真似る
ロボットに実施させたいタスクを人間が実際にやって見せる。ロボットはその映像を1回(1サンプル)与えられるだけで、その動作を覚え、自ら実施することができる。遠隔操作のリプレイのように軌道データをそのまま記録・再生している訳ではないため、対象物の配置や背景などが教示時と変わっていても柔軟に対応できる。(写真:UCB)
[画像のクリックで拡大表示]
表1 ロボットにタスクを行わせる際の主なアプローチ
[画像のクリックで拡大表示]

one-shot learningを実現

 今回のDAMLという技術を使うと、ロボットはお手本をわずか1回(1サンプル)見せられただけで、すぐにそのタスクの意図を把握・獲得し、同じ動作を自らのアームを使って実施できる。1サンプルのデータから学習できれば、ユーザーは現場で所望の動作をロボットに見せるだけで教示を完了できるため、非常に効率的である。

 しかもDAMLは、現状の産業用ロボットのティーチングのように動作の軌道データを“丸暗記”して再生する訳ではなく、人が示したタスクの意図を把握した上で、その場の状況をカメラで見ながら動的に軌道を生成する。このため、対象物の配置や種類が変わっても対処できる。既存技術でも、画像認識などで対象物を検出すれば場所の変動には対処できるが、それでも対象物の種類が頻繁に変わるケースには対処しにくい。

 一般にディープラーニングをはじめとする機械学習技術では、何らかの情報や識別能力をシステムに獲得させる際、大量のデータが必要である。こうした点を改善すべく、学習データが少なくても済むような手法が模索されてきた。DAMLのように1サンプルのみのデータから学習することは特に「one-shot learning」と呼ばれ、本誌でも2018年2月号の記事3)で解説したように最近特に活発に研究されている。DAMLはこうしたone-shot learningを、見まねタイプの模倣学習でディープラーニングにより実現したものだ。

練習の積み重ねで真似上手に

 そもそもコーチなど他人が示した動作を見て、自分でもそれを真似るというのは、ロボットだけでなく人間にとっても難しいことがある。鬼コーチに「こうやるんだ!」と手本を見せられても、すべての選手がすんなりと真似できるとは限らない。

 他人がやってみせた動作をすぐに覚えて真似するのが難しいのはさまざまな要因があるが、例えば、自分の身体を器用にコントロールするのが難しい、コーチの示す動作のどこがポイントなのか見ただけでは分からない、自分の身体のどの部分にどのように力を入れればいいのか感覚が掴めない、といった要因があるだろう。

 こうした難しさがあるのは、ロボットでの模倣学習でも同じである。DAMLはそれを、有能なスポーツ選手が行う練習のようなアプローチで解決している。おおまかに以下のようなイメージだ。