本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 「見て、試して、学ぶ」─。まるで子供向け体験教室のキャッチコピーかのような名称のロボット向け機械学習アルゴリズムを、米グーグルが考案した。

 人間のお手本動作を基にそれをマネするように学習する「模倣学習(imitation learning)」と、強化学習のような試行錯誤の要素を組み合わせた学習手法である。グーグルの持ち株会社、米Alphabet社傘下の研究機関であるX(エックス)と、グーグルの研究部門であるグーグルBrainが共同で開発した。内部でディープラーニング技術を用いている。

 機械学習技術を用いてロボットに何らかのタスクを覚えさせようとする際、課題となるのが「複数のタスクをどう効率的に学習するか」である。単一のタスクであれば、そのタスクのお手本動作を大量に集め、それらを教師あり学習させるというアプローチが取れる。

新しいメタ学習手法を開発したグーグル
(写真:Google)

 しかし、タスクの種類が異なっていたり、似たタスクでもオブジェクトの配置などが異なっていたりなど、現実空間では微妙な差異が多くある。

  1つのモデルのみで、こうした多様なタスクに対応しようとすると、個々のタスク実行時の性能や精度が低下し、うまくこなせない。また、タスクごとに専用のモデルを用意するとなると、多様なタスクのデータを集めて別々に学習させる必要があり、手間が掛かる。

複数タスク間の共通性生かす

 そこで、多様なタスクであってもそれらの間に何らかの共通要素があると考え、その共通要素を使ってうまく学習しようとするアプローチが最近注目を集めている。それが「メタ学習(meta-learning)」である1)

この先は日経Robotics購読者限定です。