本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 強化学習の創始者の一人であり、この分野を長年にわたってリードしてきたUniversity of Alberta教授のRichard Sutton氏が「The Bitter Lesson」(苦い教訓)というタイトルで記事を投稿した(図11)。以下にその内容を簡単にまとめる。

苦い教訓

著者の岡野原大輔氏

 この70年間のAI研究で得られた最も大きな教訓は、計算能力を活かした汎用の手法が最終的には最も有効であったということである。この背景にあるのはムーアの法則として知られる計算能力の指数的な性能向上である。一般にAIの研究では、エージェントの計算能力は固定だと考える。この場合、AIの性能を向上させるためには人間のドメイン知識をシステムに埋め込むしかない。しかし、一般的な研究プロジェクトの期間より長い期間でみると、計算能力の向上を活かした汎用の手法が最終的に大きな差をつけて有効だとわかる。

 例として、チェスでは1997年に米IBM社のDeep Blueが世界王者のGarry Kasparov氏を破った。この実現のために特別なハードウエアを開発し、力技の探索ベースの手法を利用した。多くのAI研究者は人の知識を埋め込んだ手法が勝つことを願ったがそうではなかった。囲碁はそれから20年を必要としたが、米グーグルDeepMindのAlphaGoが世界トップ棋士のイ・セドル氏を破った。ここでは学習にニューラルネットワークに特化したハードウエアであるTPUを利用し、自己対戦学習とモンテカルロ木探索を利用して破った。音声認識と画像認識でも、専門知識を持った研究者が設計した特徴や識別器を使った手法が多く開発されてきたが、それらは現在、大量の学習データと計算リソースを使った深層学習を利用した手法に置き換わっている。

図1 強化学習の創始者であるRichard Sutton氏
[画像のクリックで拡大表示]

 これらの経験をまとめると、AI研究者たちは最初はドメイン知識をシステム上に構築する。それらは短期間では有効だが、いつしか停滞し始め進歩が止まってしまう。そして長期的には全く別のアプローチである計算性能の向上を活かした探索と学習を中心とした手法が大きなブレークスルーを上げ、ドメイン知識を埋め込んだ手法を大きく上回る。これらの成功は人間を中心としたアプローチではないため、AI研究者達には受け入れられず苦味を帯びた成功として受け止められる。

 また、知能や心というのは非常に複雑であり、単純な方法では心の内容(場所、物体、複数エージェントなど)を実現できない。これらは非常に複雑な世界の一部分であるためだ。単純な方法を追求する代わりにこれらの複雑な現象や仕組みを見つけ捉えられるようなメタ手法(手法を見つける手法)を探すべきだ。これらの複雑な現象を近似できる手法を見つけるのは私たちではなく、私たちが開発した手法だ。

AI研究において人がAIに取って代わられるか

 この記事はAI研究者達の間で議論を巻き起こした。この考えを支持する人も多くいれば、反論する人たちもいる。

この先は日経Robotics購読者限定です。