本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 2016年、グーグルDeepMind社が開発したAlphaGoが囲碁トップ棋士であるイ・セドル(Lee Sedol氏)氏に4-1で勝利し話題となった。囲碁は途中の盤面種類数が非常に多く、盤面の評価には感覚や大局的な視点が必要でありコンピュータには不得意とされてきた。AlphaGoはこうした見方を打ち破り、純粋にデータとゲームのルールだけからこのような能力を獲得できることを示した。

 一方で、コンピュータが人間のトッププレーヤーに及ばないゲームはまだ多く存在している。その代表的なゲームの1つがリアルタイム戦略(Real-Time Strategy:RTS)ゲームである「StarCraft II(スタークラフト2)」だ。

 スタークラフト2は他のリアルタイム戦略ゲームと同様に、複数のユニットにリアルタイムに指示を出しゲームを進めていく。労働者ユニットは環境上に散らばった資材を収集し、新しい建物やテクノロジーの開発を進めていく。ゲームに勝利するためにはそれらの建物やテクノロジーを使って、作成した戦闘ユニットを操り相手の陣地を破壊することが目標となる。

著者の岡野原大輔氏

 こうしたリアルタイム戦略ゲームでは、大局的な戦略に基づいて経済や戦闘を管理するマクロ操作と各ユニットを細かく操作して局地的な戦いに勝利するミクロ操作のバランスが重要となる。前者は戦略シミュレーションゲーム(例えば信長の野望など)に近く、後者はアクションゲームに近い要素が含まれる。

 2019年1月、グーグルDeepMind社はこのスタークラフト2において、同社が開発したAlphaStarが最強のゲームプレーヤーの1人であるMaNa(Grzegorz Komincz)氏に勝利したと発表した1)。このスタークラフト2をコンピュータで解かせる場合の問題は次の3つである。

図1 AlphaStarの対戦の様子を見守るDeepMind社の幹部
(写真:DeepMind社)
[画像のクリックで拡大表示]

この先は日経Robotics購読者限定です。