2019年10月、囲碁より難しいとされる戦略ゲームでAIが人間に勝った。「たかがゲーム」と侮っては本質を見誤る。がん診断などでも専門医を超え始めた。先頭を走るのは米グーグルだ。

 囲碁の世界トッププロに勝利したAI「AlphaGo」の開発実績で知られる、米グーグル系AI開発会社の英ディープマインドが2019年10月、再び世界を驚かせた。同社が開発したAI「AlphaStar」がリアルタイム戦略ゲーム「StarCraft II」のオンライン対戦で「世界の上位0.2%入り(グランドマスターレベル)を達成した」と発表したのだ。StarCraft IIは米ブリザードエンターテインメントが開発しオンラインで提供する戦略ゲームである。

図 囲碁と戦略ゲーム「StarCraft II」の比較
囲碁より現実世界に近く複雑だ(写真(左):123RF、写真(右):米ブリザードエンターテインメント)
[画像のクリックで拡大表示]

 StarCraft IIは日本語版がなく日本での知名度は高くない。しかし世界的には人気の高いゲームで、多数の「プロゲーマー」も存在する。StarCraft IIでAIが人間に勝つのは囲碁や将棋で勝つよりも難しいと考えられてきた。そのためAlphaStarの「偉業」は米CNNなどの一般メディアも取り上げるなど欧米で関心を集めている。

 StarCraft IIがAIにとって難しいと考えられてきたのは、囲碁や将棋に比べてルールや判断が複雑だからだ。StarCraft IIはSFを題材にした戦略ゲームで、プレーヤーは数百のユニット(駒)にリアルタイムに指示を出して相手を攻撃する。囲碁や将棋のような交互に操るターン制ではない。

 囲碁や将棋に比べて「視界」が狭いことも複雑さにつながる。StarCraft IIのプレーヤーは「カメラ」を通じてマップの一部だけが見える。味方の周辺以外は相手の情報が見えない。プレーヤーは限られた情報に基づいて次の1手を考える必要がある。

 さらにStarCraft IIのユニットには相手を攻撃する「戦闘ユニット」だけでなく、資源を収集してユニットや建物をつくる「労働者ユニット」など様々な種類がある。加えて絶対的に強いユニットは存在せず、ユニットの種類に応じてじゃんけんのグー・チョキ・パーのような力関係がある。プレーヤーは攻撃プランといった短期戦略と同時に、ユニット生産計画といった長期戦略も考慮する必要がある。

 ディープマインドはAlphaStarを「深層強化学習」によって開発した。コンピューターが試行錯誤を通じてタスクを実行する最適なやり方を学習していく「強化学習」と、ニューラルネットワークを多段に組み合わせる「ディープラーニング(深層学習)」を組み合わせた機械学習の手法だ。

 深層強化学習ではコンピューターのプレーヤー(エージェント)同士を実際に対戦させて試行錯誤を繰り返す。エージェントは対戦を重ねながらゲームに勝つという「報酬」を得やすいように自身の戦略(ポリシー)を更新して強くなっていく。

図 AIによる人間超えの年表
より複雑なタスクをこなせるように
[画像のクリックで拡大表示]

この先は有料会員の登録が必要です。「日経コンピュータ」定期購読者もログインしてお読みいただけます。有料会員(月額プラン)は初月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら