コンピューターがクイズ王に勝った――。2011年2月、米IBMが開発したコンピューターシステム「Watson」が米国のクイズ番組に出演し、クイズ王を抑えて優勝したというニュースは、国内でも大きく報道された。このWatsonの開発には、実は日本IBMの東京基礎研究所も携わっている。2011年3月9日、同研究所の武田浩一氏が講演し、Watsonの技術について詳しく説明した。

 武田氏が講演したのは、平成22年度 科研特定領域「情報爆発IT基盤」成果報告会。文部科学省の補助金を受け、2005年度から2010年度にかけて行われた大規模な研究プロジェクト「情報爆発時代に向けた新しいIT基盤技術の研究」の成果報告会で、基調講演を行った。

 Watsonは、約4年の歳月をかけた大規模プロジェクトだったという。世界各地の研究者25名をはじめ、8大学の協力も得て研究開発を進めた。IBMは過去に、チェスの世界チャンピオンを負かしたスーパーコンピューター「Deep Blue」を開発しているが、「それに次ぐグランドチャレンジ」(武田氏)だったという。クイズ問題のジャンルを限定せず、どんな質問でも受け付けるというのは、非常にハードルが高いテーマだ。「人間のレベルに到達することに、研究的な価値があった」(武田氏)。

非構造情報から答えを導き出す

 Watsonの技術は、「質問応答の延長線上にある」(武田氏)。質問応答とは、与えられた質問に対して、解答そのものを返すという技術。インターネット上のWebページなど大量の文書データの中から答えとなり得る情報を抽出するもので、世界中のさまざまな研究機関がこのテーマに取り組んでいる。チェスの次にこのテーマを選んだ理由は、「テキストや画像といった非構造情報(データベースのように構造化されていない情報)が増えている。この状態に対する解を見つけたい」(武田氏)と考えたからだ。

 Watsonが出演したのは、米国で歴史と人気のあるクイズ番組「Jeopardy!」。問題を司会者が読み上げるとともに画面にも表示され、解答が分かった人がボタンを押して答える形式だ。Watsonは音声認識機能を持たないため、文字で問題の情報を取得し、人間の回答者と同じボタンをシリンダーで押して解答した。

 クイズ王との対戦に備え、事前に百科事典サイト「Wikipedia」などから集めた70GBほどのテキスト情報を解析。これを情報源としてWatsonに蓄えておいた。「10年くらい前にWebから集めた情報に比べると、現在Wikipediaのようなソーシャルメディアで作られているものは質が高い」(武田氏)。オンライン上に高品質な情報が豊富にあったことも、Watsonには有利に働いたという。実際の対戦時には、Watsonはインターネットに接続しておらず、内部に蓄積したデータを使って解答した。

この先は会員の登録が必要です。有料会員(月額プラン)は初月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら