写真●富士通 執行役員常務 コンバージェンスサービスビジネスグループ長の川妻庸男氏(写真:中根 祥文)
写真●富士通 執行役員常務 コンバージェンスサービスビジネスグループ長の川妻庸男氏(写真:中根 祥文)
[画像のクリックで拡大表示]

 「ビッグデータの活用で目指すところは、人間とコンピュータの共生。2012年はその元年になる」――。富士通 執行役員常務 コンバージェンスサービスビジネスグループ長の川妻庸男氏(写真)は2012年2月29日、東京・有楽町で開催された「Cloud Days Tokyo/スマートフォン&タブレット/ビッグデータEXPO」で講演。事例を交えつつ、富士通のビッグデータに対する取り組みを紹介した。

 コンピューターシステムを開発する企業は、今まで生産管理、販売、人事、経理などの各種システムを作ってきた。例えば自動車の製造メーカーなら、“どんな自動車を作るか決まった後”で、それを効率よく作るために生産管理システムを採用したり、より多く売るために販売システムを使ったりする。だが、ユーザーが本当に求めているのは何かと考えると、それは「そもそもいい自動車を作る方法」だ。また、小売業からは「POSデータからはわからない、『お店で顧客が商品を買わなかった理由』を店内の導線から推測できないか」など、昔に比べて難しいリクエストがあがってきているという。今後は、こうした従来にない要求に対して「現実世界の家庭や仕事場から様々な情報を大量にセンシングし、解析して、人間にフィーバックしていくコンピュータシステムが必要となる」(川妻氏)と予測。これを実現するための一つの要素が、ビッグデータだという。

 川妻氏は、大量のデータを集めて解析するというと、「昔のデータウエアハウスと何が違うのかと思われるかもしれないので、その差異も説明したい」と語る。これまでのコンピュータシステムでも、現実世界からデータを収集することはしていた。ただし、「エラーが発生したときだけ」など、限られた範囲でデータを集めており、「かなりの量のデータを捨てていた。これは投資対効果の側面から、すべてのデータを収集するのが現実的でないと考えられていたため」(川妻氏)である。近年では、もっと広範囲のデータを取得し、そこに新しい価値を見出そうという考え方が出てきたという。もう一つ、これまでのデータ分析では「優れた技量を持つ人間の考え方を集め、それを裏付ける」という側面が強かったが、「ビッグデータでは“データに語らせる”のが特徴」(川妻氏)だとしている。順番に見ていこう。

「モノ」と「コト」にまつわる大量のデータを解析する

 川妻氏は、「単純にコンピュータなどの“モノ”があるというだけではなくて、“電源を入れた”“どのように、どのくらいの時間使っている”といった出来事――いわば“コト”を一緒に集めて解析する必要がある」という。ごく簡単な例として、人感センサーと、鍵が備わっている家があったとしよう。玄関のドアの鍵が開いて、その後で人感センサーが動いたら「家の主が帰宅した」ということ。反対に人感センサーが動いてから鍵が開いたら、「泥棒が入ってきた」可能性が高いというわけだ。

 こうしてセンシングした大量のデータを解析するとどんなことがわかるのか、川妻氏が紹介した多数の事例から、いくつかの例を見ていこう。

 例えば富士通と米ボーイング、米アラスカ航空が共同で取り組んでいる実証実験がある。航空機の備品などにRFIDタグを付与し、運用や整備業務を効率化する試みだ。最初は備品から始め、将来的には部品などの管理の効率化も実現したいという。備品の需要だけでなく、部品の故障や劣化の周期なども含めて解析することで、コスト削減や安全性の向上を目指すという。

 そのほか、位置情報や交通情報を利用したサービス「SPATIOWL(スペーシオウル)」がある。例えば、タクシーの走行情報、位置情報などを収集し、Webブラウザー上で都内の道路で渋滞しているところを地図に示す、といった使い方ができる。このシステムは、位置情報とほかの様々な情報を重ね合わせて示すことができるのが特徴だ。例えば東日本大震災の被災地の一部では、道路の復旧情報を市役所から発信するのにも利用されているという。

 なお、富士通では2012年1月から、大量のデータを蓄積して解析に使うためのPaaS「データ基盤活用サービス」を稼動させている。PaaSという形で提供を始めたのは、「ビッグデータを活用した解析は、導入して効果があるか見通しが立てにくい」(川妻氏)ため。どのデータに価値があるのか、どのように解析すれば効果があるのか、導入前の判断が難しい。そこで、PaaSという形で、スモールスタートも可能にしたかったという。

機械学習によって「データそのものに語らせる」

 川妻氏がビッグデータの特徴として挙げたもう一つのポイントは「データに語らせる」という点だ。「大量のデータを、先入観なくコンピュータに学習させる」(川妻氏)。こうした手法は機械学習と呼ばれ、今まで人間の力ではできなかった分析が可能になるという。

 例として挙げられたのは、富士通研究所の研究員が開発したコンピューター将棋ソフト「ボンクラーズ」である。ボンクラーズは、保木邦仁氏によって2005年に開発された「ボナンザ(Bonanza)」というプログラムをベースにしている。「ボナンザ以前の将棋ソフトは、将棋をよく知っている人が、自分が指し手を決める際の思考の過程を、500個くらいのパラメータとしてコンピュータに教えるものだった」(川妻氏)。ここでいうパラメータは、状況によって変わる各駒の価値などを分析し、有効な指し手を割り出すための材料になる値のことだ。

 ところが、ボナンザではプロ棋士が過去に残した約5万局の棋譜をそのまま機械学習させ、コンピュータが自動的に約9000万ものパラメータを作り出した。開発者は将棋の指し手の思考、駒の重み付けなどは指定していないが、「過去のプロ棋士のデータを元にして、一瞬にして従来よりも強いソフトができた」(川妻氏)。ボンクラーズはボナンザをクラスタ化して、より高性能にしたシステムである。ボンクラーズは2012年1月、日本将棋連盟の永世棋聖である米長邦雄氏と対局し、勝利している。

 ボンクラーズは将棋盤の範囲内の例だ。一方で、もっと複雑な業務でビッグデータの活用する際には、「データ解析をする数学的素養のある人間と、業務の専門家の両方が必要になるだろう」(川妻氏)という。川妻氏は富士通社内での実験的な取り組みとして、社員2万6000人分のレセプトデータ、健康診断データ、ヴァイタルデータ(1日あたりの歩数、体重など)を分析し、「来年、糖尿病を発症する率」を割り出すというシステムを開発しているという話を紹介した。

 「例えば、解析するデータの値の種類が二つ、数が2人分なら、ある病気が発症するかどうかは2次元で判断することができる。これが数十種類になると、もっと多くの次元を考慮しなければならず、人間ではとても考えることはできない。そこでどうやるかというと、サポートベクターマシンなどの手法を使ってコンピュータにデータを学習させ、解析する」(川妻氏)。例えば2万6000人分のデータなら、2千数百の次元を使って「発症するかしないか」を分析できるという。ここに新しいデータを投入して分析した結果の正答率は、現在、約96%になる。これは医師が知識と経験に基づいて判断を下す際のロジックとは、まったく異なる手法で導き出された、「データが語る」結果だ。川妻氏は、現場ではこのように「データが語る」内容と、これまでその業務をこなしてきたプロフェッショナルの判断を重ね合わせて使うことになるだろうと語った。