自動運転機能を備えた自動車、音声で操作するスマートスピーカーに象徴されるように、ディープラーニング(深層学習)をベースにしたAI(人工知能)の技術開発が進んでいる。そのためAIをビジネスに活用する企画提案をしたい、あるいはユーザー企業のそうした取り組みを支援したいと考えている方は少なくないだろう。実際に、AIを顧客サービスや業務で活用する取り組みが、様々な業種で始まっている。

 しかし、AIをどのように顧客サービスや業務に活用すればいいのかを考えるのは簡単ではない。

 そこで本連載では、AI活用を企画するヒントになるように、AIを容易に使えるようにしたクラウドサービス「Microsoft Cognitive Services」(以下Cognitive Services)の利用を前提として、具体的なユースケースを取り上げ、活用方法を紹介する。

 今回はまず、AI活用の企画に必要な基礎知識として、そもそもAIとは何かを解説する。そのうえで、Cognitive Servicesによって実現できるAIの種類や、具体的なサービス内容を紹介する。これらを正しく認識しておくことで、次回からのユースケースへの理解が深まる。

 なおこの連載では読者として、新規ビジネスや新サービスを構想するITエンジニアや企画担当者を想定する。AIを技術的に掘り下げるより、AI活用の企画に役立つ知識を身に付けることに主眼を置く。

ディープラーニングがAIのブレークスルーに

 最初にAIブームが起こったのは1960年代にさかのぼる。脳の機能をモデル化したニューラルネットワーク(パーセプトロン)が流行し、単純なパターン認識が可能になった。しかし、計算リソースの限界や知識を学習させる方法の難しさなどから、コンピュータが「知能」と呼べるレベルに到達しないまま、この第1次AIブームはいったん収束した。

 1980年代に入ると、処理のルールやパターンを細かく記述する「ルールベース」というアプローチが一般化。大量のルールやパターンをプログラムとして記述することで、比較的複雑な問題を解決できるようになった。これが第2次AIブームだ。

 だが、大量のルールを記述しそれらを適切に管理するのは容易ではない。しかも、ルールやパターンを明確に記述できる範囲に用途が限られた。

 そして現在の第3次AIブームでは、機械学習が実用化され、AIが大きく進歩している。背景には、クラウドサービスの登場によって調達できる計算能力が飛躍的に向上したことと、インターネットによる膨大なデータの蓄積がある。莫大なデータを大規模な計算リソースで処理し、コンピュータに知識を学習させる。そんなアプローチが可能になった。

 学習アルゴリズムについてもブレークスルーが起きた。第1次AIブームで考えられたニューラルネットワークを発展させたディープラーニングが注目されるようになった。

 端緒は、2012年に米Googleがディープラーニングを使って、コンピュータにネコの写真画像を入力して「ネコが写っている」と判断させたことだ。Googleが公表した論文によると、学習させた画像は1000万枚。1000台のサーバーで3日を要したという。

 クラウドによってそうした莫大なデータ量と計算リソースが利用できるようになり、様々な研究機関や企業が、写真に写っている人やモノを識別するような、ルールベースの処理では不可能な「あいまいな知的活動」を実現していった。

3種類に分けられるAI

 歴史を踏まえると、AIは大きく三つに分類できる。一つは「ルールベースのAI」で、残りの二つはどちらもデータによって知識や判断能力を得る「機械学習型のAI」だ。後者の内訳は、ディープラーニングを用いて主に識別を行うAIと、従来の機械学習技術によって主に予測を行うAIである。

 ここで、ディープラーニングは正確には機械学習の一種であり、機械学習はディープラーニングを含む。しかし本連載では、単に「機械学習」と表現したとき、ディープラーニングを含まないものとする。

 現在のAIブームをけん引するのは、ディープラーニングだ。ディープラーニングと機械学習の最大の違いは、何に着目して考えるかを、AIが自ら判断するか、人間が指定するかにある(図1)。

図1 機械学習とディープラーニングの学習方法の違い
機械学習では「特徴量」を人間が指定するが、ディープラーニングはその必要がない
[画像のクリックで拡大表示]

 例として、農家が栽培している果物の画像から熟成度を推測し、何日後に出荷すべきか判定するAIを考えよう。

 機械学習の場合、画像に含まれる様々な情報の中から着目すべき情報を指定し、画像とラベル(このケースでは、出荷すべき状態になるまでの日数)を組み合わせた教師データを大量に入力し、学習させる。果物の「色」が熟成度と強く関係するなら、「色に着目しなさい」と指示する。

 このような着目すべき情報を「特徴量」という。これは、農家が雇用した作業者に、何を見て出荷時期を判断するか説明したうえでトレーニングを積んでもらうのと同じこと。農家は、何に着目するか説明しなければならない。

 これに対してディープラーニングでは、人間が特徴量を指定しなくてよい。画像とラベルを組み合わせた教師データを大量に入力することで、AI自身が特徴量を見出す。これは、農家が何に着目すべきか説明できなかったのに、作業者が経験を積むうちに自ら気付くことを意味する。

 Googleが行ったネコの判別でも、実際にネコと他の動物との違いを見出すための特徴量を人間が示すのは難しい。しかし特徴量を指定する必要が無いのであれば、画像とラベルを組み合わせたデータが膨大にあれば、学習を進められる。

 ディープラーニングのこの特性は、画像認識だけでなく音声認識や言語処理でも、大きな威力を発揮している。

この先は有料会員の登録が必要です。今なら有料会員(月額プラン)が2020年1月末まで無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら