本記事は、日経エレクトロニクスの過去記事を再掲載したものです。社名や肩書きは執筆時の情報に基づいており、現在では異なる場合があります。

 羊の執事がユーザーのしゃべった内容を理解し、最適な回答を返してくれるNTTドコモの音声インターフェース・サービス「しゃべってコンシェル」。研究者のアイデアがきっかけとなって誕生したものだ。現在では主力サービスの1つに成長したが、開発当初は上司の理解を得ているとは言い難い状況だった。

NTTドコモ 先進技術研究所 コミュニケーションメディア研究グループの飯塚真也氏
(写真:加藤 康)
[画像のクリックで拡大表示]

 「いいんじゃない。やってみれば。まあ、俺は使わないけどね」――。

 2010年秋。この言葉をきっかけに、NTTドコモの研究チームが、あるプロジェクトに本格的に着手することになった。それは、音声を入力して最適な検索結果を表示するアプリケーションの開発である。このプロジェクトが後に、音声インターフェース・サービス「しゃべってコンシェル」を生み出すことは、まだ誰も知らない。

 開発を提案したのは、NTTドコモの研究開発部門に所属する、音声認識技術が得意な飯塚真也と、検索エンジン担当の吉村健である。2人は米グーグル(Google)の音声検索サービスなどに触発され、もっと進んだ形のサービスができないかと2010年初頭から検討を進めていた。

 Googleなどの音声検索サービスは、音声で入力した言葉の検索結果の一覧を表示するものだった。文字で入力する従来の検索サービスの延長上にあるといえる。これに対して飯塚らは、質問の意図を理解して最適な答えを提示できないかと考えていた。

NTTドコモ 研究開発センター サービス&ソリューション開発部 データマイニング担当 担当課長の吉村健氏
(写真:加藤 康)
[画像のクリックで拡大表示]

 飯塚らが音声認識技術とビッグデータ技術を組み合わせながら試行錯誤を繰り返すうちに、2010年秋ごろに、ある程度の形に出来そうな見通しが立った。ここから先に進めて実際のアプリケーションを作り上げるには、開発費を確保する必要がある。そこで、他部署ながら新規事業に対する予算を持つ部門のリーダーである栄藤稔に、開発の許可を求めた。

 ここで、飯塚と吉村から説明を聞いた栄藤の口から出てきたのが、「俺は使わない」という冒頭の辛辣な言葉だった。栄藤は「人前でわざわざ音声で検索する人はいないだろう。自分だったら手で入力する」と考えていた。

NTTドコモ 執行役員 研究開発推進部長の栄藤稔氏
(写真:加藤 康)
[画像のクリックで拡大表示]

 それでも栄藤が開発継続を許可したのは、飯塚や吉村のことを、イノベーションを起こし得る人材と認めていたからだ。情熱があり、技術を俯瞰(ふかん)的に見ることができるなどの条件を満たしており、「アイデアには正直ピンとこないが、ここは2人に任せよう」とゴーサインを出した。

 一方、栄藤に「俺は使わない」と言われた飯塚は、それほど気にしていなかった。「ITリテラシーの高い栄藤さんは使わないかもしれない。でも、検索を難しいと感じている世の中の多くの人がきっと喜んでくれる」という自信があったからだ。

 もう1人の吉村は、心の底でショックを受けていた。「上司に認められない研究って、どうなんだ」と…。

この先は有料会員の登録が必要です。有料会員(月額プラン)は初月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら