米Amazon.comが音声アシスタント「Alexa」の機能強化を進めている。2018年9月に新機能を6種類追加し、Alexaのアプリケーションに相当する「スキル」の開発ツールにも機能強化を加えた(表1)。

表1 Amazon.comがAlexaに追加した機能
名称内容
Acoustic Event Detectionユーザーの留守中にAlexaが「警備モード」になり、窓ガラスが割れる音などを検出する
Whisper ModeユーザーがAlexaにささやきかけると、Alexaが「Whisper Mode」になり、以降は小さい音量で読み上げをする
Multi-Step Request in One Shotユーザーが1個の文章に複数のリクエストを入れてきた場合に、各リクエストを別個のものとして認識する
Probabilistic Context Carryoverユーザーとの会話の文脈(コンテキスト)を理解し、2回目以降のリクエストで省かれた目的語などを補う
Natural Skill Interactionユーザーが好んで利用するスキルを学習し、スキルが省かれたリクエストを受け取った場合に、スキルが何か推測する
Automatic Equivalence Class Learning未知の単語に遭遇した場合に、ユーザーとの会話からその単語の同義語を推測する

 「消費者と音声でやり取りする会話AIを、機械学習のエキスパートでなくても開発できるようにするのが我々の狙いだ」。Amazon.com Alexa担当バイス・プレジデント兼サイエンティストであるRohit Prasad氏はそう語る。Prasad氏にAlexaの機能強化のポイントなどについて聞いた(図1)。

図1 Rohit Prasad氏
Amazon.comでAlexaの音声認識、自然言語理解、機械学習技術の研究開発を統括する。

Alexaの現状は?

 Alexaはスキルの数が5万種類を超えた。日本語にのみ対応するスキルも1000種類以上存在する。Alexaをオープンなプラットフォームとして公開し、スキルを開発する「Alexa Skills Kit」と、Alexaを搭載するデバイスを開発する「Alexa Voice Service」を用意して、誰でもスキルを開発できるようにしたことが奏功した。

 Alexaは2014年にリリースした当初から、音声認識や自然言語理解にディープラーニングを採用している。ディープラーニングでは認識精度を改善するために、大量のラベル付き教師データを用意する必要がある。そこで我々は2つの新しい手法を採用することで、この問題を改善した。

 1つは能動学習(Active Learning)だ。大量のデータに対してランダムにラベル付けをするのではなく、少数のデータをより賢くサンプリングしてラベル付けし、少ない教師データで効率的にモデルを訓練する。

この先は有料会員の登録が必要です。「日経エレクトロニクス」定期購読者もログインしてお読みいただけます。有料会員(月額プラン)は初月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら