2017年は日本でのスマートスピーカー元年だった。米Amazon.com、米Google、LINEなどが日本市場に製品を投入し、大きな注目を集めた。特にAmazon.comのスマートスピーカー「Amazon Echo」シリーズでは、サードパーティーによるアプリケーション開発が盛んだ。2018年6月時点で、800個を超える日本語対応アプリケーションが提供されている。

 しかしスマートスピーカーのアプリケーション開発では、音声によって操作する「VUI(Voice User Interfaces)」が必須。このVUI設計は、Webやスマートフォン向けのアプリケーションのUI設計とは大きく異なり、特有のノウハウが必要になる。

 そこで本連載では、VUI設計の方法を解説していく。今回は、Amazon Echoシリーズ(以下Echo、写真1)をはじめとするスマートスピーカーの特性、普及する背景、想定される利用シーンなどについて解説する。

写真1 日本で販売しているEchoシリーズ
左からEcho Dot、Echo、Echo Plus(出所 アマゾン ジャパン)
[画像のクリックで拡大表示]

VUIは自然にコミュニケーションできる

 Echoをはじめとしたスマートスピーカーは、音声コマンドを入力するマイク、ユーザーからの質問に回答するバーチャルパーソナルアシスタント(VPA)機能、自動生成した音声を発するスピーカーを備える。ボタンや画面を持つデバイスも登場しているが、基本的にはユーザーは音声で操作する。アプリケーション実行基盤を持ち、様々なサービスをユーザーに提供する。

 ユーザーとシステムのインタフェースはCLI(Command Line Interface)、GUI(Graphical User Interface)と進化してきた。音声を活用したVUIはその延長線上にある。ユーザーがより自然にコミュニケーションを取れる新たなインタフェースだ。例えばユーザーが使い方をあまり知らなくとも、自然な声による問い掛けで利用できる。

 そのようなユーザーが自然にコミュニケーションを取れる仕組みは「Conversational Platform」と呼ばれる。文字のチャット、身体の動きなども含まれるが、音声はその中でも近年注目度が高まっているものの一つだ。

 実はVUIは、スマートスピーカーの登場前から存在する。米AppleのSiriやGoogleのGoogle Assistantといった、スマートフォンのVPAは、音声で操作するVUIを備える。

 今改めてVUIが注目されているのは、進化した技術を取り入れたスマートスピーカーが登場しているからだ。その技術は大きく三つある。

 一つめは、少し離れた場所にあっても人の声を認識する音声把握機能だ。スマートスピーカーには複数のマイクが搭載されており、ユーザーがどの方向から声を掛けたかを認識する。この機能の進化により、ユーザーが少し離れた場所からスマートスピーカーに話し掛けたとき、その声に指向性を合わせる。加えて、ハードウエアで非近接音声入力処理(Far-Field Voice Input Processing=FFVIP)を行えるようになり、処理速度が向上している。

 二つめは、音声を言語として認識しテキストデータにする自動音声認識(Automatic Speech Recognition=ASR)、テキストデータから意図を理解する自然言語理解(Natural Language Understanding=NLU)の技術だ。2017年5月にGoogleが発表した、音声認識におけるワードエラー率は4.9%。同年同月にMicrosoftが発表した、音声認識におけるワードエラー率は5.8%だという。人間のワードエラー率は5.9%とされており、音声認識の精度は同じ程度まで向上している。

 ユーザーへの返答内容を自動生成する。これが三つめの技術だ。機械学習によって、ユーザーの問い掛けから意図を把握したうえで、自然言語として返答を生成する技術が進化している。

 これは最近になって始まったことではない。2011年には、米IBMのWatsonが米国の人気クイズ番組「Jeopardy!」のクイズ王を破っている。当時既に、クイズの内容を理解し、自然言語で回答していた。

 一般向けVPAとしては、2011年にSiriが、翌2012年にはGoogle Now(2016年にGoogle Assistantに統合)がリリースされたのに加え、2013年にはMicrosoftのCortanaが登場。いずれも、自然言語でコミュニケーションする。近年は、技術がさらに向上し、違和感なく使えるレベルになってきた。

この先は有料会員の登録が必要です。有料会員(月額プラン)は初月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら