前回の記事はこちら

3機種とも最上部にMEMSマイクを配置する(写真:加藤 康、以下同)
[画像のクリックで拡大表示]

 「AIスピーカーの設計で、一番の肝はマイク」――業務用AI(人工知能)スピーカー(スマートスピーカー)を開発するフェアリーデバイセズ 代表取締役CEOの藤野真人氏はこう断言する。AIによる音声認識技術はAIスピーカーの最も基本かつ重要な機能だが、そもそもきれいに音が取れなければ音声認識の力を発揮しようがない。今回は3大AIスピーカーのマイク関連の設計について、詳しく見ていく。

 AIスピーカーのマイクについて、“聞き取り”性能に大きく影響するポイントは2つある。1つは、スピーカーとマイクの「分離」だ。AIスピーカーは音楽などを再生しながら話者が発する「開始語」に反応するなど、マイクとスピーカーを同時に利用する点に特徴がある。マイクにとって雑音となる、スピーカーが出す音や振動をマイクに伝えない工夫が必要になる。もう1つは、音声操作している話者の方向を推定し、その声を集中的に集める「ビームフォーミング」技術だ。余計な雑音を減らし、聞き取り精度を高めることにつながる。

 今回分解した「Amazon Echo」(米アマゾン・ドット・コム(Amazon.com))「Google Home」(米グーグル(Google))「Clova WAVE」(LINE)の3機種とも小型のMEMS(Micro Electro Mechanical Systems)マイクを採用し、機器本体の「端部」、つまり最上部に配置している点は共通している。「機器内にあると、筐体内の残響音や反響音をより拾いやすくなるためだ」(藤野氏)。

この先は有料会員の登録が必要です。今なら有料会員(月額プラン)登録で6月末まで無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料会員と登録会員に関するFAQはこちら