音声認識の応用が急速に拡大している。スマートフォンなどに高性能な音声認識機能が搭載され、身近な技術になった。しかし、音声認識は発展途上の技術である。まだ、うまく認識してくれないことも多い。音声認識技術の課題を解決し、自動通訳やパーソナルロボットなど今後期待される新応用を開拓していくためには何が重要か。この分野に詳しい東京工業大学 情報理工学院・情報工学系 教授の篠田浩一氏に聞いた。

音声認識の応用が急速に広がっています。

篠田氏:音声認識は近年、目覚ましい普及を遂げています。20年ほど前からカーナビゲーションや文章の読み上げソフトが販売されてきましたが、音声認識ソフトを使ったことがある人は周りにあまりいませんでした。それが、一気に身近なものになりました。米グーグル(Google)、米アマゾン・ドット・コム(Amazon.com)、米アップル(Apple)などの大手IT企業が、スマートフォン(スマホ)やスマートスピーカー(AIスピーカー)に高性能な音声認識機能を搭載したことで、状況は一変しました。

 もはや、皆さんの中で音声認識を使ったことがない人はほとんどいないでしょう。使ってみれば、便利であることはすぐに分かります。音声によるコミュニケーションは、人間のコミュニケーション手段の中でもっとも基本的なものですから。今後も、自動通訳やパーソナルロボットなど、様々な用途への応用が期待されています。音声認識の技術者・研究者はひっぱりだこの状況です。

 さて、実際に使ってみた感想はいかがでしょうか。最初は、正確さにびっくりしたと思います。でもそのうち、粗が目立つように感じた人は多いのではないでしょうか。例えば、周りの音がうるさかったり、遠くからしゃべったりすると、うまく認識してくれません。きちんと丁寧にしゃべると認識してくれますが、友達や家族に話すようにくだけた話し方をすると、認識を間違えます。さらに、何回繰り返しても認識してくれない単語があったりします。

 つまり、音声認識技術はまだまだ発展途上です。これから改良を重ねていく必要があります。音声認識の技術者・研究者は、今後、このような問題を解決していくことが期待されています。