米グーグル(Google)は現在、「音声文字変換」や「音声増幅」など聴覚障害者をサポートするための機能追加に力を入れているという。スマートフォンの障害者サポート機能はどこまで進化しているのだろうか。Androidのアクセシビリティー担当者の説明から追っていこう。

米グーグル Androidアクセシビリティ プロダクトマネージャーのブライアン・ケムラー氏による「音声文字変換」のデモ。スマートフォンに話しかけた言葉がリアルタイムでテキストに変換され画面に表示される仕組みだ。写真は2019年8月21日のグーグル・Androidの各種サポート機能説明会より(筆者撮影)
[画像のクリックで拡大表示]

話した声がリアルタイムで文字になる「音声文字変換」

 スマートフォンには健常者にとって便利な機能だけでなく、障害者の利用を助ける機能や、障害者の日常生活をサポートするための機能も多く搭載されている。Androidであれば設定メニューの中にある「ユーザー補助」、iPhoneであれば「アクセシビリティ」にある内容がそれに当たる。

 そうした中でも最近力を入れ始めているのが、聴覚障害者をサポートする機能だ。実際グーグルは2019年8月21日、Androidのアクセシビリティーに関する説明会を実施。Androidアクセシビリティ プロダクトマネージャーであるブライアン・ケムラー氏は説明会で、最近新たに追加された、あるいは今後追加されようとしている聴覚障害者向けのサポート機能について説明している。

 ブライアン氏によると、聴覚障害者の人数はWHO(世界保健機関)の調査で4億6600万人に達しており、これは中国とインドの人口に次ぐ人数だという。グーグルでは世界中の全ての人が同社の製品を利用できるようにすべく、Androidに聴覚障害者のニーズを満たす機能の追加を進めているとのことだ。

 その機能は大きく2つに分かれている。1つは「Captions」と呼び、声を視覚化するものだ。その機能の1つとして2019年2月に提供されたのが「音声文字変換」である。

 これは周囲の話し声をテキストにリアルタイムで変換する機能で、起動しておくだけで自動的にスマートフォンが音を拾い、文字として画面上に表示してくれる。英語だけでなく、日本語を含めた70の言語に対応しているほか、「拍手」「鳥の鳴き声」など環境音もテキストで示す機能も備えている。

 ブライアン氏によると、音声文字変換はマイクから拾った音をまず「会話」と「環境音」の2つに分類する。その上で、会話であればグーグルの「Cloud Speech API」を通して文字に変換し、環境音であればデバイス上の機械学習によって何の音かを判断しているという。

 グーグルではさらにこの技術を生かし、Android上で再生される動画や音声などにテキストで自動的に字幕を付ける「Live Caption」の開発も進めているとのこと。こちらは2019年内に英語版から提供が開始される予定だという。

この先は会員の登録が必要です。今なら有料会員(月額プラン)が2020年1月末まで無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら