写真1●VoXTの2つのプラン。予算や納期に合わせて選べるのがメリットという
写真2●アドバンスト・メディアの鈴木清幸会長兼社長
写真3●「VoXT音声入力」のデモ。録音済みのデータを聞きながら、登壇者が自ら音声入力した。誤認識はほとんどなく、スムーズにテキストに変換された

 アドバンスト・メディアは2014年7月30日、音声をテキストデータに変換するサービス「VoXT(ボクスト)」の新プランを発表した。会議などの録音データの文字起こしを、同社に完全委託できるプランを新設した。ユーザーがその場でマイクを使って入力した音声をテキストに変換する機能も追加した。

 VoXTは、ユーザーが同社サーバー上にアップロードした音声データを、音声認識技術を用いてテキストデータに変換するサービス。今回、新たに「VoXTフル」というプランを用意した(写真1)。音声認識による誤認識や誤変換を専属のスタッフが手動で修正し、完成データをユーザーに納品する。

 文字起こしは、Webページから1分単位で発注できる。料金は、10営業日以内に納品する「ゆったり」プランの場合で1分当たり200円。24時間以内に納品する「特急」プランでは同400円。

 同社の鈴木清幸会長兼社長は、VoXTフルを、クラウドソーシングによるワークシェアリングを可能にするためのプラットフォームとして位置付ける(写真2)。時間や場所の制約を受けずに、文字起こしの仕事に取り組めるためだ。速記会社や個人事業主と連携し、文字起こしを委託したい企業と仕事にしたい人とを結ぶことで新たな市場を創出するという。5年後に28億円の売り上げを目標とする。

 VoXTが従来から提供していた音声データの自動変換サービスは、「VoXTセルフ」プランとして引き続き用意。1分当たり30円で、アップロードした音声データをテキストに自動変換できる。

 加えて今回、オプション機能として「VoXT音声入力」を公開した(写真3)。ユーザーがマイクを使ってその場で音声入力し、テキストに自動変換できる機能だ。録音済みの音声データに雑音が多く自動変換が難しいといった場合、録音データを聞きながら同じ内容を自ら音声入力することで、認識精度を高められる。

 VoXT音声入力は、月額300円で時間の制限なく利用できる。自分が入力した音声データは学習されるため、利用すればするほど認識精度が高まるという。

VoXT