グーグルは2009年12月3日、日本語入力ソフト「Google 日本語入力」のベータ版を公開した。インターネット上で収集したデータを基に、機械的に辞書を生成。その結果、人手では網羅できないほどの「桁違いの語彙力」を持つとする。一部の文字を入力しただけで、それに続く単語の候補を表示する「サジェスト機能」も持つ。

 Google 日本語入力では、統計的言語モデルと呼ばれる仕組みを採用。大量のテキストデータを解析し、語の出現頻度などを統計的に導き出して変換結果を決める。グーグルでは、数千台規模のコンピューターを用いてインターネット上のデータを解析したという。これにより、新語、専門用語、芸能人の名前などを幅広く収集。さらに、高い変換精度も実現しているとする。

 このソフトは、グーグルのソフトウェアエンジニアである工藤拓氏と小松弘幸氏が、「20%プロジェクト」で開発を始めたものという。20%プロジェクトとは、勤務時間の2割を自分の好きなことに使えるという同社のルール。徐々に、日本語入力などの分野で経験を持つ開発者が加わっていったという。

 対応OSはWindows(現時点では32ビットのみ)とMac。同社のWebページから無料でダウンロードできる。

Google 日本語入力

ブログへの投稿記事