米インターシステムズは2016年10月27日、自然言語の解析技術「InterSystems iKnow」の日本語対応版「iKnow Japanese」を提供すると発表した。iKnowの特徴は、事前に解析用の辞書を用意したり、ソフトウエアに文章を学習させたりしなくても、自然言語の解析が可能になること。

 「日本語は単語間にスペースがなく処理が難しい言語だが、iKnowでは文脈を考慮した解析ができる」とインターシステムズのプロダクトマネージャーを務めるベンジャミン・デ・ボー氏は説明する。iKnowは、オブジェクトデータベース「InterSystems Cache」の一機能として提供する。

インターシステムズのプロダクトマネージャーを務めるベンジャミン・デ・ボー氏
[画像のクリックで拡大表示]

 iKnowは非構造化データである文章を読み込むと、意味のある単位に分割する処理を実施。安倍首相という単語があった場合、「安倍」と「首相」に分けるのではなく、「安倍首相」で一つの意味があるとみなすように文章の構造を解析する。

iKnow Japaneseを利用したアプリケーションの例
[画像のクリックで拡大表示]

 「単語を分割する形態素解析を使った自然文の解析では、利用者が意図しない結果が出ることがある。iKnowを使えば利用者が知りたい結果を返せる」とボー氏は話す。文章を解析しながら、類義語を定義することも可能だ。

 欧米ではカルテの分析といった医療分野や、金融機関の契約管理、報道機関の記事の分類などに利用されているという。京セラ丸善システムインテグレーションが自社が開発する図書館向けのシステムの蔵書検索機能にiKnowの導入を予定している。