NECは2018年11月27日、人工知能(AI)を使うことで、読み取りに必要な細かな設定作業を省けるOCR(光学的文字認識)サービス「NEC AI-OCRサービス」を提供すると発表した。2018年12月下旬に試験環境の提供を始めて、本サービスは2019年3月に始める。

 NEC AI-OCRサービスは紙文書をスキャンしてPDFなどの形式にした文書データを対象にしたサービスで、文書データから文字データを抽出する。文字データを紙文書のどの位置から取得するかといった設定作業を効率化する処理にAI技術を使う。

 具体的には、同じ帳票レイアウトの紙文書数枚を読み込ませたうえで、その文書中で読み取りたい項目名と、その項目に書かれてある文字をユーザーが設定する。するとAIがユーザーの設定内容を基に、どの位置からどの文字を抽出するのかをリアルタイムに学習。学習結果を読み取り設定にしたうえでOCRで文字データに変換する。

NEC AI-OCRサービスに関する説明資料
出所:NEC
[画像のクリックで拡大表示]

 従来のOCRは、帳票レイアウトが異なる紙文書ごとに、読み取りたい文字の位置や文字数などをユーザーが事前に指定する必要があった。NECは新サービスでその手間を省けるようにする。帳票レイアウトが異なる紙文書を多数扱う場合、帳票レイアウトごとにAIに学習させることで、紙文書に応じて適切な位置から文字データを抽出できるという。サービスの参考価格は1枚の紙文書から20項目の文字データを抽出する処理を24万回行う場合で年額480万円。