キヤノンマーケティングジャパン(キヤノンMJ)と、人工知能(AI)関連サービスを手掛けるCogent Labsは2017年10月25日、AIを使った手書きOCR(光学式文字読み取り)事業で協業し、「手書き AI OCRソリューション」を提供すると発表した。

 従来は「はがきの郵便番号の記入欄のような複数の枠に、1文字ずつ数字が書かれている場合、手書き文字が読み取れる」といった制約があったという。「今回提供するソリューションでは、住所や氏名、自由記述など、申込書や診断書に書かれた手書き文字を精度よく認識できる」と、キヤノンMJの西尾光一BSソリューション企画本部BSソリューション企画部ドキュメントソリューション企画課課長は説明する。

 2017年11月から提供を始める。このソリューションの特徴は、文字の読み取り前、スキャンした紙文書に施すキヤノンMJの画像処理技術と、AIを使って日本語の手書き文字をデジタル化するCogent Labsの技術を組み合わせていることだ。

手書きAI OCRソリューションの業務適用例。申込書の手書き文字を認識してテキストデータとして抽出できる
出所:キヤノンマーケティングジャパン
[画像のクリックで拡大表示]

 2社の技術を組み合わせることで手書き文字の認識率を高める。「ある金融機関で、口座振替申込書などに書かれている手書き文字を認識するテストしたところ、認識率を9割以上に高められた」と、西尾課長は説明する。

 具体的には「複合機でスキャンした紙文書画像が斜めになっているのを補正する」「カラーの紙文書画像を白黒に変換する」といったキヤノンMJ側の技術で、認識対象の紙文書画像を整えて手書き文字を読み取りやすくする。

 キヤノンMJ側の技術は、キヤノンが持つOCRソフトウエア部品群「Rosetta-Stone-Components」がベースとなる。これらのソフト部品を組み込んだ業務システムを、キヤノンMJが開発して提供する。

 そのうえで、Cogent Labsの技術で読み取る。同社の技術の特徴は、活字に加えて手書きの文字もAIを使って認識精度を高められるようにしている点だ。加えて、認識した手書きの文字列が日常的な単語や文章に近いかどうかを解析する「言語モデル」を用いた手法を採用して、認識精度を高めている。

 Cogent Labsの技術は、同社のクラウドサービス「Tegaki」を通して提供する。キヤノンMJが開発する業務システムと連携させることで、読み取り前の処理を施した紙文書の画像をTegakiに送って、手書き文字を認識。業務システムに読み取ったテキストなどのデータを返す。キヤノンMJが担当する業務システム開発では、読み取ったテキストなどのデータを確認したり修正したりする機能や、他システムへの連携機能なども、必要に応じて作り込む。

 手書き AI OCRソリューションの料金は、Tegakiの利用料金が月額20万円から。業務システム開発などを含む初期費用は個別見積もりになる。

 キヤノンMJは2017年3月、定型帳票や非定型帳票の紙文書を複数、一括して複合機でスキャンすると、紙文書画像データの仕分けや、文書中のテキストデータの抽出を自動で行える「定型・非定型帳票OCRエントリーシステム」を発表している。今回の発表で、企業でデータ入力を効率化するソリューションの幅を広げる。