オフィスにあふれる書類の処理には「文字認識」のAIが役立つ。手書き文字をほぼ100%読み取れる仕組みを構築した企業も出現。リクルートHDは文脈を理解させて採用業務に生かしている。

[レオパレス21]
データ入力を肩代わり 訂正の手書きまで読み取る

 AIによる文字認識技術で毎月15時間かかっていたデータの手入力の時間を減らし、同僚や上司から「明るくなった」と言われるようになった――。賃貸アパートの建築・管理事業を担うレオパレス21にはこんな社員がいる。アパートの火災保険の手続き業務を担当する保険業務課の和田博美氏だ。

 和田氏が担当する仕事の1つが火災保険の変更依頼業務である。同社の賃貸アパートを社員寮などに利用する法人顧客の場合、社員が転勤などでレオパレス21の別の物件に引っ越す機会がある。それに合わせて保険の契約内容を変更する仕事だ。

 和田氏はかつて、法人顧客から毎月届く200件の変更依頼書を目視して、その内容を基幹システムに手入力していた。依頼書1件当たり11項目で延べ2000項目以上に達する。作業は月15時間程度かかっていた。和田氏は子供を保育園に迎えに行くため、午後4時に退社する短時間勤務をしていることもあり、「他の仕事もあるなかで入力間違いが許されない。心理的なプレッシャーが高かった」と振り返る。

 この仕事を2017年6月、AI関連ベンチャーAI insideのAI OCR(光学的文字認識)サービス「DX Suite」を導入して効率化した。和田氏は手入力に代わり、変更依頼書をPDF形式に変換してDX Suiteへ送る。DX Suiteは文字認識後、CSV形式のデータを自動生成して和田氏に戻す。和田氏はそこからコピー・アンド・ペーストで社内システムに入力する。

 「ミスが起こりやすいデータの手入力をなくせたことで、時間的にも心理的にも余裕を持って仕事を進められるようになった」と和田氏は語る。

「認識率は100%に近い」

 カギとなったのは文字認識の機能向上だ。法人顧客から送られてくる保険契約の変更依頼書は入居者の氏名など手書き文字も含むが、AIは高精度に認識する。レオパレス21は変更依頼書に顧客の情報をあらかじめ印字して送り、顧客は訂正部分に横線を引いてそばに手書きで修正する。その際、AIは訂正の横線が引かれた文字は認識せず、そばに書かれた手書き文字を認識する。「印字した文字を含めて認識率は100%に近い」(和田氏)。

[画像のクリックで拡大表示]
図 レオパレス21がAI OCRシステムを活用する流れと効果
月2000項目の手入力がゼロに(写真提供:レオパレス21)
[画像のクリックで拡大表示]

[SMFLキャピタル]
帳票の種類を認識 FAX仕分けがゼロに

 「年3600時間あった仕分け作業を無くせた」。リース会社SMFLキャピタルの川名洋平執行役員オペレーション本部長はこう成果を語る。

 SMFLキャピタル(旧GEキャピタル)は事務機器や厨房設備などのリース業務をこなしており、手書きの申込書や見積書などが1日1200件、ファクシミリで寄せられる。当初はAIで手書き文字を読み取らせようとしたが認識精度が上がらなかった。

 そこで発想を転換。認識対象を文字でなく書類のレイアウトに変更し、ファクシミリ文書のAI自動仕分けシステム「FAX Frontier」の独自開発に挑んだ。10カ月ほどかけ、2018年2月に完成させた。

 仕分け結果は専用のWeb画面から書類画像と合わせて確認できる。ファクシミリが届くと複合機で印刷をせず自動的に仕分けシステムにデータが入力され仕分けが完了する。営業担当者はどこにいても(全国の営業担当者が)受信内容を画面で確認できる。「営業担当者は手書きの書類を読み、内容に応じて見積書の作成や内容確認などに動けるようになった」(川名執行役員)。

文字にこだわらず帳票を認識

 全国から届いた申込書や見積依頼書などのファクシミリ文書は、複合機で画像データに変換する。FAX Frontierはデータの帳票レイアウトをAIで識別し「リース契約書」「ローン契約書」など13種類に分類する。顧客以外から届いたセールス用の営業チラシなども「その他」として識別できる。

 開発プロジェクトは2017年春にスタートした。画像認識に広く使われる、ニューラルネットワークによる予測モデルを開発して文書を学習させた。

 最も苦労したのは、学習データとなるファクシミリ文書の画像データの作成と収集だ。作成については、あえて不鮮明になるように何度もファクシミリにかけるなどして認識対象を広げる努力をした。収集については、複合機に蓄積された画像データを活用した。その結果「学習データ7000件と学習成果を評価するデータを数千件を集められた」とクオリティ本部の川嶋紗由美氏は話す。

 予測モデルの開発にも工夫を凝らした。一般に専用プログラムを開発して変数に当たる特徴量を抽出し、その後大量のデータを学習させる。だがSMFLキャピタルは特徴量の抽出にオープンソースのプログラムを活用。専用プログラムを開発する手間を省いた。大量データによる学習は帳票の線といった細部ではなく、帳票全体を認識させる学習に絞り込んだ。その結果、10時間程度で予測モデルの開発を完了。99.9%の認識精度を確保できた。

図 SMFLキャピタルが自社開発した文書の自動振り分けシステムの概要と導入効果
AIで書類を自動仕分け(写真・画面提供:SMFLキャピタル)
[画像のクリックで拡大表示]

この先は有料会員の登録が必要です。「日経コンピュータ」定期購読者もログインしてお読みいただけます。有料会員(月額プラン)は申し込み初月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら