後編へ

 今回は、画像の中に書かれている文字(テキスト)を抽出するプログラムを作ってみましょう。スマートフォンやデジカメで手軽に写真を撮れるようになった昨今では、撮影・スキャンした手書きメモや文字データなどをテキストに変換したい場面が多いのではないでしょうか。

 画像の文字認識をするプログラム自体を一から作るのは大変です。Microsoftが提供する「MODI」のOCR機能を利用すれば、JavaScriptから手軽に文字認識を実行できます。今回は、MODIのセットアップと簡単なプログラムを紹介します。

OCRとその活用方法

 写真の中にある文字や、スマートフォンなどの手書き機能で書いたメモは、あくまで画像です。人間の目では読むことができても、そのままではコンピューターが認識することはできません。もちろん、検索してもその中の文字を探すことはできません。

 そこで、OCRの出番です。OCR(Optical Character Reader)とは、印刷された文字、または手書きの文字を光学的に読み取る装置のことを指します。OCRを使うと、画像データの中の文字を認識して、テキストとして出力することができます。テキスト形式であれば、文字を引用(コピー&ペースト)したり、検索することができます。

この先は会員の登録が必要です。有料会員(月額プラン)は初月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら