OCRとAIーOCRの違い

OCRの意味と技術的な特徴

OCRとは、英語の「Optical Character Recognition」の頭文字の略語で、日本語にすると「光学文字認識」となります。英語では「Optical Character Reader」と呼ぶこともあります。
複合機をはじめとするスキャナーやOCRリーダーなどで紙の書類を画像として読み取り、その画像データから文字を抜き出して、テキストデータに変換する技術がOCRです。

AI-OCRとは?言葉の意味と技術的な特徴

AIとは、Artificial Intelligence(アーティフィシャル・インテリジェンス)の略称。Artificialは「人工的な」、Intelligenceは「知能/知性」という意味を持っています。OCRに、AIの技術を融合したのがAI-OCRです。AI-OCRで使われるAI技術のひとつとして、コンピューターで人間の脳を模倣する「コネクショニズム(Connectionism)」という手法があります。コネクショニズムでは、人工知能が自動的に深層学習(ディープラーニング)で記憶したパターンから、読み取ったデータが何であるのかを人間の脳のようにシミュレーションして判断します。
これにより、従来型のOCRではできなかったような、高い精度の文字認識や非定型の帳票の読み取りが可能になりました。また、文字認識処理を行った後に、汎用性の高いデータ抽出・出力ができます。