DX(AI-OCR)

DXの第一歩のテクノロジーとして、有名なOCR機能に、AIを付加させた機能でした。

ここで、OCRという技術のおさらいとその欠点を補ったAIについての機能をご紹介いたします。

 

OCRとは

OCRは、Optical Character Reader(またはRecognition)の略で、画像データのテキスト部分を認識し、文字データに変換する

光学文字認識機能のことを言います。

具体的にいうと、紙文書をスキャナーで読み込み、書かれている文字を認識してデジタル化する技術です。

人間は、紙に書かれている文字を無意識に理解しますが、コンピューターは自動的に読み取ることができません。

この作業を人間の代わりに行ってくれるのがOCRです。

AI OCRとは

OCRにAI技術を加えたものです。AI技術を組み合わせることで、機械学習による文字認識率の向上や、
帳票フォーマットの設計をせずに、項目を抽出することが可能になりました。
それまでの、OCRは、原則指定帳票に、記載するのが基本でした。AI技術がその壁を越え始めました。
OCRを活用すれば、たとえば紙の請求書の情報を会計システムなどの業務システムに入力する作業を効率化することができます。
しかし、業務システムに入力する際には請求書に書かれている文字や数字の情報だけでなく、その情報が何を意味するのかが分からない
と入力ができないため、その対応付けなどを人間が行う必要があったり、決まったフォーマットの帳票にしか対応できなかったりする
ことがありました。
さらに、たとえば請求書の情報を会計システムに登録するには品名や金額などの請求書に記載されている情報だけでなく、
部門や科目などの仕訳を行う必要があり、そこも人間が行う必要がありました。
この技術は、読み取った情報が何の項目なのか、業務システム入力に必要な情報は何か、なども抽出、生成することができるので、
業務システム入力作業を大幅に効率化させることができます。

RPAを加えた機能

こうした「情報の意味付け」ができるので、「AI OCR」と「RPA(Robotic Process Automation)」と連携することで、業務効率を
さらにアップすることができます。
「RPA」とは、従来、人が行っていた業務をソフトウェアロボットにより代行・代替することを表す言葉です。
RPAと「AI OCR」を連携させることで、パソコンを使った作業の自動化に加え、文字データを自動で読み取りデジタルデータ化する
ことが可能になりました。
OCRと組み合わせることで、紙帳票からデータを抽出し、データ入力、集計・加工、出力といった一連の業務を自動化することが
可能となります。