AI-OCRの解説、および活用事例のご紹介
1. OCRとAIの関係
OCR(Optical Character Recognition/Reader、光学文字認識)とは、紙に印刷された文字や手書きの文字をスキャナーなどで読み取り、画像内の文字を認識して、テキストデータに変換する技術のことです。
まず、OCRとAIの関係の歴史の概略と、基本的な技術を解説します。
(1)OCRの歴史
①OCRのはじまり
画像をテキストデータに変換するスキャナーの原型は、19世紀末には考案されており、OCRは1920年代には既に研究されていました。
初期のOCR技術は、予め用意しておいた識別パターンのテンプレートと光電管で読み取った画像を比較して、マッチングさせるというものでした。
1930年頃には、ドイツやアメリカでOCRの特許が取得されています。
1950年頃にはアメリカで視覚障がい者支援を目的に、OCR技術と音声合成技術を組み合わせて、読み取ったテキストデータを読み上げる研究もされましたが、頓挫しました。
その後アメリカでは、認識できる文字や書体の種類の幅を広げることに成功し、1955年には最初の商用システムがリリースされています。
②日本のOCR
日本では1968年に国産OCRが初めて製品化されました。
同年に郵便番号が導入されたことを背景に、手書きの数字を読み取って仕分けするのに活用されました。
1970年代には、手書きのアルファベットとカタカナを認識できるOCRが登場しました。
1980年代にはパッケージソフトとしてOCRがリリースされるようになり官公庁や大手企業が利用するようになりました。
また、高品質な活字であれば、漢字も認識できるようになりました。
1990年代後半にはパソコンが普及しはじめ、OCR端末の小型化が進みました。
③OCRとAIの結びつき
2000年代後半から現在まで続いている、所謂 第3次AIブームにより、ディープラーニング(深層学習)の研究が急激に進みだし、OCR技術へのディープラーニングの適用が盛んになりました。
2010年代後半から2020年代初頭にかけて、クラウド上のディープラーニングを活用して高精度の読み取りを行うOCRエンジンを提供する、AI inside (DX Suite)などのベンダーが日本でサービスを開始しました。
2017年頃から日本市場では、それらを従来のOCRエンジンと区別するために、「AI-OCR」と呼ぶようになりました。
現在ではAI-OCRサービスも比較的安価で提供されるようになっており、今後ますます普及していくと予想されます。
(2)OCR・AI-OCRの基本
人間の目は視界の中から読む文字を瞬時に見分け、解析し、言語として認識することができますが、これら一連の処理をOCRとして実現するためには様々な技術が使われています。
①OCRの基本
2. AI-OCRサービスの現状と課題
このように、AI-OCRは従来のOCRと比べて認識精度が上がっており、近年では比較的手頃な価格でサービスが提供されるようになってきたため、利用しやすくなってきています。
(1)AI-OCRを活用したサービスの現状
AI-OCRサービスは、読み取る帳票の性質や外部システムとの連携の有無など要件に合ったものを選択することが大切です。
各製品の強みを発揮できないと、期待した認識精度が得られないおそれがあるからです。
読み取る帳票が定型か非定型か、文字は活字か手書きか、多言語対応が必要か、外部システムと連携できるか など、導入前に要件を幅広く検討しましょう。
(2)AI-OCRサービスの課題
・認識精度が100%ではない
認識精度は、元となる帳票画像の鮮明度や、枠線と文字の重なりの度合いに影響を受けます。
また、人間なら読み取れる手書き文字も、定型から外れていると読み取れない場合があります。
そのため、認識精度100%に到達するのは難しいのが現状です。
・正確性を求める場合には目検チェックが必須
認識精度が100%ではない以上、例えば会社の売り上げなどに関わる重要なデータをAI-OCRにかけて基幹システムに登録する場合、登録する前に目検チェックが必須です。
システム化検討時に、データ読み取り・入力の手間と、目検チェックの手間の比較衡量が必要です。
・非定型に対応できない場合がある
ツールによっては定型のみ対応のAI-OCRツールがあります。
読み取りたい帳票は定型か非定型か、今後非定型帳票が追加される可能性はあるか、非定型対応ツールにコストをかけるだけの効果があるかなどを、予め検討しましょう。
・導入コストがかかる
AI-OCRは最先端技術を搭載している分、OCRよりも費用は高くなります。
オンプレミス型かクラウド型かでも費用が異なります。
導入前に費用対効果を試算し、必要な機能を検討しましょう。
3. Chatora(当社独自サービス)を活用した業務効率化事例
最後に、当社のAI-OCR製品であるChatoraを活用した業務効率化の事例を紹介します。
(1)Chatoraの紹介
Chatoraは、AI画像認識技術を活用し、手書き書類や各種紙帳票の文字を読み込み、データ化するサービスです。
複数種類の帳票から読み取ったデータを、システムに手入力するといった、単調で反復的な業務を自動化し、生産性向上をサポートします。
◆Chatoraの3つの特徴
・手書き帳票の読み取り・データ化が可能
取引先の都合などによって紙媒体が必須でも、手書き帳票を読み取り可能なChatoraを使えば、データ入力にかかる時間を大幅に削減できます。
・帳票の自動仕分け機能
帳票に複数のフォーマットがあっても自動的に仕分ける機能が搭載されています。
また、業界別の非定型帳票モデルも組み込まれているため、多様な帳票に対応可能です。
・データ読み取り後の自動化をサポート
当社ではこれまでのシステム開発・RPA開発の実績を元に、入り口から出口までの業務改善をサポートいたします。
(2)Chatoraによる帳票業務の業務効率化事例
今回ご紹介するのは、あるメーカーでの導入事例です。
導入前の状況としては、日々顧客から送られてくる返品伝票を、数人の担当者で読み取って、必要なデータを基幹システムに登録し、登録内容を確認していました。
毎日数時間その作業に時間を費やすのは担当者の負担が大きく、また精度を保って長時間反復的な作業を行うのは、人間よりも機械に向く作業です。
そのため、ChatoraとRPAを連動させ、返品伝票の読み取りから基幹システムへの登録までの一連の流れを自動化するシステムを提供することで、課題の解決を図りました。
※「Chatora」について詳しくはこちらをご参照下さい。
当社が独自に開発した目検チェックツールは、画像と読み取りデータを2画面に並べて表示させるため、人の目による比較をサポートし、誤りがあっても発見しやすいUIとなっています。