検索
column & blog
DX技術本部

AI-OCRの解説、および活用事例のご紹介

AI-OCRの解説とChatoraを活用した業務効率化事例についてご紹介

AI-OCRの解説、および活用事例のご紹介

今回は、OCRとAIの関係からAI-OCR製品「Chatora」を活用した事業事例についてお伝えできればと思います。

プロフィール 中村一彦

1. OCRとAIの関係
OCR(Optical Character Recognition/Reader、光学文字認識)とは、紙に印刷された文字や手書きの文字をスキャナーなどで読み取り、画像内の文字を認識して、テキストデータに変換する技術のことです。
まず、OCRとAIの関係の歴史の概略と、基本的な技術を解説します。

(1)OCRの歴史

①OCRのはじまり
画像をテキストデータに変換するスキャナーの原型は、19世紀末には考案されており、OCRは1920年代には既に研究されていました。
初期のOCR技術は、予め用意しておいた識別パターンのテンプレートと光電管で読み取った画像を比較して、マッチングさせるというものでした。
1930年頃には、ドイツやアメリカでOCRの特許が取得されています。
1950年頃にはアメリカで視覚障がい者支援を目的に、OCR技術と音声合成技術を組み合わせて、読み取ったテキストデータを読み上げる研究もされましたが、頓挫しました。
その後アメリカでは、認識できる文字や書体の種類の幅を広げることに成功し、1955年には最初の商用システムがリリースされています。

日本のOCR
日本では1968年に国産OCRが初めて製品化されました。
同年に郵便番号が導入されたことを背景に、手書きの数字を読み取って仕分けするのに活用されました。
1970年代には、手書きのアルファベットとカタカナを認識できるOCRが登場しました。
1980年代にはパッケージソフトとしてOCRがリリースされるようになり官公庁や大手企業が利用するようになりました。
また、高品質な活字であれば、漢字も認識できるようになりました。
1990年代後半にはパソコンが普及しはじめ、OCR端末の小型化が進みました。

OCRとAIの結びつき
2000年代後半から現在まで続いている、所謂 第3次AIブームにより、ディープラーニング(深層学習)の研究が急激に進みだし、OCR技術へのディープラーニングの適用が盛んになりました。
2010年代後半から2020年代初頭にかけて、クラウド上のディープラーニングを活用して高精度の読み取りを行うOCRエンジンを提供する、AI inside (DX Suite)などのベンダーが日本でサービスを開始しました。
2017年頃から日本市場では、それらを従来のOCRエンジンと区別するために、「AI-OCR」と呼ぶようになりました。
現在ではAI-OCRサービスも比較的安価で提供されるようになっており、今後ますます普及していくと予想されます。

(2)OCR・AI-OCRの基本
人間の目は視界の中から読む文字を瞬時に見分け、解析し、言語として認識することができますが、これら一連の処理をOCRとして実現するためには様々な技術が使われています。

①OCRの基本

OCRの基本

・入力~文字列分割
OCRは、まず取得した画像データから文字列が書かれている部分の画像領域を抽出します。これには複数文字が含まれるため、1文字単位に文字列を分割します。

認識①~文字特性解析
分割した文字の特徴を抽出します。
例えば手書き文字の場合、文字の傾きや掠れ・潰れなど、人によって書き方の癖があります。そういった変動を抽出します。

認識②~パターンマッチング
予め登録されている様々な書体の文字と照合し、どれだけ近いかを計算します。

認識③~単語辞書による言語処理
文字列の前後関係から、より正確な認識結果を導き出します。

②AI-OCRの基本

AI-OCRの基本

・認識~ディープラーニング(深層学習)
予めAI-OCRに大量の文字や帳票画像を学習させておきます。
人間が読み取りルールを詳細に設定する必要はありません。
学習済みのAI-OCRが、取得した画像データから自動で特徴を抽出して、文字や画像を認識します。

AI-OCRは、人間が設定した読み取りルールでは取りこぼしていた文字の特徴を自動で抽出するため、従来のOCRと比べて認識精度が上がります。

ページトップへ戻る

2. AI-OCRサービスの現状と課題
このように、AI-OCRは従来のOCRと比べて認識精度が上がっており、近年では比較的手頃な価格でサービスが提供されるようになってきたため、利用しやすくなってきています。

(1)AI-OCRを活用したサービスの現状

AI-OCRサービスは、読み取る帳票の性質や外部システムとの連携の有無など要件に合ったものを選択することが大切です。
各製品の強みを発揮できないと、期待した認識精度が得られないおそれがあるからです。
読み取る帳票が定型か非定型か、文字は活字か手書きか、多言語対応が必要か、外部システムと連携できるか など、導入前に要件を幅広く検討しましょう。

(2)AI-OCRサービスの課題

・認識精度が100%ではない
認識精度は、元となる帳票画像の鮮明度や、枠線と文字の重なりの度合いに影響を受けます。
また、人間なら読み取れる手書き文字も、定型から外れていると読み取れない場合があります。
そのため、認識精度100%に到達するのは難しいのが現状です。

・正確性を求める場合には目検チェックが必須
認識精度が100%ではない以上、例えば会社の売り上げなどに関わる重要なデータをAI-OCRにかけて基幹システムに登録する場合、登録する前に目検チェックが必須です。
システム化検討時に、データ読み取り・入力の手間と、目検チェックの手間の比較衡量が必要です。

・非定型に対応できない場合がある
ツールによっては定型のみ対応のAI-OCRツールがあります。
読み取りたい帳票は定型か非定型か、今後非定型帳票が追加される可能性はあるか、非定型対応ツールにコストをかけるだけの効果があるかなどを、予め検討しましょう。

・導入コストがかかる
AI-OCRは最先端技術を搭載している分、OCRよりも費用は高くなります。
オンプレミス型かクラウド型かでも費用が異なります。
導入前に費用対効果を試算し、必要な機能を検討しましょう。

ページトップへ戻る

3.  Chatora(当社独自サービス)を活用した業務効率化事例
最後に、当社のAI-OCR製品であるChatoraを活用した業務効率化の事例を紹介します。

(1)Chatoraの紹介

Chatoraは、AI画像認識技術を活用し、手書き書類や各種紙帳票の文字を読み込み、データ化するサービスです。
複数種類の帳票から読み取ったデータを、システムに手入力するといった、単調で反復的な業務を自動化し、生産性向上をサポートします。

◆Chatoraの3つの特徴

・手書き帳票の読み取り・データ化が可能
取引先の都合などによって紙媒体が必須でも、手書き帳票を読み取り可能なChatoraを使えば、データ入力にかかる時間を大幅に削減できます。

・帳票の自動仕分け機能
帳票に複数のフォーマットがあっても自動的に仕分ける機能が搭載されています。
また、業界別の非定型帳票モデルも組み込まれているため、多様な帳票に対応可能です。

・データ読み取り後の自動化をサポート
当社ではこれまでのシステム開発・RPA開発の実績を元に、入り口から出口までの業務改善をサポートいたします。

(2)Chatoraによる帳票業務の業務効率化事例

今回ご紹介するのは、あるメーカーでの導入事例です。
導入前の状況としては、日々顧客から送られてくる返品伝票を、数人の担当者で読み取って、必要なデータを基幹システムに登録し、登録内容を確認していました。
毎日数時間その作業に時間を費やすのは担当者の負担が大きく、また精度を保って長時間反復的な作業を行うのは、人間よりも機械に向く作業です。
そのため、ChatoraとRPAを連動させ、返品伝票の読み取りから基幹システムへの登録までの一連の流れを自動化するシステムを提供することで、課題の解決を図りました。

Chatoraによる帳票業務の業務効率化事例

Chatoraを利用して帳票フォーマットの定義を事前に行い、高い精度で返品伝票を読み取り、Pythonで開発したシステムでデータを整形し、当社が独自に開発したツールで目検チェックを行ったうえで、RPAで基幹システムに登録するアーキテクチャとなっています。

AI-OCRアーキテクチャ

※「Chatora」について詳しくはこちらをご参照下さい。

当社が独自に開発した目検チェックツールは、画像と読み取りデータを2画面に並べて表示させるため、人の目による比較をサポートし、誤りがあっても発見しやすいUIとなっています。

帳票画像取り込み

AI-OCRによる読み取りと目検チェックによって、高い精度で作業時間を半減することが見込まれます。

AI-OCR導入による作業時間比較

業務自動化サービスにおいては、このようにオーダーメイドによるシステムの開発を検討することも必要になります。
当社では、入念なコンサルティングからお客様独自のシステムとの連動まで幅広くカバーし、ビジネス課題に合わせた業務自動化サービスを提供可能です。
自社独自の業務自動化の検討が必要になった際には、ぜひご相談ください。

※ Chatoraのサービス名およびロゴマークは、株式会社システム情報の登録商標です。
※「Python」およびPythonロゴは、Python Software Foundationの商標または登録商標であり、Foundationの許可を得て株式会社システム情報が使用しています。 
※ 掲載の会社名・製品・サービス名・ロゴマーク等は各社の日本および他国における商標または登録商標です。
※ 掲載の画面は、すべてイメージです。また、掲載している文章、写真、画像、データ、イメージについて弊社の許可なく無断転用・ 転載・変更・改ざんすることを固くお断りします。