AI OCRとは?従来より高精度に手書きや活字をデータ変換できる!

情シス

紙の伝票や申込書の打ち込み業務が多くあるけれども、スキャナーで読み込んで高い精度で文字データへ変換する方法はないものか、社内からの相談で探している中堅・中小企業の情報システム担当の方もいらっしゃるのではないでしょうか。この数年AIの活用が進む中、紙に書かれている手書きの文字や活字をAIを活用して文字データへ変換するサービスが数多くリリースされています。これらは「AI OCR」と言われるサービスで、文書や伝票、申込書、請求書、申請書などをスキャンして従来のOCRよりも高い精度で文字データを作成することができ、企業や自治体でも導入が増えています。ここでは、AI OCRのサービスを探している中堅・中小企業の情報システム担当の方へ向けて、AI OCRとはどのようなものかや、AI OCRのサービスの種類、AI OCRで出来ることや使い方、メリット・デメリットなどをご案内しています。この記事を読んでぜひ業務効率の向上とコスト削減に向けてAI OCRのシステム選定に進んでみてください。

1.AI OCRとは

ここではAI OCRとはどのようなものか、まず最初に知っていただきたいことをご案内いたします。

1-1.そもそもAI OCRとは

AI OCRとは、紙などに記載された手書きや印字された活字をスキャンして画像ファイルとして電子化し、AIを利用して画像ファイル内の手書き文字や活字を文字認識してデータ化しするものです。単純な1や0のような数字から、ひらがな、カタカナ、漢字、アルファベットまでデータ化が可能です。
ご存じの通り手書きの文字は、書き方や筆跡が人によって様々です異なります。そのためAIに手書き文字を学習させることで文字の読み取り精度を上げていくことも可能です。また、AIはもともと文章を認識して作成することができますので、読み取った文字データも前後の文脈にあわせて精度を高めた修正を加えることも可能になります。
ちなみに、印字された活字にはいろいろなフォントや段組みがあり得ますが、AI OCRであれば比較的柔軟にデータ化を行うことができます。

1-2.普通のOCRとは

AI OCRを語るうえで、まず普通のOCRについてどのようなものかご案内いたします。

OCRはOptical Character Recognitionの略で、日本語で言うと「光学文字認識」となります。OCRは、手書きで書かれた紙をスキャンして、あらかじめプログラムに登録された文字パターンと画像の手書き文字を比較してデータ化を行うものです。使用例とすると企業であれば会計伝票であったり、かつては入学試験の願書でも良く利用されていました。この普通のOCRでは、あらかじめプログラムされた文字パターンを使って画像化された文字をデータ化していくため、決まったフォントで印字された活字であったり、指定された欄の中に記入された手書きの数字などどあれば比較的高精度に取り込みが可能です。反面、あらかじめプログラムされた文字パターンと合致しずらい、フリーフォーマットに手書きで書いた文字を読み取ったり、その文字自体がくせ字や読みにくい文字の場合は、読み取り精度は悪くなりがちでした。
よく人間同士でも他の人が書いた走り書きに「これ、何て読むんだっけ?」と読めずに確認することもあると思います。普通のOCRを利用した場合はあらかじめプログラムされたパターンからだけ文字認識できるので、どうしても読めないケースや別の字に判読してしまうケースが発生することも多くなってしまいます。

1-3.AI OCRと普通のOCRの違い

ここではAI OCRと普通のOCRの違いについてご案内いたします。

文字の読み取り精度は、一般的にAI OCRの方が普通のOCRよりも高くなります。普通のOCRではあらかじめプログラムされた文字パターンと機械的に一致するかで判読を行いますが、AI OCRでは同じ字であっても様々な書き方や崩し方を学習できるため学習データが増えるだけどんどん読み取り精度を上げていくことが可能です。また、読み取り対象の文章の書式についても読み取り精度にも影響してきます。例えば、普通のOCRでは会計伝票などあらかじめ文字が記入される位置が決まっている書式の文章の方が読み取り精度が良くなりますが走り書きのようなど、どこにどの大きさであるかわからない文字については読み取り精度が悪くなります。しかしAI OCRであれば書式自体も学習対象となるため、文字が書かれている書式も考慮して文字判別を行っていくことが可能です。
簡単に言い換えると、普通のOCRは手書きの様々な書き方を学習せず開発時の文字パターンと一致するかでしか判読しませんので、いろいろな書き方がされている文章を読み取る際の読み取り精度としては、AI OCRの方が上と言えることができます。

このほかにも専門用語や業界用語などもAI OCRであれば学習させることでスムーズに判読につなげていくこともできます。

1-4.AI OCRならではの特徴

ここではAI OCRならではの特徴をご案内いたします。

  • 読み取った画像にノイズが入ってしまっても、普通のOCRとは違いAIが文字認識をすることができる。
  • 文字認識を行う際のモデルが普通のOCRであれば進化しないものの、AI OCRであれば継続的に学習ができる。学習データとして提供する方法と実際に使うことで文字認識のモデルを学習を行っていくことができる。
  • 日本語以外の言語でも読み取りができるため、海外との取引がある企業でも活用することができる。
  • 学習機能があるので自社や業界で使っている用語も学習させ、自社や業過の用語についてもOCRで読み取ることができる。

2.AI OCRは3種類に分かれる

AI OCRは読み取り方の違いにより3種類に分けることができます。それぞれAI OCRを「業務フォーマット型」「定型フォーマット型」「非定型フォーマット型」に分けることができ、ここではその3つをご案内いたします。

2-1.業務フォーマット型

業務フォーマット型のAI OCRは、例えば請求書の読み取りや保険金の申請書の読み取りなどあらかじめ業務に特化されているAI OCRのことを言います。開発の時点で様々な請求書のや保険金のフォーマットを学習しているため、AI OCRを使う企業で事前に請求書や保険金のフォーマットを学習させる手間を省くことができます。また業務特化したAI OCRならではの機能としては、例えば会計に特化したAI OCRなら、請求書の読み取り時に、その請求書の内容から自動で勘定科目を生成して仕訳データも請求書の読み取りの他に行うことができます。会計に特化しているため他の業務に使えないというデメリットもあります。

2-2.定型フォーマット型

定型フォーマット型のAI OCRは、例えば自社で様々な手書きの定型フォーマットがある場合、AI OCRに自社のフォーマットを読み込ませ1つ1つのフォーマットにこの欄にはこんなことが書かれていると、AI OCRに学習させて利用するものです。定型フォーマット型は、よりAIが判読しやすい情報を与えるため、読み取り精度を高めることができます。もし何も学習させていない文章を読み取ろうとした場合は精度の悪い結果となったり読み取りができない場合もあります。

2-3.非定型フォーマット型

非定型フォーマット型のAI OCRは、例えば自社で様々な手書きの定型フォーマットを使っているが、AI OCRには自社のフォーマットを学習させずに、それまでにAI OCRが学習してきた帳票を基にして文字の読み取りを行うものです。自社のフォーマットを学習させずにいきなり使用することができるのが特徴ですが、定型フォーマット型に比べると精度は落ちてしまいます。

3.AI OCRで出来ることと使い方

ここではAI OCRで出来ることとAI OCRの使い方についてご案内いたします。

3-1.AI OCRで出来ること

ここではAI OCRで出来ることをご案内いたします。

  • 手書きの文字をデータ化する
  • 印刷された活字をデータ化する
  • 画像内に埋め込まれている文字をデータ化する
  • PDF内にあるある文字をデータ化する
  • 名刺を読み取ってデータ化する
  • 数値が入った帳票をCSVやエクセル形式にデータ化する

3-2.AI OCRの使い方

AI OCRですが、AIが文字認識をするため学習不足などが原因でやはり間違えて文字を読み取ってしまうこともあります。まずは、AIの読み取り精度を上げる工夫を行うことが大切です。導入に際しても自社のフォーマットを学習させることのできる定型フォーマット型AI OCRを導入したり、既にその業務の学習がある程度済んでいる業務フォーマット型のAI OCRを可能なら選ぶと最初からある程度は読み取り精度が上げやすくすることができます。
またそれでも、学習していない珍しい表現にカタカナの「ワ」や「ク」が含まれておいると逆に読み取ってしまったり、カタカナの「エ」と漢字の「工(コウ)」を逆に読み取ることもあります。AI OCRも学習で精度はよくしていくことはできますが、間違いに気づくことはできないため、この業務フローの中で、人手で確認して間違っていれば修正するオペレーションフローを組み込むことをおすすめいたします。

4.AI OCRのメリット、課題・デメリット

ここではAI OCRのメリット、課題・デメリットをご案内いたします。

4-1.AI OCRのメリット

ここではAI OCRのメリットをご案内いたします。

AI OCRの1番のメリットは、やはり普通のOCRに比べて識字率が高いことが上げられます。AIは手書きの文字を何度も学習して記憶できるため、最初に登録された文字パターンの中から文字マッチングを行う普通のOCRに比べると識字率を上げることができます。ちなみにAIが間違えた箇所も修正していくことで学習精度をより上げていくことができます。

他にも、AI OCRにはあらかじめ省力化を想定して他の基幹システムとのAPI連携機能が付いているものもあります。例えばAI OCRで読み取ったデータをAI OCR上で確認をして問題なければ基幹システムに取り込むというように最低限の手間で行うこともできます。

また他にも普通のOCRと大きく異なる点としては、AI OCRは読み取る文章のここに氏名があってというような書式情報をAI OCRに渡さなくても、一応はAIが過去の学習データを基に文章を読み取ってくれる点があります。過去の学習データと読み取る文章の書式がかみ合った場合は書式情報を渡す作業をカットすることができます。

4-2.AI OCRの課題・デメリット

ここではAI OCRの課題やデメリットをご案内いたします。

AI OCRの課題やデメリットとしてよく最初に挙げられるのは、導入や運用の費用です。AI OCRのサービスは現在では様々な会社から提供されていますが、導入費用で数万円から数十万円とサービス内容によって結構幅があります。また運用費用も月額固定費の他にスキャン枚数に応じた従量課金が設定されているものもあります。そのためAI OCRにかかる費用の課題については社内で削減できるコストと導入や運用にかかる費用のシミュレーションを行ってトータルにコストダウンを図れる絵を描いていくことをおすすめいたします。

またOCR全般に言える事ですが、AI OCRになっても間違った文字認識はなくならない課題は残ってしまいます。ただ、学習できるため普通のOCRよりは文字の認識率は向上させることができ、かつ高速に大量の処理を行うこともできます。そのためAI OCRが出力した変換結果を間違いがあるかチェックをする体制を整えていくことで全体的に手間を削減していくことをおすすめいたします。

5.代表的なAI OCRサービスのご案内

ここでは代表的なAI OCRサービスをいくつかご案内いたします。

コメント

タイトルとURLをコピーしました