働き方改革が加速するなか、依然として残る紙業務にお悩みの方も多いのではないでしょうか。紙に書かれた内容をデジタルデータ化する際の手作業を代替する手段として、AI-OCRを利用する企業が増えています。本記事ではAI-OCRについて、実際の導入事例を交え紹介します。
AI-OCRとは?
OCRは「Optical Character Recognition/Reader(光学文字認識)」の略で、紙の書類をカメラやスキャナーなどで取り込み、書かれた文字をテキストデータに変換する技術を指します。AI-OCRは、OCRに「AI(人工知能)」を掛け合わせたもので、帳票の印字や手書き文字を高精度で認識し、データ化することができる技術です。
紙の請求書やFAXで送られてくる申込書などのデータを、人の手でパソコンに入力しデータ化する作業をなんとか効率化したいと思っている方も多いのではないでしょうか。AI-OCRは、働き方改革が進み生産性向上が求められるなか、非効率な手作業に代わる手段のひとつとして注目されている技術です。
AI-OCRとOCRの違いとは?
AI-OCRと従来のOCRは、文字認識精度の高さに大きな違いがあります。
従来のOCRは人間が事前に設定した文字のパターンをもとに、読み取った文字を認識します。そのため、形が似ている文字は正しく認識されない場合も多く、シンプルな文字ほど誤認しやすい傾向があります。形が似ている文字でも、人間なら前後の文字や文脈からどちらの文字か判断できますが、OCRは設定された文字の形からしか判断できないため、正しく認識することが難しいのです。
誤認識されやすい文字の一例
- カタカナの「エ」と漢字の「工」
- カタカナの「オ」と漢字の「才」
- カタカナの「カ」と漢字の「力」
また、手書き文字を読み取る場合の認識率はさらに低く、OCRを実用化するのは難しいと考えられてきました。人によって文字の特徴が異なるため、すべてのパターンを網羅して事前設定することも現実的ではありません。加えて日本語の場合、カタカナ・ひらがな・漢字など文字のバリエーションが広く、複雑な形の文字も数多くあります。さらに、読み取れるのは既定の枠内にある文字だけという制限もあり、これもOCRを実用化から遠ざけている原因のひとつと考えられます。
一方AI-OCRは、AIが文字の規則性や関連性を学習し、前後の文字や文章から総合的に判断して正しい文字を認識します。欄外にはみ出した文字をAIが推定し自動補完する、訂正印や黒塗りで訂正された箇所は読み飛ばして認識する、背景に色や模様が入っていても文字情報だけを認識する、など、従来のOCRでは難しかったパターンの読み取りも可能です。たとえ誤認識があっても、間違えたデータをAIが学習することで認識精度を上げていくことができます。
手書き文字に対応したAI-OCRの場合、さまざまな筆跡のパターンを学習するため、多少のクセがある字や乱雑な字であっても高精度な識別ができます。多くの手書き文字を読み取るほどさまざまな筆跡に対応できるようになるため、使えば使うほど認識率が上がっていくのも特徴のひとつです。
AI-OCRの3つのメリット
AI-OCRの導入は、手間がかかる定型業務の簡易化に大きく貢献します。具体的にどのようなメリットがあるのか、ここでは3つのポイントをご紹介します。
入力・転記作業の省力化
これまでは、紙の帳票をデジタルデータにするには、人間が読み取って文字に変換するデータ入力の作業が欠かせませんでした。AI-OCRを使えば、紙の帳票をスキャンしアップロードするだけで自動的に文字をデータ化できるため、これまで手動でおこなっていた入力作業が不要になります。AI-OCRによる読み取り処理は帳票1枚あたり数秒〜数十秒であり、手動での入力よりスピーディーなデータ化で大幅な作業時間削減が期待できます。手書き文字に対応したAI-OCRを利用すれば、印字された帳票だけでなくアンケートなど手書きの書類にも対応可能です。
また、AI-OCRには帳票のレイアウトやキーワードなどの設定情報をもとに、抽出したい項目を探してくれる機能を持ったものもあります。たとえば、請求書の場合「発行日」のキーワードで請求書発行日を、「支払期日」のキーワードで支払予定日を抽出してくれるなどの機能です。事前に帳票を設定せずとも必要な項目を抽出でき、作業の効率化につながります。
チェック業務の負担軽減
紙の文書を見ながら手動でデータ入力する従来の方法では、見間違いや打ち間違いによる入力ミスが発生することも多く、ダブルチェックの負担が大きくなりがちです。入力担当と確認担当、二人以上の人員でデータ化作業を進めている企業も多いのではないでしょうか。
AI-OCRは高精度で文字を認識するため、目視での確認と修正の手間を減らすことが可能です。誤認識がゼロになるわけではありませんが、人が介在する部分を最低限にし、人為的なミスをゼロに近づけることは可能です。また、作業者が手入力するステップをなくすことで認識結果の確認と修正だけに注力できるため、これまで複数人で進めていた入力業務を一人で完了させることも可能となり、チェック業務の負担軽減につながります。
データ保管・検索の利便性向上
AI-OCR をWebデータベースと組み合わせて活用すれば、ペーパーレス化を実現することも可能です。たとえば、FAXで送られてきた帳票を印刷し手入力でデータ化する作業などの場合、送られてきたFAXを印刷せずにWebデータベースへ格納し、AI-OCRで読み取りデータ化するプロセスを構築すれば、ペーパーレスで一連の作業を完了させることができます。
従来のように紙の帳票をファイリングして保管する必要もなくなるため、保管スペースと手間を省くことができます。文字列から検索をすれば、必要な過去書類を探すために分厚いファイルから一枚一枚探す必要もなく、管理が容易になります。
AI-OCRの種類
AI-OCRには、大きく分けて3つの種類があります。それぞれの種類について、特徴とメリット・デメリットをまとめました。各種のAI-OCRと相性が良い業務パターンについても、あわせて紹介します。
1. 定型フォーマット型 | 2. 非定型フォーマット型 | 3. 業務特化型 | |
---|---|---|---|
特徴 | ・事前に帳票のフォーマットを定義し、帳票の「どこになにが書かれているのか」を指定して情報を抽出する |
・AIが帳票フォーマットを学習し、情報を読み取る |
・非定型フォーマット型の進化型
・サービス提供企業が特定の業務に特化したフォーマットを事前に学習させている
|
メリット | ・読み取り精度が高い |
・手動でのフォーマット定義作業が不要で、多くの種別の帳票に対応できる |
・利用者側でAIに学習させる必要がなく、手軽に利用できる
・帳票の内容を読み取ることに加え、データに意味づけをすることも可能
|
デメリット | ・フォーマット定義は人間が対応する必要があるため、事前準備に時間がかかる
・定義されたフォーマットの帳票しか読み取れない
・フォーマットの種類が増えるごとに定義の作業が必要
|
・事前にAIにフォーマットを学習させる必要がある
・未学習のフォーマットでは読み取りできなかったり、精度が落ちたりする
|
・業務特化型のため、決まった業務の帳票にしか対応できない
|
相性が良いケース | ・データ化する帳票の種類が決まっている
・同じフォーマットの帳票を大量にデータ化する必要がある
|
・データ化したい帳票の種類が多い、またはフォーマットがバラバラ |
・特定の業務でのみAI-OCRを利用したい
|
AI-OCRの注意点
ここで、AI-OCRを利用するうえでの注意点を3つご紹介します。
100%正確ではない
AI-OCRは従来のOCRより文字認識率が高いとはいえ、その精度は完璧ではありません。そのため入力作業を100%自動化することは難しく、人が目視で確認する作業が必要となります。AI-OCRも人間と同様、不完全なものであると理解し、丸っきりすべてをAI-OCRに任せることはできないという前提で、どのような形で実務に活かせるかを考えることが重要と言えるでしょう。
また、完全な自動化ができずとも、データ入力も含めすべて人間が実施するのに比べれば、かかる時間も手間も大幅に削減できます。それでもデータ化にかかる工数を減らしたい、完全自動化にこだわりたい、という場合は、データ読み取り、確認、修正作業まですべてがセットになったサービスの導入を検討するのも選択肢のひとつです。
対応できないフォーマットも存在
どのようなフォーマットの帳票に対応できるかは製品によって異なります。自社でデータ化する機会が多い帳票のタイプによって選ぶべき製品が変わってきますので、自社の要件を整理しておくとよいでしょう。
ある程度の学習期間が必要
AI-OCRの読み取り精度は、学習を繰り返すことで上昇します。さまざまなパターンのデータを読み取り膨大な学習データが蓄積することで、AI自ら正確に判断できる力が育っていきます。使い始めてすぐに高精度を期待するのではなく、ある程度の学習期間が必要であることを念頭に入れて導入を考えましょう。
AI-OCRの導入事例
AI-OCRは、実業務のなかでどのように活用できるのでしょうか。ここでは、AI inside社が提供するAI-OCR サービス「DX Suite」の事例を3つご紹介します。
KDDI株式会社
毎月の申込書入力業務にかかる時間を、7分の1に
KDDI株式会社では、「auでんき」という事業の受注業務と支払業務において発生する、申込書と請求書の登録作業にAI-OCRを活用しています。
受注業務では、営業担当が申込書をスキャンし、画像化したものを自社のシステムへアップロード。自社システムとDX SuiteをAPI連携しているため、DX Suiteへのアップロードは不要で読み取り作業に移ることができます。
支払業務では、紙で届く請求書をスキャンし、手動でDX Suiteにアップロード。フォーマットのパターンが約75種類と多いため、自動で読み取り個所を抽出できる機能をメインに活用しています。
AI-OCRの導入により、月に約42時間かかっていた申込書の入力作業が約6時間に短縮するなど、すべての帳票を合わせると月に136時間もの作業時間を削減できています。
現在は帳票のアップロード作業を手動で対応している部分がありますが、AI-OCRとRPAを掛け合わせ、業務全体を自動化することを目指しているそうです。
旭シンクロテック株式会社
自社に眠る紙の資産を、カイゼンに活かす
旭シンクロテック株式会社では、社内のデジタル化に課題を感じ、デジタルトランスフォーメーション(DX)を推進すべくAI-OCRを活用しています。
月に600~1,000枚発生する請求書はすべて人がチェックして入力、紙のままファイリングして保管するなど、アナログな業務手法をとっていました。DX Suite 導入後は、紙の請求書をすべてPDF化してDX Suite で読み取り、CSVで出力したものを担当者がチェック。問題がなければ、そのまま会計システムと社内データベースにRPAで自動登録する、という仕組みで運用しており、入力業務そのものをなくすことができたそうです。
ほかにも、工事現場での小さなミスやトラブルを報告してもらうための「ヒヤリハットカード」など、社内には大量の紙情報が眠っていました。紙資料のデータ化を実現することで蓄積したデータの分析が可能となり、どのような現場でどのような事故が多いのか、など自社の現状を正しく把握できるようになります。自社の弱みを的確に分析しカイゼンにつなげていくうえで、AI-OCRが欠かせないツールとなっています。
MS&AD事務サービス株式会社
年間40,000時間の業務時間削減に成功!
MS&AD事務サービス株式会社では、年間104万件発生する申請関連業務にAI-OCRを活用しています。同社では自賠責保険の申請業務に関連した事務処理を担当しており、事業所によっては年間55万件、繁忙期は1日に5,000件もの処理をしなければならないこともあるそうです。1件につき3種類の書類を処理するため、対応量は膨大です。
DX Suite導入後には、紙で処理していたものがすべてPDFに置き換わり、これまでは不可能だった在宅勤務もできるようになりました。業務時間は年間40,000時間削減、繁忙期の残業も大幅に減らすことができています。
自賠責保険に関連する書類はフォーマットが似ているものも多く、入力する項目が限られているため比較的簡単な帳票ですが、同社では今後複雑な帳票にもAI-OCRを活用し、幅広い業務にノウハウを展開していくことを目標としています。まだまだ紙の業務が残る保険業界において、AI-OCRの活用は大きな力になると言えそうです。
AI-OCR導入にあたっての検討ポイント
最後に、自社にとって適切なサービスを導入するためにおさえたいポイントを2つご紹介します。AI-OCR導入にあたり、どこから着手すればよいか悩まれている方はぜひ参考にしてください。
● 自社に必要な機能要件を考える
前述のとおりAI-OCRには複数のタイプがあり、サービスにより強みはさまざまです。
・印字と手書き文字、どちらに強い方が望ましいか
・フォーマットの事前設定や入力内容の確認に使える社内リソースはどれくらい確保できるか
・他サービスとの連携は充実しているか、自社で使っているサービスと連携可能か
業務プロセスを整理し、上記のような観点で自社に必要な要件を洗い出したうえで適切な製品を導入することが重要です。
● 業務効率化の全体像を考える
業務効率化においては部分的な施策も必要ですが、全体最適を考えることが最優先です。入力の自動化部分だけでなく、読み取ったデータの保管方法や、読み取ったデータをどう分析し活用するかなど、前後のプロセスも重要となります。AI-OCRはあくまで業務改善につなげるツールのひとつです。AI-OCRを導入することが目的になってしまわないよう、業務を最大限に効率化するための活用方法もあわせて考えましょう。
まとめ
今回は、AI-OCRの概要やメリット、利用上の注意点などを、導入事例を交えご紹介しました。AI-OCRは、従来のOCRと比較し精度が飛躍的に向上し、より使いやすく進化しています。
なお、事例をご紹介したAI inside社のDX Suiteは、ドリーム・アーツが提供する「SmartDB(スマートデービー)」とAPI連携が可能です。SmartDBは高度なWebデータベース・ワークフロー機能を兼ね備えており、DX Suiteとの連携によって、データ化したテキスト情報の目視承認や後続業務での活用を含めた、業務プロセス全体のデジタライゼーションを実現します。
業務効率化の一歩先、業務改革を実現するために、導入を検討してみてはいかがでしょうか。
【参考】DX SuiteとSmartDB®︎がAPI連携~AI-OCRとワークフローで紙業務のデジタル化が加速~
3分でわかる「SmartDB」
大企業における業務デジタル化の課題と、その解決策として「SmartDB」で、どのように業務デジタル化を実現できるのかをご紹介する資料を公開しました。ぜひご覧ください。
詳細・お申込みはこちら
この記事の執筆者:髙橋(マーケティング本部)
2017年新卒入社、HRDevelopmentグループにて新卒採用を中心とした人事業務に従事したのち、2022年1月よりマーケティング本部に参画しました。これまでの経験も活かしつつ、みなさんの業務が少しでも楽になるような情報をお届けしたいと思います!