OCRとは
OCRとは、「Optical Character Reader(またはRecognition)」の略であり、日本語では「光学文字認識機能」と呼ばれています。
活字や手書きのテキストの画像を専用のスキャナで読み取り、文字データに変換するソフトウェアです。
これまで、紙文書等に一度印刷されてしまった文字をデジタル化するには、手作業で入力する必要がありました。
その作業を、専用機器で帳票等の紙やPDFファイル等を読み取り、コンピューターで使えるテキストデータとして変換してくれるシステムがOCRなのです。
OCRが注目されている背景
業務効率を上げるツールとしてOCRが注目される理由としては、以下の3点が挙げられます。
- 生産性向上の必要性
- RPAツールの普及
- AI技術の発展
OCRを導入することにより、データ入力等の業務を大幅に効率化できるため、活用する企業や自治体は増えてきています。
近年、生産年齢人口の減少が推測されていることがあり、生産力の維持が今後の大きな課題となっているためです。
現在の生産力を維持しつつ、作業の効率化を図るよう変化が求められているのです。
それでは、項目ごとに詳しく掘り下げていきましょう。
生産性向上の必要性
前述した通り、人手不足が問題とされる昨今では、作業の効率化による生産性の向上が不可欠となります。
少子高齢化や人口減少の加速により、生産年齢人口の減少も推測されることから、生産力の維持が大きな課題とされています。
人間の手で、手間と時間をかけて行われている定型業務の効率化が求められるようになってきました。
それらの問題に対し、OCRを導入することで、それまで目視で行われていた紙文書の業務システムへの入力は大きく効率化できると考えられています。
RPAツールの普及
RPAとはRobotic Process Automation(ロボットによる業務自動化)の略であり、パソコンを使用する業務において、決まった手順で行う作業等の自動化が可能となります。
RPAツールを利用することにより、人が行う必要のない定型作業の自動化への取り組みが可能となることから普及が加速しています。
OCRとRPAを組み合わせることで、OCRによる紙文書のテキストデータ化と、RPAによる業務システムへの入力・集計作業の自動化が実現するのです。
AI技術の発展
最近はAI(人工知能)技術を取り入れた「AI OCR」も登場しており、OCRはさらなる進化を遂げています。
OCRが活用されはじめてからは一定の評価を得ましたが、誤変換が生じる等精度の面で課題も多く、人の目でチェックする必要がありました。
しかし、OCRにAIを搭載することにより、非定型文書の読み込みや高精度な文字認識が実現し、より実用的なシステムとなったのです。
このように、従来のOCRでは困難だった領域への活用が可能となり、より多くの企業がOCRに注目する流れになりました。
OCRの仕組み
OCRの仕組みには、以下の4つの業務プロセスがあります。
- スキャン→画像データへの変換
- レイアウトの解析
- 文字の処理
- 出力
ほとんどのOCRでは、このような流れで紙や画像の文字をデジタル化します。
それでは、具体的な流れについて順を追って見ていきましょう。
スキャン→画像データへの変換
スキャナやカメラを用いて、OCRしたい紙の書類の画像データを読み込みます。
この時点では、一般的に利用されている写真を取り込む作業と変わりません。
書類の表面に汚れやしわ等があると精度が落ちるため、それらを取り除いてからスキャンする必要があります。
サービスによってスキャンを代行してくれるものもありますが、一部では読み取り機器等のレンタルをする形式の場合もあります。
ほかにも、データ内の文字の加工、画像の明るさの調整、ノイズ除去等の調整が必要です。
レイアウトの解析
文書は文字列だけではなく、画像や罫線等に分かれているため、解析をして分類します。
引用:ドキュメントリーダ|機能 レイアウト解析|東芝デジタルソリューションズ
文書に合わせて、あらかじめテキスト領域や画像領域のレイアウトをテンプレート化しておくケースもあります。
ただし、見積書や請求書等の会社ごとにフォーマットが異なる書類は、その都度レイアウトを指定する必要があるでしょう。
また、AI-OCRの中には、人の手で行われていたレイアウト指定作業に、自動で対応している種類もあります。
文字の処理
文字部分として認識された箇所の切り出しを行い、一定のサイズに変換した後、それぞれに分類します。
そして、抽出された特徴に対して、事前に作成しておいたフォントパターンとマッチングさせ、文字を確定させるのです。
ちなみに、OCRでは1文字単位での文字の切り出しを行いますが、AI-OCRの場合は文字列での認識が可能です。
AI-OCRの文字認識率は高くなっていますが、100%の精度ではないため、最終的には人の目視チェックが必要となります。
出力
文字認識が終了すると、確定した文字をテキストとして処理して出力します。
最近は、ほとんどのOCRソフトがWord、Excel、一太郎、PDF、HTML等のフォーマット出力に対応しています。
これらのフォーマットに対応することにより、元の原稿とほぼ同じように電子化することが可能です。
OCRの得意領域について
OCRの得意領域は、ある程度のテンプレート化が可能である文書と言えます。
具体的には、契約書や規約等の文章が中心となっているPDFファイルの編集や検索を実現する業務フローです。
ほかにも、月々に発行される枚数等が少なく、特殊な文言等の表記揺れの少ないシチュエーションでその価値を発揮できるでしょう。
OCRの不得意領域について
OCRの不得意領域は、膨大な数の帳票の処理、さらにひとつひとつの取引が細かく異なるケースです。
また、それらの帳票を、WordやExcel以外での形式で入力する業務フローが発生するケースも同様と言えます。
人の目で行うような柔軟な修正やレイアウト、フォーマット変更がその都度求められる場合では、OCRを運用フローに落とし込めない傾向にあります。
OCRを技術要件とするサービスのメリットについて
OCRを技術要件とするサービスのメリットは、以下の3点です。
- データ入力作業の手間を大幅に削減
- 保存したデータの検索性の向上
- 遠隔地との情報共有の実現
技術の発展により実用度が増したOCRですが、どのようなシーンで恩恵を得られるのでしょうか。
個人利用であれば、PDFファイルのWord変換・レシートの読み取り等が挙げられます。
ビジネス利用であれば、課税文書や名刺の電子化に使用されるシーンが多いでしょう。
それでは、OCRサービスの具体的なメリットについて掘り下げていきます。
データ入力作業の手間を大幅に削減
OCRの導入により、これまで手作業だったデータ入力作業が大幅に削減され、人的リソースの削減が可能となります。
月末月初の伝票入力作業等は、スキャンとほぼ同時に書類形式での文書保存ができるため、作業時間の短縮に繋がるでしょう。
また、入力作業が集中する繁忙期等は残業になったり、他部署への応援や外部への作業の依頼等に対応する必要があります。
OCRを導入することで、ペーパーレス化を行う際の人的リソースを減らすことができるため、人件費の削減にも繋がります。
保存したデータの検索性の向上
OCR導入での代表的なメリットと言えば、任意のキーワードによる一瞬でのデータの検索が可能となることです。
紙文書の中から探す場合は目視で1ページずつ探さなければなりませんが、OCR処理をすることにより電子ファイルならではの探し方が可能となります。
2022年1月に施行された改正電子帳簿保存法でも、特定の項目で検索できることが求められています。
帳票は、日付や金額、取引先が検索可能な状態のデジタルデータとして保管するニーズがより高まりました。
遠隔地との情報共有の実現
OCRの導入による文書の電子化を推進することで、保管スペースの削減や遠隔地からの書類確認を実現します。
電子化された情報は複数人での管理や共有がしやすく、データを加工しての添付も可能となることから作業効率がアップするでしょう。
これまでのように、大量の紙書類の中から必要なものを探し出す手間がなくなるのです。
OCRを技術要件とするサービスのデメリットについて
OCR製品を導入したことによるデメリットは、以下の3点になります。
- OCRソフト/読取機の導入コストの発生
- 文字認識精度の低さ
- インボイス制度への対応不備
OCRでよく挙げられるデメリットとしては、読み取り精度の問題があります。
日本語は複雑な上、手書き文字の場合は読み取れない場合も多く、柔軟な対応ができないのがOCRの弱点です。
ほかにも、自社でスキャン作業を行うには導入コストがかかること、インボイス制度への対応不備も挙げられます。
こうしたデメリットをきちんと理解した上で導入し、OCRを上手に活用していきたいところです。
それでは、OCRサービスのデメリットについて、詳しく見ていきましょう。
OCRソフト/読取機の導入コストの発生
自社でOCRによるスキャン作業を行う場合は、スキャナやリーダー、ハンディターミナル等の読み取り機の導入や撮影コストが発生します。
事前にどの程度の費用がかかるかを算出し、効果予測値と照らし合わせた上で、導入の検討をしましょう。
例えば、初期費用に関しては、オンプレミス型のAI-OCRは高く、クラウド型のAI-OCRは低い傾向にあります。
文字認識精度の低さ
OCRの弱点は、文字認識精度が必ずしも100%とは言えない点です。
その結果、処理後の目視確認や修正により、人的リソースの増加に繋がってしまうこともあるでしょう。
中には、複雑な商習慣や単位、商品名等を帳票に含んでいるケースでは、ほとんどOCRではカバーできないケースも存在します。
ほかにも、癖の強い手書き文字等も認識できない可能性が高いと言えます。
インボイス制度への対応不備
インボイス制度で必要となる、各帳票への登録番号や税計算の結果等について、OCRで正誤を確認することはできません。
したがって、目視等で確認した上で、記載内容に間違いがないかをチェックする必要があります。
OCRソフトウェアを導入する上でのポイント
OCRソフトウェアを導入するポイントは、以下になります。
- 帳票の文字タイプ・件数・レイアウト
- 読み取る文字の言語(日本語or外国語)
- データの入力・出力
- 運用手法(クラウドorオンプレミス)
OCRソフトウェアの導入前に、実際に利用している帳票類で使用できるかを確認しておきましょう。
導入後に、読み取り間違いやエラーが発生してしまう可能性があるためです。
それでは、どういった点がポイントであるかを、ひとつずつ解説していきます。
帳票の文字タイプ・件数・レイアウト
OCRの導入には、手書き文字が多い場合やレイアウトが定型の場合等に合わせて、それぞれを得意とする製品を選ぶ必要があります。
OCRは製品ごとに得意な帳票や機能、性能が異なるため、自社の業務に合っている製品を選択するのが重要です。
例えば、帳票のレイアウトが定型の場合には、一度に大量の処理を行える製品を選ぶのが良いでしょう。
非定型であれば、レイアウトへの対応が柔軟な製品がおすすめと言えます。
読み取る文字の言語(日本語or外国語)
海外に拠点がある場合等、帳票に使用される言語が日本語以外にもあるケースでは、様々な言語に対応しているOCRの導入が必要です。
製品によって読み取ることができる対象言語が異なるため、読み取りたい言語に対応しているか確認しましょう。
日本語と英語であれば、基本的には国内メーカーの製品で十分な機能を果たします。
データの入力・出力
あらかじめ、OCRの読み込みや出力を行いたいファイルの形式に対応しているかを確認しておきましょう。
そうすることによって、電子化後の文書の整理をより効率化することが可能となります。
運用手法(クラウドorオンプレミス)
OCR導入の前に、日々の運用フローを検討しておき、どういったタイプのOCR製品が適しているかを考えることが必要です。
例えば、リモートワークを重視する場合には、ブラウザ経由でアクセスしやすいクラウド型が適しているでしょう。
また、業務フローに合わせた柔軟なカスタマイズがしたいのであれば、オンプレミス型がおすすめです。
社内ネットワークでの利用が基本であり、自社サーバーでの管理となるため、セキュリティ強度をコントロールできるのも特徴です。
OCRソフトウェアの導入でよくある失敗事例
OCR導入でのよくある失敗事例は、以下の3点です。
- 読み取りの精度に難があり、最終的な調整に人的リソースが多分にかかってしまう
- サービス提供側に紙での原本送付が必要になるので、紙のリソースが減らす発効までにラグが生まれる
- 月々に発行する帳票(特に納品書)の枚数が非常に多く、金銭的・時間的コストが大きくなり、現場の運用に即したものにならない
外形的な知識でOCRソフトウェアの導入をしてしまうと、イメージしている「自動での文書電子化」とかけ離れてしまう場合があります。
具体的にどういったことが起きるのか、失敗事例を見ていきましょう。
読み取りの精度に難があり、最終的な調整に人的リソースが多分にかかってしまう
OCRの文字認識精度が上がってきているとはいえ100%ではないため、目視チェックや修正作業が必要となります。
特に、特殊な記号や単位、商品名等がある場合は、思っていたよりも人の目を必要とする場面が出てくることもあるでしょう。
そうした結果、イメージしていた「自動での文書電子化」が実現できない形となり、人的コストが多分にかかったままとなってしまいます。
サービス提供側に紙での原本送付が必要になるので、紙のリソースが減らず発行までにラグが生まれる
スキャンを代行してもらう場合にはスキャンコストはかかりませんが、結果として必要となる紙の原本のリソースは減ることはありません。
また、OCRサービスの提供者側に送付した上でスキャンしてもらい、その後再送といった流れとなるため、発行までにはかなりのラグが生じてしまいます。
さらに、スキャンする納品書や請求書等の正誤の判断や、法律上から手を加えられないこともデメリットとして考えられます。
その結果、取引先への手間が増加することへの懸念や、紙リソースの減少には至らないこと等、イメージしていた「文書電子化」とは違ってしまうのです。
月々に発行する帳票(特に納品書)の枚数が非常に多く、金銭的・時間的コストが大きくなり、現場の運用に即したものにならない
日々の業務の中では月末月初の請求書以外に、納品書等の多様な帳票が発生します。
対象となる業界の例は、次のようになります。
- 飲食業
- 卸売業
- 小売業
- 製造業
- 宿泊業
- 冠婚葬祭
このような業務の中で、多様な帳票を一枚ずつOCRの処理フローにかけていくことは、運用上現実的ではないと言えるのではないでしょうか。
加えて、上述した「読み取り精度の低さ」等も相まって、現場レベルではリソースの削減に繋げられない結果となってしまいます。
卸売・小売・飲食業等日々の帳票が膨大な企業は、OCRではなくoneplatがおすすめ
本記事で解説してきたように、OCRの特徴として、定型文書に強いという点が挙げられます。
しかし、複雑な商習慣や単位等を不得意としており、膨大な納品書の処理等には適していないと言えるでしょう。
oneplatは、日々の納品書を送付してくれる取引先と一緒に、oneplat上での電子化を実現でき、データの一元管理や確認、承認が可能です。
情報のチェックも相互でプラットフォーム上で行えるため、業務の効率化やコスト削減が可能。
卸売・小売・飲食・宿泊・理美容・冠婚葬祭・製造業等を中心に、日々の運用に即した形での導入を実現できます。
OCRについてまとめ
OCRの導入により、データ入力等の人的リソースの削減や、保存データの検索性の向上、遠隔地との情報共有の実現等が可能となりました。
特に、申込書や契約書等を紙ベースで扱う情報が多い保険業や金融業等は、OCRの導入に適している業種と言えるでしょう。
対して、納品書等の複雑な帳票の電子化については、データで一元管理ができるoneplatがおすすめです。
インボイス制度にも対応、さらには導入時のサポートも無料のため、スムーズに電子化への移行が可能となります。
それぞれに適したツールを検討し、業務の効率化や人的リソースの削減等を目指していきましょう。