JP7452059B2 - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP7452059B2 JP7452059B2 JP2020021691A JP2020021691A JP7452059B2 JP 7452059 B2 JP7452059 B2 JP 7452059B2 JP 2020021691 A JP2020021691 A JP 2020021691A JP 2020021691 A JP2020021691 A JP 2020021691A JP 7452059 B2 JP7452059 B2 JP 7452059B2
- Authority
- JP
- Japan
- Prior art keywords
- preprocessing
- processing
- image data
- partial area
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 17
- 238000012545 processing Methods 0.000 claims description 263
- 238000007781 pre-processing Methods 0.000 claims description 171
- 238000000034 method Methods 0.000 claims description 79
- 230000008569 process Effects 0.000 claims description 72
- 230000008685 targeting Effects 0.000 claims 4
- 238000012015 optical character recognition Methods 0.000 description 106
- 238000010586 diagram Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 26
- 238000012805 post-processing Methods 0.000 description 26
- 238000004891 communication Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 230000002787 reinforcement Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
スキャナやデジタルカメラで撮像された画像データをOCR処理に直接出力することも可能であるが、OCR処理による文字の認識の結果の確からしさを示す値(以下「確信度」という)を上げるためには、事前に処理を加えることがある。例えばOCR処理の前に、画像に含まれるノイズや地紋等を除去するクレンジング処理を実行することがある。この他、取得時における画像の解像度を高く設定することがある。以下では、OCR処理の前に実行される処理を前処理と呼ぶ。
請求項2に記載の発明は、プロセッサを有し、前記プロセッサは、取得した画像データに対して前処理を実行し、前処理後の前記画像データを処理する後段側の処理から、当該画像データに対応する画像のうち少なくとも1つの部分領域を特定する情報を受け付ける場合、特定された部分領域を対象として特定の前処理を実行する、情報処理装置であり、前記プロセッサは、部分領域を特定する前記情報に、部分領域を対象とする処理の結果の精度が予め定めた閾値よりも低いことを示す情報が含まれる場合、部分領域を特定する前記情報により特定された部分領域に対し、前回までとは異なる内容の前処理を実行し、前記プロセッサは、同種の部分領域間における精度の違いに基づいて原因を推定する、情報処理装置である。
請求項3に記載の発明は、コンピュータに、取得した画像データに対して前処理を実行し、前処理後の前記画像データを処理する後段側の処理から、当該画像データに対応する画像のうち少なくとも1つの部分領域を特定する情報を受け付ける場合、特定された部分領域を対象として特定の前処理を実行する機能と、部分領域を特定する前記情報に、部分領域を対象とする処理の結果の精度が予め定めた閾値よりも低いことを示す情報が含まれる場合、部分領域を特定する前記情報により特定された部分領域に対し、前回までとは異なる内容の前処理を実行する機能と、前記画像データに類似する他の画像データに対する前処理の履歴に基づいて原因を推定する機能と、を実現させるためのプログラムである。
請求項4に記載の発明は、コンピュータに、取得した画像データに対して前処理を実行し、前処理後の前記画像データを処理する後段側の処理から、当該画像データに対応する画像のうち少なくとも1つの部分領域を特定する情報を受け付ける場合、特定された部分領域を対象として特定の前処理を実行する機能と、部分領域を特定する前記情報に、部分領域を対象とする処理の結果の精度が予め定めた閾値よりも低いことを示す情報が含まれる場合、部分領域を特定する前記情報により特定された部分領域に対し、前回までとは異なる内容の前処理を実行する機能と、同種の部分領域間における精度の違いに基づいて原因を推定する機能と、を実現させるためのプログラムである。
請求項2記載の発明によれば、後段における処理の結果の精度を効率的に向上できる。
請求項3記載の発明によれば、後段における処理の結果の精度を効率的に向上できる。
請求項4記載の発明によれば、後段における処理の結果の精度を効率的に向上できる。
<実施の形態>
<システム構成>
図1は、実施の形態で使用する情報処理システム1の構成例を示す図である。
図1に示す情報処理システム1は、画像処理装置10と、画像処理装置10から与えられる画像データに含まれる文字を認識するOCR処理サーバ20と、ネットワーク環境としてのクラウドネットワーク30とを有している。
図1に示す画像処理装置10の本体上部には、光学的に情報を読み取る位置に原稿を1枚ずつ搬送する機構が備え付けられている。この種の機構は、例えばADF(=Auto Document Feeder)と呼ばれる。ADFは、複製する原稿の読み取りやファクシミリ送信する原稿の読み取りに使用される。
複製物の生成には、用紙に文書や画像を印刷する機能も使用される。文書や画像のデータは、画像処理装置10において光学的に読み取られる他、本体に接続された記録媒体や外部の情報端末から与えられる。
画像処理装置10に設ける機能は、前述した機能に限らない。もっとも、本実施の形態の場合、画像処理装置10には、原稿の情報を光学的に読み取って画像データを生成する機能が設けられていれば、他の機能は任意である。
本実施の形態では、手書きの文書として、例えば申込書、請求書、納品書、伝票等の手書き帳票を想定する。手書き帳票では、事前に印刷された枠内に文字が記入される。手書きの文書は、帳票の類いに限らず、連絡用のメモ、回覧用の文書、はがき、封書等でもよい。
本実施の形態における画像処理装置10には、原稿から読み取った画像からノイズや地紋等を除去する機能も用意されている。本実施の形態の場合、ノイズ等を除去した後の画像データがOCR処理サーバ20に送信される。
図1には画像処理装置10を1台のみ表しているが、情報処理システム1を構成する画像処理装置10は複数台でもよい。本実施の形態における画像処理装置10は、情報処理装置の一例である。
この他、本実施の形態におけるOCR処理サーバ20には、OCR処理の結果の確信度に関する情報を部分領域毎に前処理にフィードバックする機能も設けられている。この機能は、OCR処理により得られる文字の認識の結果の確からしさを高める、又は、後処理の結果の品質や精度を高めるために設けられている。
本実施の形態では、OCR処理に特化したOCR処理サーバ20を用いているが、複数の機能に対応する汎用型のサーバを用いてもよい。なお、OCR処理を実行するコンピュータはサーバに限らない。OCR処理を実行するコンピュータは、例えばデスクトップ型のコンピュータやノート型のコンピュータでもよく、スマートフォンやタブレット型の端末でもよい。
本実施の形態の場合、画像処理装置10とOCR処理サーバ20との通信にクラウドネットワーク30を用いているが、クラウドネットワーク30経由の通信に限らない。例えば画像処理装置10とOCR処理サーバ20の通信には、LAN(=Local Area Network)、4Gや5Gと略称される移動通信システムを用いてもよい。
図2は、実施の形態1で使用する画像処理装置10のハードウェア構成の一例を説明する図である。図2に示す画像処理装置10は、装置の全体を制御する制御ユニット11と、画像データ等を記憶する記憶装置12と、原稿を光学的に読み取って画像データを生成する画像読取ユニット13と、階調を変換する処理や色を補正する処理等を画像データに加える画像処理ユニット14と、画像データに応じた画像を用紙に形成する画像形成ユニット15と、ユーザの操作を受け付ける操作受付ユニット16と、ユーザインタフェース画面等が表示される表示ユニット17と、外部との通信に用いられる通信装置18とを有している。制御ユニット11と各部は、バス19や不図示の信号線を通じて接続されている。
記憶装置12は、ハードディスク装置や不揮発性の書き換え可能な半導体メモリ等により構成される。記憶装置12には、例えば画像読取ユニット13で読み取られた画像データ等が記憶される。記憶装置12には、アプリケーションプログラムが格納されてもよい。
ADFにより原稿を読み取り位置に搬送しながら画像を読み取るモードの場合、CISセンサは、読み取り位置に固定された状態で使用される。光が透過するガラス面に原稿を配置した状態で画像を読み取るモードの場合、CISセンサは、原稿に対して相対的に移動するよう制御される。
画像処理ユニット14は、階調を変換する処理や色を補正する処理等を実行するGPU(=Graphics Processing Unit)やFPGA(=Field Programmable Gate Array)等で構成される。
操作受付ユニット16は、表示ユニット17の表示面に配置されるタッチセンサ、物理的なスイッチやボタン等で構成される。
表示ユニット17は、例えば液晶ディスプレイや有機ELディスプレイで構成される。操作受付ユニット16と表示ユニット17を一体化したデバイスは、タッチパネルとも呼ばれる。タッチパネルは、ソフトウェア的に表示されたキー(以下「ソフトキー」とも呼ぶ)に対するユーザの操作の受け付けに使用される。
通信装置18は、有線や無線による通信規格に準拠したモジュールで構成される。通信装置18には、例えばイーサネット(登録商標)モジュール、USB(=Universal Serial Bus)、無線LAN、ファクシミリ用のモデムその他が用いられる。
以下では、画像処理装置10とOCR処理サーバ20の連携により実行される処理について説明する。
<処理の概要>
図3は、実施の形態1で実行される処理の概要を説明する図である。本実施の形態における処理は、5つの処理で構成される。5つの処理は、原稿の画像データを取得する処理と、取得された画像データに対する前処理と、前処理後の画像データに対するOCR処理と、OCR処理の結果であるテキストデータを処理する後処理と、後処理の結果を記憶装置12(図2参照)に格納する処理である。
本実施の形態の場合、OCR処理をOCR処理サーバ20(図1参照)が実行し、その他の4つの処理は画像処理装置10(図1参照)が実行する。
本実施の形態の場合、前処理とOCR処理との間で処理の対象を特定する情報が前処理からOCR処理に通知される。図3の場合は、処理の対象を特定する情報としてファイル名が、前処理後の画像データに付属するデータとして通知されている。本実施の形態の場合、ファイル名は、読み取りの日時や読み取り作業を行ったユーザ名、読み取りに用いた画像処理装置10を区別する情報等で構成される。もっとも、ファイル名を特定する情報は、これらに限らない。
本実施の形態の場合、オブジェクトとして、文字の領域(以下「文字領域」という)、表の領域(以下「表領域」という)、グラフィックスの領域(以下「グラフィックス領域」という)、図の領域(以下「図領域」という)の4つを使用する。
例えば原稿のタイトル、文字、数値が含まれる領域は、文字領域として切り出される。表そのものや表に付属する題名は表領域として切り出される。社名などを図案化した領域は、グラフィックス領域や図領域として切り出される。その他の領域は背景である。個々のオブジェクトは部分領域の一例である。
本実施の形態の場合、前処理からOCR処理には、部分領域単位で前処理後の画像データが送信される。
この他、前処理からOCR処理には、実行された前処理の内容を特定する情報を通知してもよい。前処理の内容は、OCR処理の側で確信度が低い原因を推定する場合に利用が可能である。
本実施の形態の場合、部分領域は、オブジェクトとして切り出された個々の領域の意味で使用する。換言すると、文字領域が複数ある場合には、文字領域毎に異なる情報がフィードバックされる可能性がある。表領域についても同様である。なお、表領域については、行や列単位で異なる情報がフィードバックされる可能性もある。
本実施の形態の場合、前処理からOCR処理には、個々の部分領域を識別する情報が通知されている。従って、OCR処理から前処理へのフィードバックには、個々の部分領域を識別する情報が含まれる。もっとも、OCR処理は、オブジェクトの種類が同じ複数の部分領域を1つの部分領域とみなして確信度を算出し、その確信度が低いことを示す情報を、確信度を算出した複数の部分領域を識別する情報と一緒にフィードバックすることも可能である。
本実施の形態では、部分領域の確信度を、対応する部分領域から抽出された個々の文字について算出される確信度の平均値として求める。ここでの文字には数字や記号も含まれる。平均値は、部分領域毎に異なる重み付けを用いて算出してもよい。例えば文字領域の場合と表領域の場合では異なる重みを用いてもよい。また、同種の部分領域でも、タイトル部分と本文とでは異なる重みを用いてもよい。
部分領域の確信度の評価に使用する閾値は、部分領域が対応するオブジェクトの種類毎に異なっても良いし、同じでもよい。例えば文字領域と表領域では異なる重みを用いて確信度を算出してもよい。
従って、OCR処理は、新たな前処理が加えられた画像データの中から前回のOCR処理で確信度が低かった部分領域だけを選択して確信度の変化を確認することが可能である。また、OCR処理は、閾値より高い確信度が得られたテキストデータだけを選択的に後処理に出力することも可能である。
図4は、実施の形態1における画像処理装置10が実行する処理の一例を説明するフローチャートである。図中に示す記号のSはステップを意味する。図4に示す処理は、プロセッサ11A(図2参照)が実行する。
図4に示す処理は、OCR処理を伴う原稿の読み取りの指示を受け付けることで開始される。画像処理装置10に対する読み取りの指示には、例えばスタートボタンの操作が用いられる。
読み取りの指示では、読み取りの条件又は前提の設定が可能である。例えば読み取りの対象である原稿の種類の指定が可能である。原稿の種類が指定されている場合、原稿の種類に応じて用意されている前処理の内容が、プロセッサ11Aにより選択される。なお、機械学習により原稿の種類と高い確信度が得られる前処理の内容との関係が学習されている場合、プロセッサ11Aは、指定された原稿の種類に対応する前処理の内容を選択する。
もっとも、読み取りの条件又は前提を設定しない読み取りの指示も可能である。この場合には、読み取りにより推定された原稿の種類や原稿の特徴に応じた内容の前処理がプロセッサ11Aにより選択される。また、原稿のタイトルの読み取りが画像処理装置10により可能な場合、読み取られたタイトルに応じた内容の前処理が、プロセッサ11Aにより選択される。
図5は、読み取りの対象である原稿の一例を説明する図である。図5に示す原稿のタイトルは見積書であり、用紙の全体に地紋が付けられている。図5に示す見積書は、2つの表を含む。上段は表Aであり、下段は表Bである。図5に示す表Aと表Bはいずれも3行で構成されている。表Aと表Bの表題が記載される項目名は、いずれも黒色の背景に文字が白抜きで印刷されている。表Aの2行目と3行目は、白色の背景に黒文字が印刷されている。表Bの2行目と3行目は、色付きの背景に文字が印刷されている。文字は、黒文字、白抜き文字、色付き文字のいずれでもよい。なお、背景が網掛けである場合も想定される。
続いて、プロセッサ11Aは、取得した画像データに対して前処理を実行する(ステップ2)。本実施の形態の場合、前処理では、オブジェクトの分離が実行される。オブジェクトの分離には、既知の技術が用いられる。また、予め選択された又は初期設定で定められているクレンジング処理も実行される。
図6は、画像データから分離されるオブジェクトの例を説明する図である。図6の場合、「見積書」、「ABC工業様」、「XYZ商会」、「合計金額 16,000円」の文字列を含む領域が文字領域として画像データから分離される。また、表Aの文字と対応する表、表Bの文字と対応する表を含む領域が表領域として画像データから分離される。また、画像データの右下に配置されたロゴがグラフィックス領域又は図領域として画像データから分離される。
前処理は、オブジェクトの分離の前でも後でもよい。本実施の形態では、前処理の実行後にオブジェクトの分離が実行される。
次に、プロセッサ11Aは、OCR処理サーバ20に対象データを送信する(ステップ3)。本実施の形態の場合、対象データは、文字領域と表領域に対応する画像データである。すなわち、グラフィックス領域及び図領域と判定された部分の画像データは、OCR処理サーバ20に送信されない。
この後、プロセッサ11Aは、OCR処理サーバ20から情報のフィードバックがあるか否かを判定する(ステップ4)。
例えば予め定めた時間内に情報のフィードバックがなかった場合、プロセッサ11Aは、ステップ4で否定結果を得る。本実施の形態の場合、情報のフィードバックがないことは、OCR処理の結果の確信度が全ての部分領域について高いことを意味する。前述したように、本実施の形態では、部分領域を単位として確信度が算出されている。なお、表の全体を単位として確信度を算出してもよいし、表を構成する行や列を単位として確信度を算出してもよい。
次に、プロセッサ11Aは、OCR処理サーバ20から取得したテキストデータを後処理する(ステップ6)。この後、プロセッサ11Aは、記憶装置12に対し、処理結果を格納する(ステップ7)。なお、ステップ5は、ステップ6やステップ7の後に実行してもよい。
本実施の形態の場合、ステップ5~ステップ7の実行中に又はこれらの処理の実行後に、プロセッサ11Aは、画像データの全体又は特定の部分領域に対して直前回に実行した前処理の内容で高い確信度が得られたことを学習する。学習の単位は、後述する確信度が低い場合と同様である。
要求する処理の内容には、例えばクレンジング処理の種類、クレンジング処理の強度、クレンジング処理で使用するパラメータ値が含まれる。クレンジング処理の種類には、例えば地紋や網掛けを除去する処理、汚れを除去する処理、背景の色を除去して白抜き文字や色付き文字を黒色の文字に変換する処理がある。
なお、地紋や網掛け等の除去には、例えば敵対的生成ネットワーク(GAN: Generative Adversarial Networks)と呼ばれる手法を活用する。GANを用いてノイズ等を除去する技術は、既に実用化されているので詳細な説明は省略する。
ステップ10の実行後、プロセッサ11Aは、ステップ3に戻る。本実施の形態の場合、プロセッサ11Aは、ステップ8で特定された部分領域についてのみ前処理後の画像データを対象データとしてOCR処理サーバ20に送信する。このとき、プロセッサ11Aは、再度の前処理が実行された部分領域を特定する情報をOCR処理サーバ20に通知する。
なお、ステップ3でOCR処理サーバ20に送信する対象データには、ステップ8で特定された対象データ以外の他の対象データを含めることも可能である。他の対象データが含まれていても、OCR処理サーバ20は、確信度が低い部分領域に対応する対象データを選択的に抽出することが可能である。
図7は、実施の形態1のステップ11で実行される処理の一例を説明するフローチャートである。図中に示す記号のSはステップを意味する。
ステップ11を開始したプロセッサ11Aは、特定された対象データについて実行済みの前処理の内容を特定する(ステップ111)。同一の原稿の同一の対象データについて既に複数回の前処理が実行されている場合、プロセッサ11Aは、複数回分の前処理の内容を特定する。
次に、プロセッサ11Aは、対象データについて前回までとは異なる内容の前処理を選択する(ステップ112)。本実施の形態の場合、OCR処理サーバ20からは、確信度が閾値よりも低いことを示す情報しかフィードバックされていないためである。
なお、ステップ113では、画像データの全体にステップ112で選択された前処理を実行することも可能である。
次に、プロセッサ11Aは、対象データについて直前回に実行した前処理の内容と確信度に関する情報とを使用して、部分領域と前処理の内容との関係を学習する(ステップ114)。ここでの確信度に関する情報とは、確信度が低いことを示す情報である。
機械学習の成果は、次回以降に実行される前処理の内容の決定に使用される。次回以降に実行される前処理には、フィードバックに伴う前処理の再実行も、新たに読み取った原稿の画像データに対する前処理も含まれる。
強化学習された学習済みモデルに部分領域に対応する画像データが与えられると、ステップ2で使用する前処理の内容が出力される。強化学習の精度が上がることで、やり直しの回数も低減される。また、機械学習された学習済みモデルは、ステップ112における前処理の内容の選択にも応用が可能である。ランダムに前処理の内容を選択する場合に比して、確信度が閾値より高くなる可能性を高めることが可能になる。
ステップ115で否定結果が得られた場合、プロセッサ11Aは、ステップ111に戻り、別の部分領域に対応する対象データについて一連の処理を繰り返す。
一方、ステップ115で肯定結果が得られた場合、プロセッサ11Aは、ステップ3に戻る。
以上の処理は、ステップ10又はステップ11の実行後に実行されるステップ4で否定結果が得られるまで繰り返される。結果的に、画像処理装置10が実行する後処理には、確信度が閾値よりも高いテキストデータが与えられることになり、後処理の結果に対する精度や信頼性の向上が実現される。また、認識されたテキストデータの人手による確認や人手による修正の手間の削減が実現される。
前述の実施の形態では、OCR処理サーバ20から画像処理装置10に対し、要求する前処理の内容が具体的にフィードバックされる場合について説明した。ただし、前処理の内容を具体的に特定するには、OCR処理サーバ20に確信度が低い原因を推定する処理や、推定された原因を解消する処理の内容を特定する処理等に対応する機能が、OCR処理サーバ20側に用意されている必要がある。しかし、OCR処理サーバ20に、同機能が常に備わるとは限らない。
図8に示す処理の場合、OCR処理から前処理にフィードバックされる情報が、実施の形態1と異なっている。
本実施の形態の場合、前処理の内容の変更を要求する情報がフィードバックされている。すなわち、前処理に要求する具体的な処理の内容はフィードバックされていない。
前処理の内容の変更の要求は、確信度が低い部分領域が存在することをトリガーとして出力が可能であり、前述した推定等の処理を必要としない。
本実施の形態の場合、OCR処理サーバ20から画像処理装置10には、前処理の内容の変更を要求する情報しかフィードバックされない。
このため、プロセッサ11Aは、ステップ8の実行後、特定された対象データについて実行すべき前処理の内容を特定して実行する(ステップ21)。
図10は、実施の形態2のステップ21で実行される処理の一例を説明するフローチャートである。図10には、図7との対応部分に対応する符号を付して示す。図中に示す記号のSはステップを意味する。
次に、プロセッサ11Aは、確信度を低下させている原因を推定する(ステップ211)。プロセッサ11Aは、例えばステップ111で取得された実行済みの前処理の内容の履歴を参考に原因を推定する。
なお、画像処理装置10には、処理の対象であるオリジナルの画像データが記憶されている。従って、プロセッサ11Aは、地紋の有無、背景の有無、フォントのサイズ、汚れの有無、折れ筋の有無、背景と文字の色の関係、原稿の種類等の情報を画像データから読み取り、原因の推定に利用する。
画像データ全体の確信度は、例えばステップ3で対象データとして送信された各部分領域の原稿上における面積の割合と各部分領域に対する確信度の高低に基づいて算出が可能である。例えば閾値より高い確信度が得られた部分領域の面積には重みとして「1」を乗算した値と、閾値より低い確信度が得られた部分領域の面積には重みとして「0」を乗算した値の和を算出する。その後、算出された値を、OCR処理の対象になった部分領域の面積の総和で除算して正規化し、正規化された値と閾値の比較により確信度を算出する。例えば正規化した値が閾値より高ければ画像データ全体の確信度が高いと判定し、正規化した値が閾値より低ければ画像データ全体の確信度が低いと判定する。
なお、前処理の内容の変更が求められていない部分領域は確信度が高く、前処理の内容の変更が求められている部分領域は確信度が低いとみなす。
また、類似する又は同種の部分領域について使用された前処理の内容とその確信度に関する情報の履歴が存在する場合には、高い確信度が得られたときの前処理の内容により原因を推定することも可能である。ここで、部分領域が類似する又は同種であるとは、部分領域に対応する画像データの内容が類似する又は同種であることを意味する。もっとも、この場合には、原因を推定する必要自体がなく、高い確信度が得られたときの前処理の内容をステップ212に与えることも可能である。
対応関係のテーブルには、画像データの全体から抽出される特徴や部分領域の特徴の組み合わせと、確信度が低い場合に想定される原因とが記憶されている。もっとも、組み合わせ毎に推奨される前処理の内容が記憶されていてもよい。
また、学習済みモデルを用いる場合、部分領域に対応する画像データを学習済みモデルに対して入力すると、原因が出力される。もっとも、部分領域に対応する画像データを学習済みモデルに対して入力すると、推奨される前処理の内容が出力されるようにしてもよい。
また、判定プログラムを用いる場合、個別の判定による分岐を1又は複数回繰り返すことで、確信度を低下させていると考えられる原因が出力される。この場合も、原因ではなく、推奨される前処理の内容が出力されてもよい。
次に、プロセッサ11Aは、対象データについて直前回に実行した前処理の内容と確信度に関する情報とを使用して、部分領域と前処理の内容との関係を学習する(ステップ213)。
本実施の形態の場合、確信度に関する情報は、OCR処理サーバ20から直接的には通知されない。このため、プロセッサ11Aが確信度に関する情報を部分領域毎に判断する。前述したように、前処理の内容の変更が求められていない部分領域の確信度は高いと判断される一方、前処理の内容の変更が求められている部分領域の確信度は低いと判断される。
ステップ115で否定結果が得られた場合、プロセッサ11Aは、ステップ111に戻り、別の部分領域に対応する対象データについて一連の処理を繰り返す。
一方、ステップ115で肯定結果が得られた場合、プロセッサ11Aは、ステップ3に戻る。
以上の処理は、ステップ4で否定結果が得られるまで繰り返される。結果的に、画像処理装置10が実行する後処理には、確信度が閾値よりも高いテキストデータが与えられることになり、後処理の結果に対する精度や信頼性の向上が実現される。また、認識されたテキストデータの人手による確認や人手による修正の手間の削減が実現される。
この場合には、確信度を低下させている原因が解消するとは限らないが、前処理の内容の変更を繰り返すうちに確信度の低下の解消が期待される。なお、プロセス上の繰り返し回数は図10に示す処理に比して増えても、推定等の処理が不要になる分、計算資源に対する負荷は少なく済む。
図11は、実施の形態3で実行される処理の概要を説明する図である。図11には、図8との対応部分に対応する符号を付して示している。
本実施の形態の場合、OCR処理から前処理にフィードバックされる情報の一部が、実施の形態1と異なっている。具体的には、OCR処理した結果の確信度そのものがフィードバックされている。確信度の送信は、確信度が低い場合と確信度が高い場合の両方で実行される。
図12は、実施の形態3における画像処理装置10が実行する処理の一例を説明するフローチャートである。図12には、図9との対応部分に対応する符号を付して示す。図中に示す記号のSはステップを意味する。
このため、プロセッサ11Aは、ステップ3の実行後に、確信度はいずれも閾値以上であるか否かを判定する(ステップ31)。ここでの閾値は、オブジェクトの違いによらず同じ値でもよいし、オブジェクト毎に異なる値でもよい。
ステップ31で肯定結果が得られた場合、プロセッサ11Aは、ステップ5に移行する。OCR処理サーバ20に送信した対象データの全てについて閾値よりも高い確信度が得られた場合には、前処理をやり直す必要が無いためである。
図13は、実施の形態3のステップ32で実行される処理の一例を説明するフローチャートである。
まず、プロセッサ11Aは、確信度が低い対象データについて実行済みの前処理の内容を特定する(ステップ321)。
次に、プロセッサ11Aは、確信度が低い対象データについて前回までとは異なる内容の前処理を選択する(ステップ322)。もっとも、実施の形態2の場合と同様に、確信度を低下させている原因を推定し、推定された原因を解消する内容の前処理を選択してもよい。この例については後述する。
続いて、プロセッサ11Aは、対象データについて直前回に実行した前処理の内容と確信度に関する情報とを使用して、部分領域と前処理の内容との関係を学習する(ステップ324)。本実施の形態の場合、確信度が低い場合だけでなく、確信度が高いと判定された対象データについても、部分領域と前処理の内容との関係が学習される。もっとも、いずれか一方だけを学習することも可能である。
処理が終了すると、プロセッサ11Aは、ステップ3に戻る。以上の処理は、ステップ31で肯定結果が得られるまで繰り返される。
結果的に、画像処理装置10が実行する後処理には、確信度が閾値よりも高いテキストデータが与えられることになり、後処理の結果に対する精度や信頼性の向上が実現される。また、認識されたテキストデータの人手による確認や人手による修正の手間の削減が実現される。
図14に示す処理では、複数の確信度の組み合わせを使用する。
まず、プロセッサ11Aは、確信度の組み合わせを使用し、確信度を低下させている原因を推定する(ステップ325)。確信度の組み合わせは、オブジェクトの種類が共通する複数の部分領域について取得された複数の確信度の組み合わせでもよいし、部分領域を構成する行又は列単位の確信度の組み合わせでもよい。また、処理の対象である画像データを単位として統合された複数の確信度の組み合わせでもよい。
図15に示す例は、図5における表A又は表Bを想定している。このため、行数は3行である。図15の場合、1つの表領域についての確信度の組み合わせは8個である。図15では、これらを、組み合わせ1~8で表している。組み合わせの数は、表領域を構成する行数や1つの表領域について通知される確信度の数に依存する。
なお、図15の組み合わせ1~8に対応する各行の背景色のように、表Aや表Bの背景色が偶数行と奇数行とで異なる場合には、行数が増えても奇数行と偶数行を単位として確信度を算出してもよい。
組み合わせ2は、1行目と2行目に対応する各確信度が閾値より高いが、3行目に対応する確信度が閾値よりも低い場合である。この場合、確信度を低下させる原因として、値のセルが色背景であることが推定される。
組み合わせ3は、1行目と3行目に対応する各確信度が閾値より高いが、2行目に対応する確信度が閾値よりも低い場合である。この場合も、確信度を低下させる原因として、値のセルが色背景であることが推定される。
組み合わせ5は、2行目と3行目に対応する各確信度が閾値より高いが、1行目に対応する確信度が閾値よりも低い場合である。この場合、確信度を低下させる原因として、項目名のセルが白抜き文字であることが推定される。
組み合わせ6は、2行目に対応する確信度が閾値より高いが、1行目と3行目に対応する各確信度が閾値よりも低い場合である。この場合、確信度を低下させる原因として、項目名のセルが白抜き文字であり、かつ、値のセルが色背景であることが推定される。
組み合わせ8は、1行目~3行目に対応する各確信度が閾値より低い場合である。この場合、確信度を低下させる原因として、全面が地紋又は全面が色背景であり、かつ、各文字が色文字等であることが推定される。
なお、以上の推定は、原稿本来の画像上の特徴に着目している。このため、汚れや折り筋等の影響による確信度の低下の推定には、別の情報も必要になる。例えば原稿単位での確信度やオリジナルの画像データの情報が必要である。
ステップ325で原因が推定されると、プロセッサ11Aは、推定された原因を解消する内容の前処理を、対象データについて実行する(ステップ326)。
次に、プロセッサ11Aは、対象データについて直前回に実行した前処理の内容と確信度に関する情報とを使用して、部分領域と前処理の内容との関係を学習する(ステップ324)。本実施の形態の場合、確信度が低い対象データと実行された前処理の内容との関係と、確信度が高い対象データと実行された前処理の内容との関係の両方が学習される。もっとも、いずれか一方だけを学習することも可能である。
処理が終了した以降の処理の内容は、図12について説明した通りである。
図16は、実施の形態4で実行される処理の概要を説明する図である。図16には、図11との対応部分に対応する符号を付して示している。
本実施の形態の場合、確信度ではなく推定された原因が、OCR処理から前処理にフィードバックされる。この場合、実施の形態3で実行された推定がOCR処理サーバ20側で実行される。
図17は、実施の形態4における画像処理装置10が実行する処理の一例を説明するフローチャートである。図17には、図12との対応部分に対応する符号を付して示す。図中に示す記号のSはステップを意味する。
原因がフィードバックされるのは、対象データ中に確信度が低い部分領域が存在する場合に限られる。このため、ステップ41で否定結果が得られた場合、プロセッサ11Aは、ステップ5に移行し、以下、図12の場合と同様の処理を実行する。
これに対し、ステップ41で肯定結果が得られた場合、プロセッサ11Aは、実行すべき前処理の内容を特定して実行する(ステップ42)。
まず、プロセッサ11Aは、通知された原因を解消する内容の前処理を、対象データについて実行する(ステップ421)。
図19は、通知される原因の一例を説明する図である。
図19に示す原因1~原因5は、図15に示す原因に対応している。原因1は、値のセルが色背景であることを示す。原因2は、値のセルが色背景であることを示す。原因3は、項目名のセルが白抜き文字であることを示す。原因4は、項目名のセルが白抜き文字であり、かつ、値のセルが色背景であることを示す。原因5は、全面が地紋又は全面が色背景であり、かつ、各文字が色文字等であることを示す。なお、汚れや折れ筋等が原因として通知される可能性もある。
原因に応じた前処理が対象データについて実行されると、プロセッサ11Aは、対象データについて直前回に実行した前処理の内容と確信度に関する情報とを使用して、部分領域と前処理の内容との関係を学習する(ステップ422)。
因みに、原因が通知されたということは、対応する部分領域の確信度が閾値よりも低いことを意味し、反対に原因が通知されないということは、対応する部分領域の確信度が閾値よりも高いことを意味する。そこで、プロセッサ11Aは、原因が通知されたか否かにより確信度の高低を特定する。
処理が終了した以降の処理の内容は、図12について説明した通りである。
図20は、実施の形態5で実行される処理の概要を説明する図である。図20には、図3との対応部分に対応する符号を付して示している。
本実施の形態の場合、後処理から前処理への後処理の完了のフィードバックが追加される点で実施の形態1と相違する。
図21は、実施の形態5における画像処理装置10が実行する処理の一例を説明するフローチャートである。図21には、図4との対応部分に対応する符号を付して示す。
本実施の形態の場合、ステップ4で否定結果が得られた場合、プロセッサ11Aは、ステップ5ではなく、ステップ6及び7を順番に実行する。すなわち、ステップ4で否定結果が得られた場合には、プロセッサ11Aは、OCR処理サーバ20から取得されるテキストデータに基づいて後処理を実行し、その処理結果を記憶装置12に格納する。
本実施の形態では、ステップ7の実行後に、後処理の完了の通知を受信する(ステップ51)。この通知の受信後に、プロセッサ11Aは、画像データを消去する(ステップ5)。後処理の完了の通知を確認した後に画像データを消去するので、画像データの消去後に画像データが要求されることがない。
なお、本実施の形態では、後処理の完了のフィードバックを実施の形態1に追加しているが、実施の形態2~4のいずれに追加してもよい。
図22は、実施の形態6で実行される処理の概要を説明する図である。図22には、図3との対応部分に対応する符号を付して示している。
本実施の形態の場合、格納の完了が前処理にフィードバックされる機能が追加される点で実施の形態1と相違する。
図23は、実施の形態6における画像処理装置10が実行する処理の一例を説明するフローチャートである。図23には、図4との対応部分に対応する符号を付して示す。
本実施の形態の場合、ステップ4で否定結果が得られた場合、プロセッサ11Aは、ステップ5ではなく、ステップ6及び7を順番に実行する。すなわち、ステップ4で否定結果が得られた場合には、プロセッサ11Aは、OCR処理サーバ20から取得されるテキストデータに基づいて後処理を実行し、その処理結果を記憶装置12に格納する。
本実施の形態では、ステップ7の実行後に、処理結果の格納の完了の通知を受信する(ステップ61)。この通知の受信後に、プロセッサ11Aは、画像データを消去する(ステップ5)。処理結果の格納後に画像データを消去するので、画像データの消去後に画像データが要求されることがない。
なお、本実施の形態では、処理結果の格納の完了のフィードバックを実施の形態1に追加しているが、実施の形態2~4のいずれに追加してもよい。
図24は、実施の形態7における画像処理装置10が実行する処理の一例を説明するフローチャートである。図24には、図4との対応部分に対応する符号を付して示す。
図4に示すフローチャートの場合には、ステップ10又はステップ11において、前処理の内容だけをやり直す場合について説明した。
しかし、図24に示すように、再度の前処理の実行時にはオブジェクトの分離からやり直してもよい。図24では、オブジェクトの分離のやり直しを含むステップ10及び11をステップ10A及び11Aと示している。
なお、前述した他の実施の形態においても、再度の前処理の実行の際にオブジェクトの分離をやり直してもよい。
図25は、実施の形態8で実行される処理の概要を説明する図である。図25には、図3との対応部分に対応する符号を付して示している。
前述の実施の形態の場合には、OCR処理が前処理に対してフィードバックを実行しているが、本実施の形態の場合、OCR処理が原稿の画像データを取得する処理にフィードバックを実行する。
例えば原稿に印字された又は記入された文字のサイズに対して画像データの取得時に使用した解像度が小さい場合、OCR処理の結果の確信度は低下する可能性がある。解像度の不一致が確信度の低下の原因である場合、前処理の内容を変更しても確信度は改善しない。
そこで、本実施の形態では、OCR処理の対象である画像データに含まれるフォントのサイズが確信度の低い原因と考えられる場合、画像データの解像度の変更が原稿の画像データを取得する処理にフィードバックされる。図25の例では、200dpiから600dpiへの変更が指示されている。なお、フォントサイズの大きさを検知する技術は既知である。
本実施の形態で説明したフィードバックは、前述した実施の形態のいずれとも組み合わせが可能である。
以上、本発明の実施の形態について説明したが、本発明の技術的範囲は前述した実施の形態に記載の範囲に限定されない。前述した実施の形態に、種々の変更又は改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。
また、前処理とその後段側の処理の組み合わせは、クレンジング処理とOCR処理の組み合わせに限らない。例えば前処理は顔認識のための特徴量の抽出であり、後段側の処理は抽出された特徴量を使用した顔認識であってもよい。この場合、確信度は、顔認識された結果の精度を表す情報等となる。このように、前述の実施の形態では、OCR処理の実行を前提として前処理の内容を説明しているが、前処理とその後段側の処理の組み合わせは任意で良い。
(3)前述の実施の形態においては、OCR処理サーバ20に与える画像データに前処理を加える装置の一例として、原稿を光学的に読み取って画像データを生成する機能その他を含む画像処理装置10を例示したが、画像処理装置10として、原稿に対応する画像データの取り込みに特化したイメージスキャナを用いてもよい。イメージスキャナには、ADF(=Auto Document Feeder)が設けられていてもよい。
また、OCR処理サーバ20に与える画像データに前処理を加える装置には、原稿の撮像に用いるスマートフォンやデジタルカメラの他、外部から原稿を撮像した画像データを取得するコンピュータを用いてもよい。ここでのコンピュータは、前処理とOCR処理後のデータの後処理等に用いられ、原稿の画像を撮像する機能や原稿の情報を光学的に読み取る機能は有しなくてもよい。
(6)前述の実施の形態においては、OCR処理により得られたテキストデータを処理する後処理を、前処理を実行した画像処理装置10が引き継ぐ場合を説明したが、OCR処理により得られたテキストデータを、前処理を実行した画像処理装置10とは異なる処理装置に出力してもよい。
また、前述した各実施の形態におけるプロセッサの動作は、1つのプロセッサが単独で実行してもよいが、物理的に離れた位置に存在する複数のプロセッサが協働して実行してもよい。また、プロセッサにおける各動作の実行の順序は、前述した各実施の形態に記載した順序のみに限定されるものでなく、個別に変更してもよい。
Claims (4)
- プロセッサを有し、
前記プロセッサは、
取得した画像データに対して前処理を実行し、
前処理後の前記画像データを処理する後段側の処理から、当該画像データに対応する画像のうち少なくとも1つの部分領域を特定する情報を受け付ける場合、特定された部分領域を対象として特定の前処理を実行する、
情報処理装置であり、
前記プロセッサは、部分領域を特定する前記情報に、部分領域を対象とする処理の結果の精度が予め定めた閾値よりも低いことを示す情報が含まれる場合、部分領域を特定する前記情報により特定された部分領域に対し、前回までとは異なる内容の前処理を実行し、
前記プロセッサは、前記画像データに類似する他の画像データに対する前処理の履歴に基づいて原因を推定する、情報処理装置。 - プロセッサを有し、
前記プロセッサは、
取得した画像データに対して前処理を実行し、
前処理後の前記画像データを処理する後段側の処理から、当該画像データに対応する画像のうち少なくとも1つの部分領域を特定する情報を受け付ける場合、特定された部分領域を対象として特定の前処理を実行する、
情報処理装置であり、
前記プロセッサは、部分領域を特定する前記情報に、部分領域を対象とする処理の結果の精度が予め定めた閾値よりも低いことを示す情報が含まれる場合、部分領域を特定する前記情報により特定された部分領域に対し、前回までとは異なる内容の前処理を実行し、
前記プロセッサは、同種の部分領域間における精度の違いに基づいて原因を推定する、情報処理装置。 - コンピュータに、
取得した画像データに対して前処理を実行し、
前処理後の前記画像データを処理する後段側の処理から、当該画像データに対応する画像のうち少なくとも1つの部分領域を特定する情報を受け付ける場合、特定された部分領域を対象として特定の前処理を実行する機能と、
部分領域を特定する前記情報に、部分領域を対象とする処理の結果の精度が予め定めた閾値よりも低いことを示す情報が含まれる場合、部分領域を特定する前記情報により特定された部分領域に対し、前回までとは異なる内容の前処理を実行する機能と、
前記画像データに類似する他の画像データに対する前処理の履歴に基づいて原因を推定する機能と、
を実現させるためのプログラム。 - コンピュータに、
取得した画像データに対して前処理を実行し、
前処理後の前記画像データを処理する後段側の処理から、当該画像データに対応する画像のうち少なくとも1つの部分領域を特定する情報を受け付ける場合、特定された部分領域を対象として特定の前処理を実行する機能と、
部分領域を特定する前記情報に、部分領域を対象とする処理の結果の精度が予め定めた閾値よりも低いことを示す情報が含まれる場合、部分領域を特定する前記情報により特定された部分領域に対し、前回までとは異なる内容の前処理を実行する機能と、
同種の部分領域間における精度の違いに基づいて原因を推定する機能と、
を実現させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020021691A JP7452059B2 (ja) | 2020-02-12 | 2020-02-12 | 情報処理装置及びプログラム |
US16/910,086 US11238305B2 (en) | 2020-02-12 | 2020-06-24 | Information processing apparatus and non-transitory computer readable medium storing program |
CN202010756418.0A CN113255673A (zh) | 2020-02-12 | 2020-07-31 | 信息处理装置、记录介质及信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020021691A JP7452059B2 (ja) | 2020-02-12 | 2020-02-12 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021128443A JP2021128443A (ja) | 2021-09-02 |
JP7452059B2 true JP7452059B2 (ja) | 2024-03-19 |
Family
ID=77178388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020021691A Active JP7452059B2 (ja) | 2020-02-12 | 2020-02-12 | 情報処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11238305B2 (ja) |
JP (1) | JP7452059B2 (ja) |
CN (1) | CN113255673A (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007086954A (ja) | 2005-09-21 | 2007-04-05 | Fuji Xerox Co Ltd | 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム |
JP2010123090A (ja) | 2008-11-23 | 2010-06-03 | Nidec Sankyo Corp | 文字列認識方法及び文字列認識装置 |
JP2013073439A (ja) | 2011-09-28 | 2013-04-22 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識方法 |
WO2017141802A1 (ja) | 2016-02-15 | 2017-08-24 | 日本電気株式会社 | 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10240868A (ja) * | 1997-02-27 | 1998-09-11 | Oki Electric Ind Co Ltd | 文字読取装置 |
US9098888B1 (en) * | 2013-12-12 | 2015-08-04 | A9.Com, Inc. | Collaborative text detection and recognition |
JP6528147B2 (ja) | 2014-01-31 | 2019-06-12 | 株式会社日本デジタル研究所 | 会計データ入力支援システム、方法およびプログラム |
US10776434B1 (en) * | 2016-11-16 | 2020-09-15 | First American Financial Corporation | System and method for document data extraction, data indexing, data searching and data filtering |
-
2020
- 2020-02-12 JP JP2020021691A patent/JP7452059B2/ja active Active
- 2020-06-24 US US16/910,086 patent/US11238305B2/en active Active
- 2020-07-31 CN CN202010756418.0A patent/CN113255673A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007086954A (ja) | 2005-09-21 | 2007-04-05 | Fuji Xerox Co Ltd | 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム |
JP2010123090A (ja) | 2008-11-23 | 2010-06-03 | Nidec Sankyo Corp | 文字列認識方法及び文字列認識装置 |
JP2013073439A (ja) | 2011-09-28 | 2013-04-22 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識方法 |
WO2017141802A1 (ja) | 2016-02-15 | 2017-08-24 | 日本電気株式会社 | 画像処理装置、文字認識装置、画像処理方法及びプログラム記録媒体 |
Non-Patent Citations (2)
Title |
---|
Keiji YAMADA,Feedback Pattern Recognition by Inverse Recall Neural Network Model,Proceedings of 2nd International Conference on Document Analysis and Recognition (ICDAR '93),IEEE,1993年,P.254-257,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=395737 |
丹羽 寿男,パターンと記号の統合化処理による文字認識,電子情報通信学会論文誌 D-II,日本,社団法人電子情報通信学会,1995年02月25日,Vol.J78-D-II No.2,P.263-271 |
Also Published As
Publication number | Publication date |
---|---|
CN113255673A (zh) | 2021-08-13 |
US11238305B2 (en) | 2022-02-01 |
JP2021128443A (ja) | 2021-09-02 |
US20210248411A1 (en) | 2021-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11574489B2 (en) | Image processing system, image processing method, and storage medium | |
US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
US20080246975A1 (en) | Handwritten annotation recognition for copy jobs | |
US12022043B2 (en) | Image processing device and image forming apparatus capable of detecting and correcting mis-converted character in text extracted from document image | |
US20170142274A1 (en) | Information processing device, image processing system and non-transitory computer readable medium storing program | |
US8606049B2 (en) | Image management apparatus, image management method, and storage medium | |
US11797857B2 (en) | Image processing system, image processing method, and storage medium | |
US11223743B2 (en) | Image processing system, image processing apparatus, method of controlling the image processing apparatus, and storage medium | |
US20180270387A1 (en) | Printing apparatus, server, printing method, and control method | |
JP7452059B2 (ja) | 情報処理装置及びプログラム | |
US10863039B2 (en) | Information processing apparatus that outputs parameter on basis of learning result | |
US20220180114A1 (en) | Image processing apparatus capable of restoring degraded image with high accuracy, image processing method, and storage medium | |
US12113938B2 (en) | Image processing system, image processing apparatus, control method | |
US11170211B2 (en) | Information processing apparatus for extracting portions filled with characters from completed document without user intervention and non-transitory computer readable medium | |
JP7452060B2 (ja) | 情報処理装置及びプログラム | |
JP2014199507A (ja) | 画像処理装置およびコンピュータプログラム | |
US11811984B2 (en) | Image processing system, image processing apparatus and method of controlling the same, and storage medium | |
US20240346842A1 (en) | Scanning system, non-transitory computer-readable storage medium storing scanning program, and method for producing output matter | |
US20240106938A1 (en) | Information processing system, method, and non-transitory computer readable medium | |
US11659106B2 (en) | Information processing apparatus, non-transitory computer readable medium, and character recognition system | |
US11635305B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20240345803A1 (en) | Data processing system, non-transitory computer-readable storage medium storing data processing program, and method for producing output matter | |
US20240346841A1 (en) | Scanning system, non-transitory computer-readable storage medium storing scanning program, and method for producing output matter | |
US11093191B2 (en) | Information processing apparatus and non-transitory computer readable medium capable of extracting a job flow without use of attribute information included in job entries | |
US20230101897A1 (en) | Information processing apparatus, information processing system, and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7452059 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |