JP7337612B2 - 画像処理装置、画像処理システム、画像処理方法、及びプログラム - Google Patents
画像処理装置、画像処理システム、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7337612B2 JP7337612B2 JP2019164605A JP2019164605A JP7337612B2 JP 7337612 B2 JP7337612 B2 JP 7337612B2 JP 2019164605 A JP2019164605 A JP 2019164605A JP 2019164605 A JP2019164605 A JP 2019164605A JP 7337612 B2 JP7337612 B2 JP 7337612B2
- Authority
- JP
- Japan
- Prior art keywords
- character information
- area
- image
- image processing
- handwritten
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00681—Detecting the presence, position or size of a sheet or correcting its position before scanning
- H04N1/00763—Action taken as a result of detection
- H04N1/00774—Adjusting or controlling
- H04N1/00782—Initiating operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
[システム構成]
図1は、画像形成システムの構成の一例を表す図である。画像処理システム100は、画像形成装置101、102と、PC103、104と、画像処理サーバ105とを有する。画像形成装置101、102と、PC103、104と、画像処理サーバ105とは、相互に通信可能になるようにネットワーク106に接続されている。
図2は、画像形成装置101のハードウェア構成の一例を表す図である。画像形成装置101は、コントローラ201、プリンタ202、スキャナ203、および操作部204を有する。
図5は画像形成装置101の機能構成を説明するための図である。画像形成装置101は、画像読取部501、画像印刷部502、アプリケーション取得部503、アプリケーション実行部504、抽出情報送信部505、および情報抽出アプリケーション510を有する。
図6は画像処理サーバ105の機能構成を説明するための図である。画像処理サーバは、画像データ取得部621、文字情報抽出部622、情報抽出アプリケーション生成部623、アプリケーション送信部624、およびフォーマット登録部625を有する。
図7は、本実施形態の画像処理システム100全体の処理フローを説明するシーケンス図である。図7を用いて、スキャンした原稿の画像データから文字情報を抽出する一連の処理を説明する。
図8は、S712における文字情報抽出処理の処理対象となる画像等を説明するための図である。図8(a)は、画像読取部501が原稿を読み取り、画像処理サーバ105に送信される画像データを示す入力画像801の一例である。入力画像801は、項目等が予め印刷されており、その上に手書きで情報が書き込まれた帳票が画像形成装置101のスキャナ203によって読み取られることによって得られた画像である。
図9(b)は、画像処理サーバ105によって実行されるアプリケーションデータ生成処理(S714)の詳細フローを説明する図である。
図12は、画像形成装置101が行うアプリケーション実行処理(S704)の詳細を説明するためのフローチャートである。アプリケーション実行処理では、OCR処理された結果得られた文字情報を結合する。そして、結合された文字情報と項目リスト803の項目とを関連付けて、PC103、104等の画像処理システム100の他の装置に送信するためのデータが生成される。
上記の説明では、結合候補領域の選定方法については、ユーザが指定した手書文字領域1312と縦方向が近い位置にある他の文字情報領域を選定していた。他にも、文字情報領域表示選定部517は、ユーザが指定した手書文字領域1312と隣接する文字情報領域のみを結合候補領域として選定してもよい。
結合候補領域の選定方法については、処理対象の項目およびOCR結果1106に保持されている文字情報に基づき選定されてもよい。
結合候補領域の選定方法については、入力画像801から認識される表構造に基づき、表構造の同じセル内(矩形枠内)にある文字情報領域を、結合候補領域として選定する方法でもよい。
上述の実施形態では、画像処理サーバ105が文字認識処理(OCR処理)を行ったが、文字情報抽出部622の機能を有している画像形成装置101が文字認識処理を行ってもよい。
503 アプリケーション取得部
514 文字情報領域表示部
519 入力受付部
517 文字情報領域表示選定部
518 文字情報結合部
Claims (17)
- 手書き文字と印刷文字とが含まれる原稿を読み取ることによって得られた画像データに対してOCR処理をすることによって得られた情報を取得する取得手段と、
前記画像データが示す画像における文字情報を含む領域である文字情報領域のうち、前記手書き文字が含まれる文字情報領域を強調して表示させる表示制御手段と、
前記手書きの文字情報領域のうち、ユーザが指定した手書きの文字情報領域を受け付ける受付手段と、
ユーザが指定した前記手書きの文字情報領域と結合する他の文字情報領域である結合候補領域を選定する選定手段と、
ユーザが指定した前記手書きの文字情報領域における文字情報と、前記結合候補領域における文字情報と、を結合する結合手段と、
を有することを特徴とする画像処理装置。 - 前記結合手段は、
ユーザが指定した前記手書きの文字情報領域における文字情報と、前記結合候補領域のうち、ユーザが指定した前記結合候補領域における文字情報とを結合する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記選定手段は、
前記結合候補領域として、ユーザが指定した前記手書きの文字情報領域の前記画像データが示す画像における縦方向の位置が所定の範囲内にある前記文字情報領域を選定する
ことを特徴とする請求項1または2に記載の画像処理装置。 - 前記選定手段は、
前記結合候補領域として、ユーザが指定した前記手書きの文字情報領域の隣にある前記文字情報領域を選定する
ことを特徴とする請求項1または2に記載の画像処理装置。 - 前記選定手段は、
ユーザが前記結合候補領域の何れかを指定した場合、ユーザが指定した前記結合候補領域の隣にある前記文字情報領域を、さらに前記結合候補領域として選定する
ことを特徴とする請求項4に記載の画像処理装置。 - 前記選定手段は、
前記画像データが示す画像に含まれる、矩形の集合として表される表構造の検出を行い、
ユーザが指定した前記手書きの文字情報領域が、前記表構造を構成する何れかの矩形枠の中にある場合、前記矩形枠の中にある他の文字情報領域を前記結合候補領域として選定する
ことを特徴とする請求項1または2に記載の画像処理装置。 - 前記選定手段は、
ユーザが指定した項目における前記結合候補領域の選定をする場合、前記項目に関係する文字情報が含まれる前記文字情報領域を、前記結合候補領域として選定する
ことを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。 - 前記結合手段は、前記結合をユーザが指定した項目ごとに行い、
前記結合手段が文字情報を前記結合することによって得られた文字情報は、前記項目と関連づけてユーザの指定した装置に送信される
ことを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。 - 前記表示制御手段は、
表示手段に、ユーザが指定することができる領域が強調されるように前記画像データが示す画像を表示させる
ことを特徴とする請求項1から8のいずれか1項に記載の画像処理装置。 - 前記表示制御手段は、
表示手段に、前記結合候補領域が強調されるように前記画像データが示す画像を表示させる
ことを特徴とする請求項1から9のいずれか1項に記載の画像処理装置。 - 前記表示制御手段は、
前記結合手段が文字情報を結合した場合、結合された文字情報を表示させる
ことを特徴とする請求項1から10のいずれか1項に記載の画像処理装置。 - 前記取得手段は、
前記文字情報領域の位置情報と、前記文字情報領域に含まれる文字情報と、前記文字情報領域が手書き文字の文字情報領域であるかを示す情報と、を含む情報を取得する
ことを特徴とする請求項1から11のいずれか1項に記載の画像処理装置。 - 請求項1から12のいずれか1項に記載の画像処理装置と画像処理サーバとを有する画像処理システムであって、
前記画像処理サーバは、
手書き文字を含まない第1の原稿の画像データである未記入画像データと、前記第1の原稿に手書きがされている第2の原稿を読み取ることによって得られた記入画像データと、を取得する画像データ取得手段と、
前記未記入画像データと前記記入画像データとの画素値の差分をとって差分画像の画像データを生成する生成手段と、
前記差分画像と、前記未記入画像データが示す画像とのそれぞれにおける文字情報が含まれる領域である文字情報領域を抽出する抽出手段と、
前記差分画像から抽出された文字情報領域については、前記手書き文字を示す分類に分類する分類手段と、
前記文字情報領域に含まれる文字情報を認識する文字認識手段と、
前記文字情報領域の位置情報と、前記文字情報領域から認識された文字情報と、前記文字情報領域が手書き文字の文字情報領域であるかを示す情報とをそれぞれ関連付けて管理する管理手段と、を有する
ことを特徴とする画像処理システム。 - 前記画像処理サーバは、
前記文字情報領域の位置情報と、前記文字情報領域から認識された文字情報と、前記文字情報領域が手書き文字の文字情報領域であるかを示す情報と、をそれぞれ関連付けて保持しているテーブルによって管理する
ことを特徴とする請求項13に記載の画像処理システム。 - 前記画像処理装置の前記取得手段は、
前記画像処理サーバから、前記テーブルを取得する
ことを特徴とする請求項14に記載の画像処理システム。 - 手書き文字と印刷文字とが含まれる原稿を読み取ることによって得られた画像データに対してOCR処理をすることによって得られた情報を取得する取得ステップと、
前記画像データが示す画像における文字情報を含む領域である文字情報領域のうち、前記手書き文字が含まれる文字情報領域を強調して表示する表示制御ステップと、
表示された前記手書きの文字情報領域のうち、ユーザが指定した手書きの文字情報領域を受け付ける受付ステップと、
ユーザが指定した前記手書きの文字情報領域と結合する他の文字情報領域を選定する選定ステップと、
ユーザが指定した前記手書きの文字情報領域における文字情報と、前記選定ステップにおいて選定された文字情報領域における文字情報と、を結合する結合ステップと、
を含むことを特徴とする画像処理方法。 - コンピュータを、請求項1から12のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019164605A JP7337612B2 (ja) | 2019-09-10 | 2019-09-10 | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
US17/014,190 US11418658B2 (en) | 2019-09-10 | 2020-09-08 | Image processing apparatus, image processing system, image processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019164605A JP7337612B2 (ja) | 2019-09-10 | 2019-09-10 | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021043650A JP2021043650A (ja) | 2021-03-18 |
JP7337612B2 true JP7337612B2 (ja) | 2023-09-04 |
Family
ID=74851444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019164605A Active JP7337612B2 (ja) | 2019-09-10 | 2019-09-10 | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11418658B2 (ja) |
JP (1) | JP7337612B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022047839A (ja) * | 2020-09-14 | 2022-03-25 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
JP2022092119A (ja) * | 2020-12-10 | 2022-06-22 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
JP2022148922A (ja) * | 2021-03-24 | 2022-10-06 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
WO2023181149A1 (ja) * | 2022-03-23 | 2023-09-28 | 日本電気株式会社 | 文字認識システム、文字認識方法および記録媒体 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001061061A (ja) | 1999-08-23 | 2001-03-06 | Minolta Co Ltd | 画像処理装置 |
JP2010262584A (ja) | 2009-05-11 | 2010-11-18 | Ricoh Co Ltd | 情報処理装置、情報処理システム、情報処理方法およびプログラム |
JP2014235694A (ja) | 2013-06-05 | 2014-12-15 | 株式会社日立情報通信エンジニアリング | 帳票処理装置、帳票処理方法、帳票処理プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3725635B2 (ja) * | 1996-10-24 | 2005-12-14 | 株式会社リコー | 文字認識方法及び装置 |
JP2006092346A (ja) | 2004-09-24 | 2006-04-06 | Fuji Xerox Co Ltd | 文字認識装置、文字認識方法および文字認識プログラム |
US8731339B2 (en) * | 2012-01-20 | 2014-05-20 | Elwha Llc | Autogenerating video from text |
-
2019
- 2019-09-10 JP JP2019164605A patent/JP7337612B2/ja active Active
-
2020
- 2020-09-08 US US17/014,190 patent/US11418658B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001061061A (ja) | 1999-08-23 | 2001-03-06 | Minolta Co Ltd | 画像処理装置 |
JP2010262584A (ja) | 2009-05-11 | 2010-11-18 | Ricoh Co Ltd | 情報処理装置、情報処理システム、情報処理方法およびプログラム |
JP2014235694A (ja) | 2013-06-05 | 2014-12-15 | 株式会社日立情報通信エンジニアリング | 帳票処理装置、帳票処理方法、帳票処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021043650A (ja) | 2021-03-18 |
US11418658B2 (en) | 2022-08-16 |
US20210075919A1 (en) | 2021-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7337612B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US8508756B2 (en) | Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions | |
JP5247601B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP7255121B2 (ja) | レシート処理装置及びレポートの生産方法 | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
US8144988B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
JP4557765B2 (ja) | 画像処理装置およびその方法 | |
US20150169510A1 (en) | Method and system of extracting structured data from a document | |
CN102883085B (zh) | 图像处理装置和图像处理方法 | |
JP2022092119A (ja) | 画像処理装置、画像処理方法およびプログラム | |
US9860398B2 (en) | Information processing apparatus that creates other documents from read document | |
JP5089524B2 (ja) | 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム | |
JP7379876B2 (ja) | 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム | |
JP2003046746A (ja) | 画像処理方法及び画像処理装置 | |
JP7570843B2 (ja) | 画像処理装置、画像形成システム、画像処理方法、およびプログラム | |
JP5935376B2 (ja) | 複写装置 | |
JP4741363B2 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
US20110135162A1 (en) | Image processing apparatus, image processing method and recording medium | |
JP4501731B2 (ja) | 画像処理装置 | |
US20240144563A1 (en) | Printed matter production system and non-transitory computer-readable storage medium storing signature image production program | |
CN101393564A (zh) | 文档图像数据提供系统、装置和方法,及信息处理装置和方法 | |
JP4651407B2 (ja) | 画像処理装置およびコンピュータプログラムおよび記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220902 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230725 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230823 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7337612 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |