JP5036430B2 - 画像処理装置及びその制御方法 - Google Patents
画像処理装置及びその制御方法 Download PDFInfo
- Publication number
- JP5036430B2 JP5036430B2 JP2007181446A JP2007181446A JP5036430B2 JP 5036430 B2 JP5036430 B2 JP 5036430B2 JP 2007181446 A JP2007181446 A JP 2007181446A JP 2007181446 A JP2007181446 A JP 2007181446A JP 5036430 B2 JP5036430 B2 JP 5036430B2
- Authority
- JP
- Japan
- Prior art keywords
- region
- area
- image
- joining
- regions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3872—Repositioning or masking
- H04N1/3873—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Processing Or Creating Images (AREA)
- Facsimile Image Signal Circuits (AREA)
- Editing Of Facsimile Originals (AREA)
- Character Input (AREA)
- Facsimiles In General (AREA)
Description
複数ページにわたる画像データの各ページの画像を当該画像に含まれる部分画像の種別に応じた複数の領域に分割する分割手段と、
前記複数の領域のそれぞれの少なくとも座標、サイズ及び前記種別に関する属性情報を保持する保持手段と、
前記分割手段により分割された複数の領域の1つである第1の領域を、当該複数の領域の1つである第2の領域と接合する際に、ユーザの指示に基づいて前記第2の領域を特定するための方向を設定する設定手段と、
前記複数の領域において前記第1の領域に隣接する複数の隣接領域のうち、前記第1の領域の属性情報が示す前記種別と同一の種別の部分画像に対応する領域であってかつ前記設定手段により設定された方向に隣接する領域が存在すると、該領域を前記第2の領域として特定し、該特定された第2の領域を前記第1の領域と接合して1つの領域とする領域接合手段と、
前記領域接合手段により接合された領域を含む前記画像データの領域に関する情報を記憶する記憶手段と、
を有することを特徴とする。
画像を複数の領域に分割する画像処理装置の制御方法であって、
複数ページにわたる画像データの各ページの画像を当該画像に含まれる部分画像の種別に応じた複数の領域に分割する分割工程と、
前記複数の領域のそれぞれの少なくとも座標、サイズ及び前記種別に関する属性情報を保持する保持工程と、
前記分割工程で分割された複数の領域の1つである第1の領域を、当該複数の領域の1つである第2の領域と接合する際に、ユーザの指示に基づいて前記第2の領域を特定するための方向を設定する設定工程と、
前記複数の領域において前記第1の領域に隣接する複数の隣接領域のうち、前記第1の領域の属性情報が示す前記種別と同一の種別の部分画像に対応する領域であってかつ前記設定工程で設定された方向に隣接する領域が存在すると、該領域を前記第2の領域として特定し、該特定された第2の領域を前記第1の領域と接合して1つの領域とする領域接合工程と、
前記領域接合工程により接合された領域を含む前記画像データの領域に関する情報を記憶する記憶工程と、
を有することを特徴とする。
次に本発明の実施の形態に係るMFP100における、画像を領域に分割し、各領域に含まれる文字や罫線、図形、写真等のコンテンツ(領域コンテンツ)を取得する処理全体の概要について図5を用いて説明する。
このブロックセレクション処理とは、1ページの画像をその画像に含まれる部分画像の種別に応じた複数の領域に分割する処理のことである。
図7(A)(B)は、図6(B)に示す各領域の種別及び座標、更にはテキスト領域に対してOCR処理がなされたことを示すOCR情報を記憶したテーブル(A)及び、そのページ情報(B)を示す。尚、図7(A)のブロック番号1−n(n=1〜16)は、1ページ目のブロック#nであることを示している。また種別「1」は文字領域、「2」は図形、「3」は表、「4」は写真をそれぞれ示している。座標(X,Y)は、ブロックを示す矩形の左上の角の座標を示す。そして幅Wと高さHで、そのブロックの形状を特定できる。また図7(B)により、1ページ目の画像には16個のブロックが存在していることがわかる。
文字認識の際に用いる、字種の数分の辞書特徴ベクトルを文字の形状種、即ち、フォント種に対して複数用意しておく。そして、照合する際に、文字コードとともにフォント種を出力することにより、その文字のフォントを識別できる。
尚、原稿がカラーの場合は、カラー画像から各文字の色を抽出して後述するメタ情報に記憶する。
次に、ページ単位でブロックセレクション処理した領域コンテンツ候補に対して、領域同士を接合する領域接合処理について説明する。
領域を接合するバリエーションを図10(A)(B)及び図11(A)(B)を参照して説明する。
図12及び図13は、本実施の形態に係るMFP100において領域を接合する処理を説明するフローチャートである。尚、この処理を実行するプログラムは、実行時にはHDD2004からRAM2002にロードされて、CPU2001の制御の下に実行される。この処理の開始前には、図5に示すフローチャートに従って、接合処理判定のパラメータの全てが決定されている。ここでは、前述のステップS105で作成された図7に示すテーブルを用いる。ここでは、1ページに含まれる領域の数をN、各領域毎の画像種別をZ、領域の主走査方向の開始位置をX、領域の副走査方向の開始位置をY、領域の主走査方向の画素数をW、副走査方向の領域の画素数をHとする。また図示しない読み取り或は、蓄積された際の主走査及び副走査方向の読み取り解像度をRX,RYとする。またステップS102で入力された、主走査方向を優先にするか、副走査方向を優先にするかを示すフラグをFS(オンで主走査優先)とする。また文字領域のみを接合するか、その他の画像・図表領域同士も接合するかを示すフラグをFTとする。また領域判定する対象のエリアの開始位置及び終了位置を、それぞれTSX,TSY,TEX,TEYとする。また白黒・カラーを考慮しないで接合するか否かを示すフラグをFC、フォント種別を考慮しないで接合するか否かを示すフラグをFFとする。また領域間の距離として、主走査及び副走査で何ミリ以内のものを接合対象とするかをそれぞれDX,DYで示す。更に、2つの領域の主走査幅の差が何ミリ以内のものを接合対象とするかを示す値をDHとする。以上の前提に従って、以下、本実施の形態に係る領域接合処理を詳しく説明する。
次にステップS27に進み、集合S1内に、領域Iの主走査方向幅に略等しい領域があるかを判定する。即ち、領域Iの主走査方向の画素数W(I)に対して誤差が許容される範囲DH(I)の主走査方向の幅を有する領域が、前述の集合S1にあるかを判定する。ここで、そのような領域がない場合はステップS48でIに1を加算してステップS21に戻り、次の領域を評価する。
図14は、本実施の形態に係るMFP100において、領域コンテンツを印刷する際の処理の概要を説明するフローチャートである。
図15(A)〜(C)は、本実施の形態に係るMFP100において、領域コンテンツがデータベースで編集され、そのデータ量が変更された場合に印刷用イメージデータを得る処理の概要を説明する図である。
以上、本発明の実施形態について詳述したが、本発明は、複数の機器から構成されるシステムに適用しても良いし、また一つの機器からなる装置に適用しても良い。
Claims (9)
- 複数ページにわたる画像データの各ページの画像を当該画像に含まれる部分画像の種別に応じた複数の領域に分割する分割手段と、
前記複数の領域のそれぞれの少なくとも座標、サイズ及び前記種別に関する属性情報を保持する保持手段と、
前記分割手段により分割された複数の領域の1つである第1の領域を、当該複数の領域の1つである第2の領域と接合する際に、ユーザの指示に基づいて前記第2の領域を特定するための方向を設定する設定手段と、
前記複数の領域において前記第1の領域に隣接する複数の隣接領域のうち、前記第1の領域の属性情報が示す前記種別と同一の種別の部分画像に対応する領域であってかつ前記設定手段により設定された方向に隣接する領域が存在すると、該領域を前記第2の領域として特定し、該特定された第2の領域を前記第1の領域と接合して1つの領域とする領域接合手段と、
前記領域接合手段により接合された領域を含む前記画像データの領域に関する情報を記憶する記憶手段と、
を有することを特徴とする画像処理装置。 - 前記設定手段は、前記第2の領域を特定するための方向に加えて、領域同士の距離、領域の種別、各ページの画像における領域の座標の少なくともいずれかを更に設定することを特徴とする請求項1に記載の画像処理装置。
- 前記領域接合手段は、複数ページにまたがる2つ以上の領域同士をも接合して1つの領域とすることを特徴とする請求項1又は2に記載の画像処理装置。
- 原稿を読み取って前記画像データを入力する画像入力手段を更に有することを特徴とする請求項1に記載の画像処理装置。
- 前記記憶手段は、領域の種別が文字領域であること示している場合、少なくとも当該領域の文字フォント、文字サイズ、文字の色情報を記憶することを特徴とする請求項1に記載の画像処理装置。
- 前記記憶手段は、各領域の座標を特定の領域に対する相対座標で記憶することを特徴とする請求項1に記載の画像処理装置。
- 前記領域接合手段により接合された領域を含む画像データを、前記記憶手段に記憶された情報に基づいて前記画像データの各ページの画像に展開する展開手段を更に有することを特徴とする請求項1に記載の画像処理装置。
- 前記領域接合手段は、複数ページにまたがる2つ以上の領域同士を接合する場合、第1のページに隣接する第2のページの複数の領域のうち、前記属性情報に基づいて特定された領域であってかつ前記設定手段により設定された方向に隣接する前記第2のページの領域を、前記第1のページの領域と接合して1つの領域とすることを特徴とする請求項1ないし7のいずれか1項に記載の画像処理装置。
- 画像を複数の領域に分割する画像処理装置の制御方法であって、
複数ページにわたる画像データの各ページの画像を当該画像に含まれる部分画像の種別に応じた複数の領域に分割する分割工程と、
前記複数の領域のそれぞれの少なくとも座標、サイズ及び前記種別に関する属性情報を保持する保持工程と、
前記分割工程で分割された複数の領域の1つである第1の領域を、当該複数の領域の1つである第2の領域と接合する際に、ユーザの指示に基づいて前記第2の領域を特定するための方向を設定する設定工程と、
前記複数の領域において前記第1の領域に隣接する複数の隣接領域のうち、前記第1の領域の属性情報が示す前記種別と同一の種別の部分画像に対応する領域であってかつ前記設定工程で設定された方向に隣接する領域が存在すると、該領域を前記第2の領域として特定し、該特定された第2の領域を前記第1の領域と接合して1つの領域とする領域接合工程と、
前記領域接合工程により接合された領域を含む前記画像データの領域に関する情報を記憶する記憶工程と、
を有することを特徴とする画像処理装置の制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007181446A JP5036430B2 (ja) | 2007-07-10 | 2007-07-10 | 画像処理装置及びその制御方法 |
US12/169,901 US8244035B2 (en) | 2007-07-10 | 2008-07-09 | Image processing apparatus and control method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007181446A JP5036430B2 (ja) | 2007-07-10 | 2007-07-10 | 画像処理装置及びその制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009021712A JP2009021712A (ja) | 2009-01-29 |
JP5036430B2 true JP5036430B2 (ja) | 2012-09-26 |
Family
ID=40253179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007181446A Expired - Fee Related JP5036430B2 (ja) | 2007-07-10 | 2007-07-10 | 画像処理装置及びその制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8244035B2 (ja) |
JP (1) | JP5036430B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5287384B2 (ja) * | 2009-03-13 | 2013-09-11 | 株式会社リコー | 画像処理方法、画像処理装置、プログラムおよび記憶媒体 |
US8559755B2 (en) * | 2009-04-07 | 2013-10-15 | Citrix Systems, Inc. | Methods and systems for prioritizing dirty regions within an image |
EP2504765A4 (en) * | 2009-11-25 | 2014-09-03 | Hewlett Packard Development Co | PRINTED INFORMATION DEVICE |
JP5423405B2 (ja) * | 2010-01-08 | 2014-02-19 | 株式会社リコー | 画像処理システムおよび画像処理方法 |
JP5347981B2 (ja) * | 2010-01-15 | 2013-11-20 | 富士ゼロックス株式会社 | 情報表示装置及びプログラム |
JP5769015B2 (ja) * | 2011-09-20 | 2015-08-26 | カシオ計算機株式会社 | 印字装置、印字方法、及びプログラム |
US8937743B1 (en) * | 2012-01-30 | 2015-01-20 | Glory Ltd. | Paper sheet processing apparatus and paper sheet processing method |
US20150070373A1 (en) * | 2012-08-23 | 2015-03-12 | Google Inc. | Clarification of Zoomed Text Embedded in Images |
CN104376317B (zh) * | 2013-08-12 | 2018-12-14 | 福建福昕软件开发股份有限公司北京分公司 | 一种将纸质文件转换为电子文件的方法 |
WO2015159941A1 (ja) * | 2014-04-16 | 2015-10-22 | グローリー株式会社 | カラー画像における文字背景除去方法及び装置、並びにラインカメラの設置調整方法及び設置調整用チャート |
JP6344064B2 (ja) * | 2014-05-30 | 2018-06-20 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
JP6702198B2 (ja) * | 2017-01-11 | 2020-05-27 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置及びプログラム |
JP6953957B2 (ja) | 2017-09-27 | 2021-10-27 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
US11593552B2 (en) | 2018-03-21 | 2023-02-28 | Adobe Inc. | Performing semantic segmentation of form images using deep learning |
CN109933756B (zh) * | 2019-03-22 | 2022-04-15 | 腾讯科技(深圳)有限公司 | 基于ocr的图像转档方法、装置、设备及可读存储介质 |
US11042734B2 (en) * | 2019-08-13 | 2021-06-22 | Adobe Inc. | Electronic document segmentation using deep learning |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0743718B2 (ja) * | 1989-10-13 | 1995-05-15 | 株式会社日立製作所 | マルチメディア文書構造化方式 |
JP2579397B2 (ja) * | 1991-12-18 | 1997-02-05 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 文書画像のレイアウトモデルを作成する方法及び装置 |
JPH08320914A (ja) * | 1995-05-24 | 1996-12-03 | Hitachi Ltd | 表認識方法および装置 |
JPH10247237A (ja) | 1996-12-30 | 1998-09-14 | Ricoh Co Ltd | 文書画像処理装置および文書画像処理方法および情報記録媒体 |
US6289121B1 (en) * | 1996-12-30 | 2001-09-11 | Ricoh Company, Ltd. | Method and system for automatically inputting text image |
JPH1115826A (ja) | 1997-06-25 | 1999-01-22 | Toshiba Corp | 文書解析装置及び方法 |
JP4400560B2 (ja) * | 2005-12-20 | 2010-01-20 | セイコーエプソン株式会社 | デジタルコンテンツ作成システム、プログラムおよび記憶媒体 |
-
2007
- 2007-07-10 JP JP2007181446A patent/JP5036430B2/ja not_active Expired - Fee Related
-
2008
- 2008-07-09 US US12/169,901 patent/US8244035B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8244035B2 (en) | 2012-08-14 |
US20090016647A1 (en) | 2009-01-15 |
JP2009021712A (ja) | 2009-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5036430B2 (ja) | 画像処理装置及びその制御方法 | |
JP4012140B2 (ja) | 画像処理装置、情報処理装置及びそれらの制御方法、プログラム | |
EP1588293B1 (en) | Image processing method, system, program, program storage medium and information processing apparatus | |
US7532757B2 (en) | Image processing apparatus, control method therefor, and program | |
US7593120B2 (en) | Image processing apparatus, control method therefor, and program | |
US8339619B2 (en) | System and image processing method and apparatus for re-using and re-editing images | |
JP4227569B2 (ja) | 画像処理システム、画像処理装置の制御方法、プログラム及び記録媒体 | |
US8331671B2 (en) | Image processing apparatus and image encoding method related to non-photo image regions | |
US7551753B2 (en) | Image processing apparatus and method therefor | |
EP1538564B1 (en) | Image processing system and image processing method | |
US20070030519A1 (en) | Image processing apparatus and control method thereof, and program | |
JP4208780B2 (ja) | 画像処理システム及び画像処理装置の制御方法並びにプログラム | |
US7508547B2 (en) | Image processing apparatus, control method therefor, and program | |
JP5178490B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP4541770B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2005151455A (ja) | 画像処理装置、情報処理装置及びそれらの制御方法、プログラム | |
JP2008092419A (ja) | 画像処理装置、画像処理方法 | |
JP2008152353A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100712 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120604 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120703 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150713 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5036430 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150713 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |