[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2013254321A5 - - Google Patents

Download PDF

Info

Publication number
JP2013254321A5
JP2013254321A5 JP2012129016A JP2012129016A JP2013254321A5 JP 2013254321 A5 JP2013254321 A5 JP 2013254321A5 JP 2012129016 A JP2012129016 A JP 2012129016A JP 2012129016 A JP2012129016 A JP 2012129016A JP 2013254321 A5 JP2013254321 A5 JP 2013254321A5
Authority
JP
Japan
Prior art keywords
character
image processing
processing apparatus
electronic document
column arrangement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012129016A
Other languages
English (en)
Other versions
JP5950700B2 (ja
JP2013254321A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2012129016A priority Critical patent/JP5950700B2/ja
Priority claimed from JP2012129016A external-priority patent/JP5950700B2/ja
Priority to US13/905,891 priority patent/US9049400B2/en
Publication of JP2013254321A publication Critical patent/JP2013254321A/ja
Publication of JP2013254321A5 publication Critical patent/JP2013254321A5/ja
Application granted granted Critical
Publication of JP5950700B2 publication Critical patent/JP5950700B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明に係る画像処理装置は、画像から電子文書を生成する画像処理装置であって、前記画像から複数の文字領域を特定する特定手段と、前記複数の文字領域それぞれに対して文字認識処理を実行する文字認識手段と、前記電子文書の仕様で表現可能な段組配置の中から、前記複数の文字領域を再現するのに最も適した段組配置を選択する選択手段と、前記選択した段組配置と前記文字認識手段による文字認識結果とに基づいて、前記電子文書を生成する生成手段とを備えたことを特徴とする。

Claims (9)

  1. 画像から電子文書を生成する画像処理装置であって、
    前記画像から複数の文字領域を特定する特定手段と、
    前記複数の文字領域それぞれに対して文字認識処理を実行する文字認識手段と、
    前記電子文書の仕様で表現可能な段組配置の中から、前記複数の文字領域を再現するのに最も適した段組配置を選択する選択手段と、
    前記選択した段組配置と前記文字認識手段による文字認識結果とに基づいて、前記電子文書を生成する生成手段と
    を備えたことを特徴とする画像処理装置。
  2. 前記選択手段は、前記電子文書の仕様で表現可能な段組配置の中から、前記複数の文字領域のうちの本文領域を再現するのに最も適した段組配置を選択することを特徴とする請求項1に記載の画像処理装置。
  3. 前記複数の文字領域間の論理構造を解析する解析手段を更に有し、
    前記選択手段は、前記解析手段で解析された前記複数の文字領域間の論理構造の再現率が最も高い段組配置を、前記複数の文字領域を再現するのに最も適した段組配置として選択することを特徴とする請求項1に記載の画像処理装置。
  4. 前記解析手段で解析された論理構造は、前記複数の文字領域の読み順を含み、
    前記選択手段は、前記段組配置の本文として前記複数の文字領域を配置したときに、前記複数の文字領域が前記読み順に従った連続性を持っているほど、前記論理構造の再現率が高いと判断することを特徴とする請求項に記載の画像処理装置。
  5. 前記解析手段で解析された論理構造は、文字領域の文字数に応じて判断される前記複数の文字領域それぞれの重要度を含み、
    前記選択手段は、前記段組配置の本文として前記複数の文字領域を配置したときに、当該本文として配置された複数の文字領域の重要度が高いほど、前記解析された論理構造の再現率が高いと判断することを特徴とする請求項に記載の画像処理装置。
  6. 前記複数の文字領域それぞれの文字数を解析する解析手段を更に有し、
    前記選択手段は、前記電子文書の仕様で表現可能な段組配置それぞれにしたがって前記複数の文字領域を配置したときに本文として配置される文字領域の文字数に基づいて、前記電子文書の仕様で表現可能な段組配置の中から前記複数の文字領域を再現するのに最も適した段組配置を選択することを特徴とする請求項1に記載の画像処理装置。
  7. 前記生成手段は、前記複数の文字領域のうち、前記選択手段で選択された段組配置の本文として配置されない文字領域を、本文から独立した自由配置文字領域とした前記電子文書を生成することを特徴とする請求項1に記載の画像処理装置。
  8. コンピュータを、請求項1乃至7のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
  9. 画像から電子文書を生成する画像処理装置で実行される画像処理方法であって、
    前記画像から複数の文字領域を特定する特定ステップと、
    前記複数の文字領域それぞれに対して文字認識処理を実行する文字認識ステップと、
    前記電子文書の仕様で表現可能な段組配置の中から、前記複数の文字領域を再現するのに最も適した段組配置を選択する選択ステップと、
    前記選択した段組配置と前記文字認識ステップによる文字認識結果とに基づいて、前記電子文書を生成する生成ステップと
    を備えたことを特徴とする画像処理方法。
JP2012129016A 2012-06-06 2012-06-06 画像処理装置、画像処理方法及びプログラム Expired - Fee Related JP5950700B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012129016A JP5950700B2 (ja) 2012-06-06 2012-06-06 画像処理装置、画像処理方法及びプログラム
US13/905,891 US9049400B2 (en) 2012-06-06 2013-05-30 Image processing apparatus, and image processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012129016A JP5950700B2 (ja) 2012-06-06 2012-06-06 画像処理装置、画像処理方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2013254321A JP2013254321A (ja) 2013-12-19
JP2013254321A5 true JP2013254321A5 (ja) 2015-07-23
JP5950700B2 JP5950700B2 (ja) 2016-07-13

Family

ID=49715091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012129016A Expired - Fee Related JP5950700B2 (ja) 2012-06-06 2012-06-06 画像処理装置、画像処理方法及びプログラム

Country Status (2)

Country Link
US (1) US9049400B2 (ja)
JP (1) JP5950700B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6891073B2 (ja) * 2017-08-22 2021-06-18 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP2020198546A (ja) * 2019-06-03 2020-12-10 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US11900644B2 (en) * 2019-10-31 2024-02-13 Rakuten Group, Inc. Document image analysis apparatus, document image analysis method and program thereof
JP7528542B2 (ja) * 2020-06-03 2024-08-06 株式会社リコー 画像処理装置、方法およびプログラム
US11367296B2 (en) * 2020-07-13 2022-06-21 NextVPU (Shanghai) Co., Ltd. Layout analysis

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5349368A (en) * 1986-10-24 1994-09-20 Kabushiki Kaisha Toshiba Machine translation method and apparatus
US5094289A (en) 1990-09-19 1992-03-10 American Colloid Company Roasted carbon molding (foundry) sand and method of casting
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP3683923B2 (ja) 1994-11-17 2005-08-17 キヤノン株式会社 文字領域の順序付け方法
US5689342A (en) 1994-11-17 1997-11-18 Canon Kabushiki Kaisha Image processing method and apparatus which orders text areas which have been extracted from an image
JPH10134066A (ja) * 1996-10-29 1998-05-22 Matsushita Electric Ind Co Ltd 文章集約装置
JP3962891B2 (ja) * 2000-08-09 2007-08-22 富士ゼロックス株式会社 文書画像処理装置、文書画像処理方法、及び記憶媒体
JP4181310B2 (ja) * 2001-03-07 2008-11-12 昌和 鈴木 数式認識装置および数式認識方法
JP3956114B2 (ja) * 2002-06-28 2007-08-08 インターナショナル・ビジネス・マシーンズ・コーポレーション 表示制御方法、これを用いたプログラム、情報処理装置及び光学式文字読み取り装置
JP2004178010A (ja) * 2002-11-22 2004-06-24 Toshiba Corp 文書処理装置並びにその方法及びプログラム
JP4251629B2 (ja) 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7391917B2 (en) 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
JP4343213B2 (ja) * 2006-12-25 2009-10-14 株式会社東芝 文書処理装置および文書処理方法
JP4590433B2 (ja) 2007-06-29 2010-12-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5376795B2 (ja) 2007-12-12 2013-12-25 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
US8261180B2 (en) * 2009-04-28 2012-09-04 Lexmark International, Inc. Automatic forms processing systems and methods
JP2012027723A (ja) * 2010-07-23 2012-02-09 Sony Corp 情報処理装置、情報処理方法及び情報処理プログラム
JP5179559B2 (ja) * 2010-11-12 2013-04-10 シャープ株式会社 画像処理システムを制御する制御装置、画像形成装置、画像読取装置、制御方法、画像処理プログラム及びコンピュータ読み取り可能な記録媒体
JP5275325B2 (ja) * 2010-11-29 2013-08-28 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体

Similar Documents

Publication Publication Date Title
JP2012226744A5 (ja)
JP2013254321A5 (ja)
JP2016530660A5 (ja)
JP2015531925A5 (ja)
JP2014232533A5 (ja)
JP2014016817A5 (ja)
JP2010066987A5 (ja)
JP2014016800A5 (ja)
JP2015026188A5 (ja)
JP2014052745A5 (ja)
JP2016071621A5 (ja)
JP2016164748A5 (ja)
WO2016043846A4 (en) A general formal concept analysis (fca) framework for classification
JP2021131900A (ja) 文書レイアウト解析方法、装置、電子機器及び記憶媒体
JP2014229115A5 (ja)
JP2017527013A5 (ja)
JP2010220097A5 (ja) 画像処理装置、画像処理方法およびプログラム
JP2013097467A5 (ja)
JP2015041081A5 (ja)
JP2015125701A5 (ja)
JP2014002591A5 (ja) 描画装置、描画方法、プログラム
JP2011159179A5 (ja) 画像処理装置及びその処理方法、並びに画像処理方法
JP2009032273A5 (ja)
JP2012088788A5 (ja)
JP2017041174A5 (ja)