[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6370080B2 - 画像処理装置、画像処理方法及びプログラム。 - Google Patents

画像処理装置、画像処理方法及びプログラム。 Download PDF

Info

Publication number
JP6370080B2
JP6370080B2 JP2014076079A JP2014076079A JP6370080B2 JP 6370080 B2 JP6370080 B2 JP 6370080B2 JP 2014076079 A JP2014076079 A JP 2014076079A JP 2014076079 A JP2014076079 A JP 2014076079A JP 6370080 B2 JP6370080 B2 JP 6370080B2
Authority
JP
Japan
Prior art keywords
character
color
character area
unit
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014076079A
Other languages
English (en)
Other versions
JP2015198385A5 (ja
JP2015198385A (ja
Inventor
妙子 山▲崎▼
妙子 山▲崎▼
田中 哲臣
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014076079A priority Critical patent/JP6370080B2/ja
Priority to US14/669,972 priority patent/US9438767B2/en
Publication of JP2015198385A publication Critical patent/JP2015198385A/ja
Publication of JP2015198385A5 publication Critical patent/JP2015198385A5/ja
Application granted granted Critical
Publication of JP6370080B2 publication Critical patent/JP6370080B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、多値画像を圧縮・伸長する画像処理技術に関する。
近年、スキャナの普及により文書の電子化が進んでいる。電子化された文書データをフルカラーのビットマップ形式で保存すると、例えば、A4サイズの場合では、読取解像度300dpiで、約24Mbyteにもなる。これでは、必要なメモリが膨大になるだけでなく、例えばメールに添付して送信するのにもサイズが大きすぎるため、できるだけデータ容量を小さくしたいという要望がある。
そこで、データ容量を小さくするべく、読み取った画像(フルカラー画像)を圧縮することが通常行われており、その圧縮方法としてJPEGが知られている。JPEGは、写真等の自然画像を圧縮するには非常に効果的だが、文字部をJPEG圧縮するとモスキートノイズと呼ばれる画像劣化が発生することが知られている。これに対しては、入力されたフルカラー画像を文字領域と写真領域とに分け、文字領域には2値化した上でMMR圧縮、写真領域にはJPEG圧縮を行うことで、文字領域の品位を保ったまま、データサイズを小さくする方法が従来より提案されている。
上記従来の方法は、伸長時において、2値画像の白部分はJPEG画像を透過し、黒部分は文字単位や文字領域単位などで決定した代表色をのせた文字で表現することを特徴としている。これにより、元々単色で表現されていた文字部分のスキャナ読込によるバラツキを除去することが可能となる。加えて、圧縮システムに利用することで、高画質・高圧縮の画像が得られる。そして、この方法での高画質化の実現には、文字領域部分の文字から適切な代表色を抽出することが重要となる。この点、スキャナ読込によるバラツキや圧縮作用によって背景の色が文字に滲み込んでしまうことがあり、そのような滲み込みが生じた入力画像中の文字領域の色を、色抽出の際にそのまま再現(抽出)してしまうという問題があった。
このような色抽出技術における問題に対しては、文字の代表色を単位文字に割り当てる際、単位文字の平均色と代表色の色距離が所定の範囲内にある反転文字については所定の色(例えば白)を割り当てるという提案がなされている(特許文献1)。
特開2004−260327号公報
上記特許文献1は、文字の視認性を高めるために、元の文字色よりも強調した所定の色を文字の代表色とする技術である。そして、例えば入力画像内の文字が反転文字であって、当該反転文字色が、白以外の薄い色である場合にも、その文字代表色として所定色(例えば白)が割り当てられることになる。
つまり、上記特許文献1の場合、上述のような白以外の反転文字領域に対して、当該反転文字のオリジナルの色とは異なる色が文字代表色として割り当てられてしまう。さらに、薄い文字色を持つ反転文字領域が全体の大半を占めるような入力画像であれば、圧縮前の状態(入力画像)と圧縮伸長後の状態(復元画像)とで、見た目が大きく変わってしまうことになる。
本発明に係る画像処理装置は、多値画像内の複数の文字領域と、当該複数の文字領域それぞれに含まれる複数の文字とを特定する特定手段と、前記特定された複数の文字領域の1つを処理対象の文字領域として、当該処理対象の文字領域が反転文字領域であるか判定する判定手段と、前記処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の前記多値画像における色に基づいて複数の代表色を抽出し、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、当該抽出した複数の代表色のいずれかを割り当てる設定手段と、を備え、前記設定手段は、前記判定手段において前記処理対象の文字領域が反転文字領域であると判定された場合、当該処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の色に基づいて複数の代表色を抽出し、前記抽出された複数の代表色それぞれに対して設定される補正係数を用いて前記抽出された複数の代表色それぞれの補正を行い、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、各文字を構成する画素の平均色に近い当該補正後の代表色のいずれかを割り当てるものであり、前記抽出された複数の代表色それぞれに対して設定される前記補正係数は、その代表色に近似しているとみなせる平均色を有する文字の総画素数が多いほど、その代表色が白に近づくように補正される度合いが低くなる補正係数であることを特徴とする。
本発明によれば、反転文字の文字色を強調して視認性を高めることと、入力画像と復元画像と間の見た目の差を小さくすることとのバランスが取れた画像圧縮が可能となる。
実施例1に係る、画像圧縮装置としての画像処理装置の内部構成を示す機能ブロック図である。 入力画像の一例を示す図である。 2値化処理の流れを示すフローチャートである。 輝度画像のヒストグラムの一例を示す図である。 2値化処理で得られた2値画像を示す図である。 文字領域特定処理の流れを示すフローチャートである。 2値画像に文字領域特定処理を施した結果を示す図である。 単位文字特定処理の流れを示すフローチャートである。 単位文字特定処理を施した結果(一部)を示す図である。 代表色設定処理の流れを示すフローチャートである。 代表色抽出処理の流れを示すフローチャートである。 ヒストグラムを示す図である。 候補代表色抽出処理と代表色割当処理の詳細を示すフローチャートである。 候補代表色の抽出方法を説明する図である。 実施例1に係る、候補代表色補正処理の詳細を示すフローチャートである。 文字領域穴埋め処理の流れを示すフローチャートである。 画像伸張装置としての画像処理装置の内部構成を示す機能ブロック図である。 実施例2に係る、画像圧縮装置としての画像処理装置の内部構成を示す機能ブロック図である。 特徴別に再設定された文字領域の一例を示す図である。 実施例2に係る、候補代表色補正処理の詳細を示すフローチャートである。 実施例3に係る、候補代表色補正処理の流れを示すフローチャートである。
以下、添付図面を参照して、本発明を好適な実施例に従って詳細に説明する。なお、以下の実施例において示す構成は一例にすぎず、本発明は図示された構成に限定されるものではない。
図1は、本実施例に係る、スキャナ等で読み取られた多値画像を圧縮する画像圧縮装置としての画像処理装置の内部構成を示す機能ブロック図である。画像圧縮装置100は、2値化部101、文字領域特定部102、単位文字特定部103、代表色設定部104、文字領域穴埋め部105、第1圧縮部106、第2圧縮部107で構成される。
2値化部101は、入力画像としてのカラーの多値画像(以下、単に「多値画像」と呼ぶ。)を2値化する。生成された2値画像は、文字領域特定部102及び単位文字特定部103に送られる。
文字領域特定部102は、2値化部101から受け取った2値画像に対し所定値を持つ画素(例えば、黒画素)の輪郭線追跡処理等を行って文字領域を特定し、文字領域を識別する情報(以下、文字領域情報)を生成する。文字領域情報には、文字領域の位置(座標)やサイズ、所定値を持つ画素の数といった情報に加え、文字領域内の文字が反転文字であるかどうかを示す属性情報も含まれる。この文字領域情報によって文字領域が特定されることで、文字領域以外の領域(写真やイラスト等の自然(階調)画像を示す自然画像領域)の位置やサイズも特定されることになる。また、文字領域特定部102は、生成した文字領域情報に基づいて、文字領域毎の2値画像(以下、部分2値画像)の生成も行なう。そして、文字領域情報は単位文字特定部103に送られ、部分2値画像は代表色設定部104、文字領域穴埋め部105及び第1圧縮部106に送られる。
単位文字特定部103は、2値化部101から受け取った2値画像と文字領域特定部102から受け取った文字領域情報を用いて、文字領域内における個々の文字(以下、単位文字)の位置及びサイズを特定する。説明を簡単にするため、本実施例では、特定された各単位文字の位置及びサイズなどを示す情報(以下、単位文字情報)は、文字領域情報に追加されるものとする。単位文字情報が追加された文字領域情報は、代表色設定部104と文字領域穴埋め部105に送られる。
代表色設定部104は、入力画像である多値画像と、文字領域特定部102から受け取った部分2値画像と、単位文字特定部103から受け取った文字領域情報(単位文字情報を含む)とに基づいて、文字領域毎に代表色を設定する。すなわち、部分2値画像における黒画素の部分と、多値画像上の当該黒画素に相当する位置とを対応付けながら、文字領域中の各単位文字に代表色を設定して、文字領域における代表色を示す情報(以下、文字代表色情報)を生成する。
文字領域穴埋め部105は、入力画像である多値画像と、文字領域特定部102から受け取った部分2値画像と、単位文字特定部103から受け取った文字領域情報とに基づいて穴埋め処理を行い、穴埋め多値画像を生成する。具体的には、多値画像上の文字領域毎に、その単位文字領域の文字画素を文字画素周辺の画素の色、すなわち背景色に置換し、文字を消した画像を生成する処理を行う。
第1圧縮部106は、文字領域特定部102から受け取った部分2値画像に対し、MMR方式による圧縮処理を行って、MMR圧縮コード(第1の圧縮コード)を生成する。なお、第1圧縮部における圧縮方式は、2値画像に適した圧縮方式であればよく、例えば、JBIG、MR、MH等の他の圧縮方式を用いてもよい。
第2圧縮部107は、文字領域穴埋め部105から受け取った穴埋め多値画像に対し、JPEG方式による圧縮処理を行って、JPEG圧縮コード(第2の圧縮コード)を生成する。
以上の各部による処理の結果、文字領域情報(単位文字情報を含む)、MMR圧縮コード、文字代表色情報、JPEG圧縮コードからなる、入力画像の圧縮データが生成される。生成した圧縮データについては、さらに、PDFなどに可逆圧縮してもよい。また、入力画像中に文字領域が存在しない場合、圧縮データはJPEG圧縮コードのみで構成されることになる。
なお、上述した画像圧縮装置(後述の画像伸張装置も同様)は、例えば、パーソナルコンピュータ等の汎用コンピュータで実現される。そして、汎用コンピュータには、その標準的な構成要素として、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等を有している。また、画像圧縮装置は、汎用コンピュータに対する拡張カードとして実現される専用ハードウエアとして実現されてもよい。さらに、画像圧縮装置を搭載する装置の具体例としては、ネットワーク通信機能を有する複合機(コピー、プリンタ、スキャナ、ファクシミリ機能等を有する装置)、カラースキャナ、カラーファクシミリ等が挙げられる。
続いて、画像圧縮装置100の各部のうち、2値化部101、文字領域特定部102、単位文字特定部103、代表色設定部104、文字領域穴埋め部105について、それぞれ詳しく説明する。
まず、2値化部101における2値化処理について説明する。
図2は、2値化処理の対象となる入力画像の一例を示す図である。図2において、入力画像201は多値画像であり、入力画像201の下地は濃い灰色である。また、文字領域202及び203の反転文字は薄い赤、文字領域204の反転文字は白、文字領域205の反転文字は薄い黄色、文字領域206及び207の反転文字は薄い青であるものとする。なお、本実施例では、入力画像201はスキャナで読み取った画像データとする。通常、スキャナで読み取った画像には、読取時のバラツキやJPEG圧縮の劣化を含んでいると考えられるが、そのような劣化を含まない画像も本実施例の対象であることは言うまでもない。
図3は、2値化処理の流れを示すフローチャートである。なお、以下で述べる内容は、ハードディスク等に格納されたプログラムがRAMに読み出され、これをCPUが実行することにより実現される。
ステップ301において、2値化部101は、スキャナで読み取って得られた多値画像(例えば、24bitのRGBデータ)から輝度画像を生成する。具体的には、下記の式(1)により輝度Yへの変換を行う。
Y = 0.299×R + 0.587×G + 0.114×B ・・・式(1)
ステップ302において、2値化部101は、生成された輝度画像の全面ヒストグラムを作成する。図4は、輝度画像のヒストグラムの一例を示す図である。図4において、横軸はY信号の輝度レベル(0〜255)を示し、縦軸はその出現頻度を示している。図4のヒストグラムの場合、分布曲線401が下地の分布を示し、分布曲線402が文字の分布を示している。黒三角のマーク403は、下地の分布曲線401の頂点と文字の分布曲線402の頂点との中間点を示している。
ステップ303において、2値化部101は、最適な2値化閾値Tを導出する。2値化閾値Tの導出方法は特に限定されないが、例えば、上述の黒三角のマーク403で示される中間点が2値化閾値Tとして導出される。
ステップ304において、2値化部101は、ステップ301で生成した輝度画像を、ステップ303で導出した2値化閾値Tに基づいて2値化し、2値画像を生成する。
以上が、2値化処理の内容である。図5は、図2における入力画像201を2値化して得られた2値画像を示しており、背景部(下地部)は黒、反転文字部分は白で表現された画像となっている。
次に、文字領域特定部102における文字領域特定処理について説明する。
図6は、文字領域特定処理の流れを示すフローチャートである。なお、以下で述べる内容は、ハードディスク等に格納されたプログラムがRAMに読み出され、これをCPUが実行することにより実現される。
ステップ601において、文字領域特定部102は、2値化部101で生成された2値画像から、公知の黒画素の輪郭追跡処理あるいはラベリング処理などの技術により、黒画素の部分を検出する。
ステップ602において、文字領域特定部102は、ステップ601での検出結果に基づいて、文字領域(その位置やサイズ)を特定する。具体的には、黒画素輪郭で囲まれる画素の塊のうち、面積の大きい黒画素の塊について、内部にある白画素に対しても輪郭線追跡を行って白画素の塊を抽出し、更に一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。こうして得られた黒画素の塊を、大きさ及び形状で分類する。例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、近接する文字が整列良くグループ化可能な部分を文字領域として特定する。
ステップ603において、文字領域特定部102は、ステップ603で特定された文字領域について、反転文字領域であるかどうかを特定する。具体的には、まず、文字領域内の黒画素数と白画素数とを比較する。そして、黒画素数の方が白画素数より多ければ、更に連結白画素のサイズが予め定めた文字サイズの範囲内であるかどうかをチェックする。その結果、連結白画素のサイズが予め定めた文字サイズの範囲内であれば、当該文字領域は反転文字領域であると特定する。
ステップ604において、文字領域特定部102は、ステップ603における処理結果に従い、属性情報を生成する。すなわち、文字領域として特定された領域については、文字領域の位置やサイズなどの情報とともに、反転文字領域であるか否かを示す種別の情報が、属性情報として生成される。また、文字領域以外の領域として特定された領域については、自然画領域であることを示す属性情報が生成される。このようにして生成された属性情報はRAM等に記憶される。
以上が、文字領域特定処理の内容である。図7は、図6で示した2値画像に文字領域特定処理を施した結果を示している。図7において、白枠で囲まれた領域701〜703が、特定された文字領域(ここではすべて反転文字領域)を示している。
次に、単位文字特定部103における単位文字の特定処理について説明する。 図8は、単位文字特定処理の流れを示すフローチャートである。なお、以下で述べる内容は、ハードディスク等に格納されたプログラムがRAMに読み出され、これをCPUが実行することにより実現される。
ステップ801において、単位文字特定部103は、処理対象とする文字領域を決定する。上述の図7の場合であれば、各文字領域701〜703のうち1の文字領域が、処理対象の文字領域として決定される。
ステップ802において、単位文字特定部103は、文字領域情報に含まれる属性情報を参照して、処理対象の文字領域が、反転文字領域であるかどうかを判定する。判定の結果、反転文字領域である場合は、ステップ803に進む。一方、反転文字領域でない場合は、ステップ804に進む。
ステップ803において、単位文字特定部103は、白画素であることを示す所定の画素値を有する画素の集合を単位文字として決定する。
ステップ804において、単位文字特定部103は、黒画素であることを示す所定の画素値を有する画素の集合を単位文字として決定する。
ステップ805において、単位文字特定部103は、未処理の文字領域の有無を判定する。未処理の文字領域があれば、ステップ801に戻り、次の文字領域を処理対象の文字領域に決定して、ステップ802〜ステップ805の処理を繰り返す。一方、すべての文字領域についての処理が完了している場合は、ステップ806に進む。
ステップ806において、単位文字特定部103は、ステップ803及び804で決定された各単位文字について、位置、サイズ、画素数、反転の有無などを示す情報(単位文字情報)を生成する。このようにして生成された単位文字情報はRAM等に記憶される。
図9は、図7の文字領域701に対して単位文字特定処理を施した結果(一部)を示している。図9において、アルファベット「A〜Q」までの各文字に対応する矩形901〜917が特定された単位文字となっている。なお、文字領域701は反転文字領域であるが、説明の便宜上、図9では白と黒を反転させている。同様に、他の文字領域702や703についても単位文字を特定する処理がなされる。
以上が、単位文字特定処理の内容である。
次に、代表色設定部104における代表色設定処理について説明する。上述したように、代表色設定部104は、文字領域情報、部分2値画像及び多値画像を入力として取得する。この場合において、部分2値画像は、2値画像の文字領域を切り取ってRAM等に格納してあるものとする。多値画像も同様にRAM等に格納してあるものとする。なお、本実施例では、入力画像をそのまま処理の対象として扱っているが、入力画像を圧縮した画像(圧縮多値画像)を処理対象として使用してもよい。その際の圧縮度合い(圧縮率)は、用途や目的に応じて任意の値が設定される。
図10は、代表色設定処理の流れを示すフローチャートである。なお、以下で述べる内容は、ハードディスク等に格納されたプログラムがRAMに読み出され、これをCPUが実行することにより実現される。
ステップ1001において、代表色設定部104は、処理対象とする文字領域(=部分2値画像)を決定する。例えば、上述の図7の場合、各文字領域701〜703のうち1の文字領域が、処理対象の文字領域として決定される。
ステップ1002において、代表色設定部104は、文字領域情報内の属性情報を参照して、処理対象の文字領域が、反転文字領域であるか否かを判定する。判定の結果、反転文字領域である場合は、ステップ1003に進む。一方、反転文字領域でない場合は、ステップ1006に進む。
ステップ1003において、代表色設定部104は、処理対象である文字領域(反転文字領域)に対応する部分2値画像に対し色反転処理を行なって色を反転させる。例えば、背景が黒の白文字(いわゆる白抜き文字)であれば、背景が白の黒文字にする。反転文字領域に対して反転処理を実行する理由は、通常の文字領域に施す処理と条件を同じにして、共通のアルゴリズムを適用するためである。
ステップ1004において、代表色設定部104は、処理対象の文字領域(反転文字領域)に対して代表色抽出処理を実行する。図11は、代表色抽出処理の流れを示すフローチャートである。上述のように代表色抽出処理の対象は、通常の文字領域と反転文字領域の両方となる。ここでは、図7の反転文字領域701が処理対象である場合を例に説明するものとする。また、説明において使用する用語を以下のように定義する。
・文字領域内の単位文字部分の画素に対応する多値画像の画素、その色情報の平均を、平均色C_ave(m)とする。ここで、mは文字領域中の単位文字を一意に識別する数値であり、文字領域中にM個の単位文字が存在すれば、mの取る範囲は1≦m≦Mとなる。
・文字領域内の候補代表色をC’(n)とする。ここで、nは文字領域中の代表色の数を表す。例えば、文字領域701に該当する多値画像の文字の色には、白と薄い黄色の2種類があるため、nは2となる。なお、nの初期値は1であり、代表色抽出処理が終了した段階で候補代表色の数nが確定する。
・単位文字毎に割り当てた候補代表色を、代表色C_q(m)とする。mは文字領域中の単位文字を一意に識別する数値であり、C_ave(m)で用いたmと同じ位置の単位文字を指す。
ステップ1101において、代表色設定部104は、文字領域の代表色数nに1を設定する。これは、「第1色目の代表色を抽出する」という意味である。
ステップ1102において、代表色設定部104は、文字領域情報と、部分2値画像の黒画素の位置に対応する多値画像の色(RGB)とを参照しながら、単位文字毎にRGBの平均色C_ave(m)を算出する。算出された各単位文字のRGBの平均色C_ave(m)は、例えば、YCbCrのような、輝度Yと色差CbCrで表現できる色空間に変換してもよい。色空間は、LabやYuv等の他の色空間でも構わないものとするが、本実施例では、RGBからYCbCrに変換した場合を例に説明を行う。RGBからYCbCrへの変換式は省略する。
ステップ1103において、代表色設定部104は、ヒストグラム作成の準備として、ヒストグラムの初期化(ヒストグラムを作成するためのメモリ領域のクリア)を行う。
ステップ1104において、代表色設定部104は、C_q(m)がNULL、すなわち代表色が未割当の単位文字のみを使って、色差CbCrの2次元ヒストグラムを作成する。ある文字領域に対する処理開始直後の段階では、文字領域内の単位文字すべてに代表色が割り当てられていないため、すべての単位文字(文字領域701では74個のアルファベット)のC_ave(m)を用いてヒストグラムが作成されることになる。図12は、図7の文字領域701についての1回目の処理で作成されるヒストグラムを示している。図12において、プロット群1201は単位文字901〜909の各単位文字の平均色C_aveをプロットした集合を表し、プロット群1202は単位文字910以降の各単位文字の平均色C_aveをプロットした集合を表している。ここで、プロット群1201とプロット群1202との距離が離れているのは、図2で示した入力画像(カラー多値画像)201における、文字領域204の色(白)と文字領域205の色(薄い黄色)との違いによる。さらに、プロット群1201内のプロット点の離れ具合、または、プロット群1202内のプロット点の離れ具合は、スキャナで読み取られた入力画像のバラツキ、あるいは、その後の処理(例えば、JPEG圧縮)によるバラツキを表している。また、文字領域701内の単位文字のうち、プロット群1201に対応する単位文字(反転単位文字)901〜909は、本来であれば白(Cb,Cr)=(0,0)であることが望まれる。しかし、上述したバラツキと同様の理由で、反転文字領域の背景部の色が反転単位文字の文字部に影響してしまい、(Cb,Cr)=(0,0)から離れた場所にプロットされてしまっている。そして、プロット群1202の点は文字領域701内の2行目から最終行までの単位文字についての文字平均色をプロットしているため、プロット群1201より内部に存在するプロット点が多いことが分かる。なお、本実施例では、処理の高速化を優先して、CbCrの2次元ヒストグラムを作成する例を示しているが、精度を優先して、YCbCrの3次元ヒストグラムを作成してもよい。
ステップ1105において、代表色設定部104は、単位文字についての候補代表色C’(n)を抽出する。候補代表色抽出処理については後述する。
ステップ1106において、代表色設定部104は、文字領域内の単位文字毎に代表色を割り当てる。代表色割当処理についても後述する。
ステップ1107において、代表色設定部104は、代表色が未割当の単位文字の有無を判定する。代表色が未割当の単位文字がある場合(C_q(m)がNULLの場合)には、ステップ1108に進む。一方、すべての単位文字に代表色が割り当てられている場合は、本処理を終了する。
ステップ1108において、代表色設定部104は、代表色数nをインクリメント(+1)する。インクリメントした後は、先行する処理で作成したヒストグラムを初期化し(ステップ1103)、C_q(m)がNULLの単位文字についてのみヒストグラムを作成する(ステップ1104)。そして、C_q(m)がNULLの単位文字がなくなるまで本処理が繰り返される。
以上が、代表色抽出処理の内容である。図7の文字領域701が処理対象である場合には、最初のルーチン(代表色数n=1)において、文字色が薄い黄色の各単位文字(2行目〜9行目の各文字)に対し、その単位文字の集合の合計画素数(2行目〜9行目の文字の画素数を合計した値)に応じた補正が施された代表色が割り当てられる。そして、2回目のルーチン(代表色数n=2)において、文字色が白の各単位文字(1行目の各文字)に対し、その単位文字の集合の合計画素数(1行目の文字の画素数を合計した値)に応じた補正が施された代表色が割り当てられることになる。
図10のフローチャートの説明に戻る。
ステップ1005において、代表色設定部104は、処理対象である文字領域(反転文字領域)に対応する部分2値画像に対し再反転処理を行なって色を再度反転させる。これは、代表色が割り当てられた後に、元の反転文字領域に戻すための処理である。
ステップ1006において、代表色設定部104は、処理対象の文字領域(通常の文字領域)に対して、前述した代表色抽出処理を実行する。
ステップ1007において、代表色設定部104は、未処理の文字領域の有無を判定する。未処理の文字領域があれば、ステップ1001に戻り、次の文字領域を処理対象の文字領域に決定して、ステップ1002〜ステップ1007の処理を繰り返す。一方、すべての文字領域についての処理が完了している場合は、本処理を終える。
以上が、代表色設定処理の内容である。
続いて、上述の候補代表色抽出処理(ステップ1105)と代表色割当処理(ステップ1106)の詳細について説明する。
図13は、候補代表色抽出処理と代表色割当処理の詳細を示すフローチャートである。図13のフローチャートにおいて、ステップ1301〜1303が単位文字の候補代表色C‘(n)を抽出する処理に相当し、ステップ1304〜1310が単位文字毎に代表色を割り当てる処理に相当する。
<候補代表色抽出処理>
ステップ1301において、代表色設定部104は、単位文字に割り当てられる代表色の候補となる候補代表色C’(n)の抽出を行う。ここで、nは候補代表色の数であり、前述の代表色数nと同じである。また、候補代表色C’(n)は、Cbの成分とCrの成分とからなり、n番目の候補代表色におけるCbの成分をC’(n)_b、n番目の候補代表色におけるCrの成分をC’(n)_rと表すことにする。図14は、候補代表色C’(n)の抽出方法を説明する図である。図14において、点線で示される格子線1400は、予め設定されたエリアを示しており、各エリアには1つの代表値(Cb,Cr)が設定されているものとする。エリアのサイズは任意であるが、サイズが小さければ精度が上がる一方で処理効率が悪くなるので、そのトレードオフを考慮して設定される。
YCbCrがそれぞれ8bitで表されるとして、本実施例では、エリアの縦横の幅を3bitに設定することにする。ここで、各エリアをCb−Cr方向に走査し、エリア内のプロット数の最大値を取得する。いま、上述のプロット群1201を含む第1エリア1401と、上述のプロット群1202を含む第2エリア1402があり、第2エリア1402で最大プロット数が得られるので、△のマーク1403で示される候補代表色(Cb,Cr)が得られることになる。なお、図14における、第1エリア1401及び第2エリア1402は、説明の便宜上、格子線1400で示される各エリアよりも一回り大きな矩形で示している。ここでは、最大プロット数から候補代表色を決定しているが、プロット群1201及び1202から、候補代表色を改めて算出してもよい。
図13のフローチャートの説明に戻る。
ステップ1302において、代表色設定部104は、処理対象の文字領域が反転文字領域であるか否かを判定する。文字領域が反転文字領域である場合は、ステップ1303に進む。一方、文字領域が反転文字領域でない場合は、ステップ1304に進む。処理対象の文字領域が図7の反転文字領域701である場合は、ステップ1303に進むことになる。
ステップ1303において、代表色設定部104は、ステップ1301で抽出した候補代表色C’(n)の調整を行う。具体的には、文字色を強調して視認性を上げるのか、入力画像における文字本来の色を保持して入力画像との差分を小さくするのかのバランスをとるための補正処理を行う。この補正処理は、ステップ1301で抽出された候補代表色が、例えば白であるはずの文字部が滲んでしまったために誤って抽出されている可能性や、強調処理によって元の多値画像における色との差が大きくなり違和感が出る可能性などを考慮して行なうものである。図15は、候補代表色補正処理の詳細を示すフローチャートである。
ステップ1501において、代表色設定部104は、処理対象の文字領域における単位文字の数を表す変数(単位文字数)mを初期化する。具体的には、m=1に設定する。
ステップ1502において、代表色設定部104は、文字の画素数をカウントする変数(累計画素数)Sを初期化する。具体的には、S=0に設定する。
ステップ1503において、代表色設定部104は、単位文字数mの値が、M以下であるか否かを判定する。ここで、Mは、処理対象の文字領域における単位文字の総数である。単位文字数mの値がM以下である場合は、未処理の単位文字が存在することを意味するので、ステップ1504に進む。一方、単位文字数mの値がMより大きい場合は、文字領域内のすべての単位文字が処理されたことを意味するので、ステップ1508に進む。例えば、図7の文字領域701であれば、M=74である。そして、単位文字数mの値が1〜74の時はステップ1504に進み、単位文字数mの値が75になった時点でステップ1508に進むことになる。
ステップ1504において、代表色設定部104は、ステップ1301で抽出された候補代表色C’(n)と、単位文字の平均色C_ave(m)との色空間上の距離Dを導出する。具体的には、以下の式(2)によって、距離Dを算出する。
ステップ1505において、代表色設定部104は、求めた距離Dと予め設定された閾値vとを比較し、求めた距離Dが閾値v以下であるか否かを判定する。ここで、閾値vは、単位文字の平均色C_ave(m)が候補代表色C’(n)の近似色であるか否かを判定するための閾値であり、任意の値が設定される。求めた距離Dが閾値v以下(つまり、単位文字の平均色C_ave(m)が候補代表色C’(n)の近似色であるとみなせる場合)であれば、ステップ1506に進む。一方、求めた距離Dが閾値vより大きい場合はステップ1507に進む。
ステップ1506において、代表色設定部104は、累計画素数Sに単位文字の画素数S(m)を加算する。各単位文字の画素数は、文字領域情報や部分2値画像を参照することで取得できる。
ステップ1507において、代表色設定部104は、単位文字数mをインクリメント(+1)し、ステップ1503に戻る。
ステップ1508において、代表色設定部104は、候補代表色と近似しているとみなせる平均色C_ave(m)を有する単位文字の総画素数(累計画素数S)に基づき、候補代表色を補正する。具体的には、以下の式(3)で表される補正係数αを、候補代表色C’(n)の各成分C’(n)_bとC’(n)_rとにそれぞれ乗算することにより、候補代表色を補正する。
上記式(3)において、「Sth)は定数であり、Sth≧累計画素数Sである。また、αの範囲は、0<α≦1.0であるものとする。なお、上記補正係数αは、以下のような設計思想に基づき設定されている。
候補代表色と近似しているとみなせる平均色C_ave(m)を持つ単位文字の画素数が多ければ(累計画素数Sの値が大きい場合)、当該単位文字は、入力画像に占める割合が大きい文字であると考えられる。このような単位文字に対し、可読性が高まるような補正(所定の色としての白に近くなるような大きな補正)を掛けた代表色を割り当てると、入力画像との見た目の差が大きくなり違和感がある。よって、候補代表色と近似しているとみなせる平均色C_ave(m)を持つ単位文字の総画素数が多い場合は、候補代表色を所定の色(白)に補正する度合いが低くなるような補正係数とする。
逆に、候補代表色と近似しているとみなせる平均色C_ave(m)を持つ単位文字の画素数が少なければ(累計画素数Sの値が小さい場合)、当該単位文字は、入力画像に占める割合が小さい文字であると考えられる。この場合は、入力画像との見た目の差よりも可読性を優先し、候補代表色を所定の色(白)に補正する度合いが大きくなるような補正係数とする。このように補正係数αを設定することで、「入力画像との色差分」と「可読性」のバランスがとれた代表色の抽出が可能となる。例えば、薄い黄色の反転文字領域205の色情報をプロットした結果であるプロット群1202(前述の図12を参照)は、該当する単位文字の総画素数が多いため、元の色である薄い黄色ができるだけ保持されるような補正係数αが設定されることになる。また、白の反転文字領域204の色情報をプロットした結果であるプロット群1201(前述の図12を参照)は、該当する単位文字の総画素数が少ないため、候補代表色が所定の色(白)に近くなるような補正係数αが設定されることになる。
なお、補正係数αは上述の例に限定されるものではなく、例えば、単位文字の数を用いて定義されるものであってもよい。この場合の、補正係数αは以下の式(4)で表されることになる。
上記式(4)において、「cnt」は処理対象の文字領域内で候補代表色に近似しているとみなせる平均色C_ave(m)を持つ単位文字の累計数を表す変数である。「cnt_th」は定数であり、cnt_th≧累計数cntである。また、上記式(3)と同様、αの範囲は、0<α≦1.0であるものとする。これにより、補正係数をより簡便に設定することができる。
以上が、候補代表色抽出処理(候補代表色補正処理を含む)の内容である。
図13のフローチャートの説明に戻る。
<代表色割当処理>
ステップ1304において、代表色設定部104は、単位文字数mを初期化する。具体的には、m=1に設定する。
ステップ1305にて、代表色設定部104は、単位文字数mの値が、M以下であるか否かを判定する。上述のとおり、Mは、処理対象の文字領域における単位文字の総数である。単位文字数mの値がM以下である場合は未処理の単位文字が存在することを意味するので、ステップ1306に進む。一方、単位文字数mの値がMより大きい場合は、本処理を終了する。
ステップ1306において、代表色設定部104は、処理対象の単位文字の代表色C_q(m)が未決定であるか否かを判定する。未決定である場合は、ステップ1307に進む。一方、既に決定されている場合は、ステップ1311に進む。処理開始直後の段階では、どの単位文字についても代表色C_q(m)が割り当てられていないため、未決定であると判定されてステップ1307へ進むことになる。
ステップ1307において、代表色設定部104は、候補代表色C’(n)と、単位文字の平均色C_ave(m)との色空間上の距離Dを、上述の式(2)を用いて導出する。この場合において、処理対象の文字領域が反転文字領域であるときは、本ステップにおけるC’(n)は、上述のステップ1303で補正されたC’(n)となる。
ステップ1308において、代表色設定部104は、求めた距離Dと予め設定された閾値vとを比較し、求めた距離Dが閾値v以下であるか否かを判定する。求めた距離Dが閾値v以下(つまり、単位文字の平均色C_ave(m)が、候補代表色C’(n)の近似色であるとみなせる場合)であれば、ステップ1309に進む。一方、求めた距離Dが閾値vより大きい場合はステップ1310に進む。
ステップ1309において、代表色設定部104は、候補代表色C’(n)を、処理対象の単位文字の代表色C_q(m)として割り当てる。すなわち、C’(n)_bをC_q(m)_bに代入し、C’(n)_rをC_q(m)_rに代入する。
ステップ1310において、代表色設定部104は、単位文字数mをインクリメント(+1)し、ステップ1305に戻る。
例えば、文字領域701が処理対象である場合は、第1色目の候補代表色C’(n)として薄い黄色に近い色が抽出される(ステップ1301)。そのため、そのルーチンでは、文字領域701のうち1行目の単位文字については距離Dが閾値vより大きいと判定され(ステップ1308でNo)、当該候補代表色C’(n)が代表色として設定されることはない(ステップ1309を経ずにステップ1310に進む)。一方、文字領域701のうち2行目〜9行目の単位文字については、距離Dが閾値v以下であると判定され(ステップ1308でYes)、当該候補代表色C’(n)が代表色として設定されることになる(ステップ1309)。
そして、第2色目の候補代表色C’(n)として白に近い色が抽出される(ステップ1301)。そのため、そのルーチンでは、文字領域701のうち1行目の単位文字については距離Dが閾値v以下であると判定され(ステップ1308でYes)、当該候補代表色C’(n)が代表色として設定されることになる(ステップ1309)。一方、文字領域701のうち2行目〜9行目の単位文字については、距離Dが閾値vより大きいと判定され(ステップ1308でNo)、当該候補代表色C’(n)が代表色として設定されることはない(ステップ1309を経ずにステップ1310に進む)。
以上が、代表色割当処理の内容である。
なお、2次元ヒストグラムから代表色を求める場合、得られる代表色は輝度成分Yを持たないため、文字領域内の同一の代表色をもつ単位文字間で輝度成分Yを求める必要がある。具体的には、文字領域内で同じ代表色C_q(m)が割り当てられた複数の単位文字の画素に対応する、多値画像の画素のRGB色情報の平均値に基づき、前述の式(1)を用いて輝度Yを求める。さらに、代表色のRGB情報を必要とする場合は、YCbCrからRGBへの色空間変換を行う。
次に、文字領域穴埋め部105における文字領域穴埋め処理について説明する。文字領域穴埋め処理は、入力された多値画像中の文字にあたる画素を周りの背景色で塗りつぶす処理であり、これにより、後のJPEG圧縮における圧縮率が向上する。図16は、文字領域穴埋め処理の流れを示すフローチャートである。なお、以下で述べる内容は、ハードディスク等に格納されたプログラムがRAMに読み出され、これをCPUが実行することにより実現される。
ステップ1601において、文字領域穴埋め部105は、処理対象とする文字領域を決定する。
ステップ1602において、文字領域穴埋め部105は、処理対象の文字領域内の背景色を抽出する。具体的には、当該文字領域に対応する部分2値画像における白画素位置に対応する多値画像上の色を参照してその平均値を求め、得られた平均値をその文字領域内の背景色として抽出する。部分2値画像と多値画像の座標対応の方法は、代表色設定部104で説明したので、ここでは説明を省略する。
ステップ1603において、文字領域穴埋め部105は、抽出された背景色を用いて、処理対象の文字領域を穴埋めする。具体的には、抽出された背景色を、多値画像の文字領域に割り当てる。
ステップ1604において、文字領域穴埋め部105は、未処理の文字領域の有無を判定する。未処理の文字領域があれば、ステップ1601に戻り、次の文字領域を処理対象の文字領域に決定して、ステップ1602〜ステップ1604の処理を繰り返す。一方、すべての文字領域についての処理が完了している場合は、本処理を終了する。
以上が、文字領域穴埋め処理の内容である。
続いて、上述のような画像圧縮装置で生成された圧縮データを伸張する、画像伸長装置について説明する。図17は、本実施例に係る、画像伸張装置としての画像処理装置の内部構成を示す機能ブロック図である。画像伸張装置1700は、第1伸張部1701、第2伸張部1702、及び合成部1703で構成される。
第1伸長部1701は、入力された圧縮データのうちMMR圧縮コードに対してMMR伸長処理を行い、2値画像を生成する。
第2伸長部1702は、入力された圧縮データのうちJPEG圧縮コードに対してJPEG伸長処理を行い、多値画像を生成する。
合成部1703は、第1伸張部1701から受け取った2値画像と第2の伸張部1702から受け取った多値画像とに基づき、入力された圧縮データに含まれる文字領域情報と文字代表色情報を参照して、最終的な復元画像である伸張画像を生成する。具体的には、各文字領域における代表色を2値画像中の対応する単位文字の各黒画素に割り当て、代表色が割り当てられた2値画像を、多値画像の上に重ね合わせて合成する。この合成の際、2値画像の白画素は多値画像を透過する。
このようにして、画像圧縮装置により生成された圧縮データが復元され、伸長画像が得られる。
以上説明したように、本実施例によれば、反転文字領域に対して文字色を強調し視認性を高めることと、圧縮画像と復元画像との見た目の差分を小さくすることとのバランスをとることが可能になる。
また、入力画像の画質(特に、反転文字領域の画質)を良好に維持した復元画像を再現することができる。
次に、候補代表色の調整処理において、補正係数αの設定に単位文字の外接矩形の情報を用いる態様を、実施例2として説明する。なお、実施例1と共通する内容についてはその説明を省略し、以下では実施例1との差異点を中心に説明するものとする。
図18は、本実施例に係る、スキャナ等で読み取られた多値画像を圧縮する画像圧縮装置としての画像処理装置の内部構成を示す機能ブロック図である。画像圧縮装置100は、2値化部101、文字領域特定部102、単位文字特定部103、特徴別文字領域特定部1801、代表色設定部104、文字領域穴埋め部105、第1圧縮部106、第2圧縮部107で構成される。特徴別文字領域特定部1801が追加されている他は、実施例1に係る図1で示した内部構成と同じである。
特徴別文字領域特定部1801は、単位文字特定部103で特定された各単位文字の特徴に基づいて、特徴別に文字領域を再設定する。ここで、単位文字の特徴としては、単位文字に外接する矩形の高さや幅などの情報、フォントの種類など文字フォントに関する情報が挙げられる。この場合において、フォントは別途認識モジュールを用いて識別するようにしてもよい。これら特徴別に再設定された文字領域を特定する情報(その特徴を示す情報を含む。以下、特徴別文字領域情報)は、文字領域情報に追加される。図19は、特徴別に再設定された文字領域の一例を示す図である。前述の図7で示した文字領域(反転文字領域)702が単位文字の外接矩形の高さの違いにより、特徴別文字領域1901と1902に分割されている。同様に、前述の図7で示した文字領域703が単位文字のフォントの違いにより、特徴別文字領域1903と1904とに分割されている。なお、特徴別文字領域1905は、文字領域701にそのまま対応している。
図20は、本実施例に係る、候補代表色補正処理の詳細を示すフローチャートであり、実施例1における図15のフローチャートに対応している。
ステップ2001において、代表色設定部104は、図15のステップ1501と同様、処理対象の文字領域における単位文字の数を示す変数(単位文字数)mを初期化する。具体的には、m=1に設定する。
ステップ2002において、代表色設定部104は、単位文字の外接矩形の高さを表す変数H、単位文字の外接矩形の幅を表す変数W、候補代表色に近似しているとみなせる平均色C_ave(m)を有する単位文字をカウントする変数cnt、の3つの変数を初期化する。具体的には、H=W=cnt=0に設定する。
ステップ2003において、代表色設定部104は、図15のステップ1503と同様、単位文字数mの値が、M以下であるか否かを判定する。単位文字数mの値がM以下である場合は、ステップ2004に進む。一方、単位文字数mの値がMより大きい場合は、ステップ2008に進む。
ステップ2004において、代表色設定部104は、図15のステップ1504と同様、ステップ1301で抽出された候補代表色C’(n)と処理対象の単位文字の平均色C_ave(m)との色空間上の距離Dを求める。
ステップ2005において、代表色設定部104は、図15のステップ1505と同様、求めた距離Dと予め設定された閾値vとを比較し、求めた距離Dが閾値v以下であるか否かを判定する。求めた距離Dが閾値v以下(つまり、単位文字の平均色C_ave(m)が候補代表色C’(n)の近似色であるとみなせる場合)であれば、ステップ2006に進む。一方、求めた距離Dが閾値vより大きい場合はステップ2007に進む。
ステップ2006において、代表色設定部104は、候補代表色に近似しているとみなせる平均色C_ave(m)を有する単位文字の領域の高さH(m)及び幅W(m)を、H及びWにそれぞれ加算する。さらに、変数cntをインクリメント(+1)する。
ステップ2007において、代表色設定部104は、単位文字数mをインクリメント(+1)し、ステップ2003に戻る。
ステップ2008において、単位文字の外接矩形サイズの平均値S_boxを導出する。この平均値S_boxは、例えば、以下の式(5)で求められる。
S_box = (H/cnt) × (W/cnt) ・・・式(5)
ステップ2009において、代表色設定部104は、候補代表色と近似しているとみなせる単位文字の外接矩形の平均値S_boxに基づき、候補代表色を補正する。具体的には、以下の式(6)で表される補正係数αを、候補代表色C’(n)の各成分C’(n)_bとC’(n)_rとにそれぞれ乗算することにより、候補代表色を補正する。
上記式(6)において、「S_box_th」は定数であり、S_box_th≧Sである。また、αの範囲は、0<α≦1.0であるものとする。なお、上記補正係数αは、以下のような設計思想に基づき設定されている。
候補代表色と近似しているとみなせる平均色C_ave(m)を持つ単位文字における外接矩形サイズの平均値が大きければ、当該単位文字は、入力画像に占めるサイズが大きい文字であると考えられる。この場合は、このような単位文字に対し、可読性が高まるような補正(所定色(白)に近くなるような大きな補正)を掛けた代表色を割り当てると、入力画像との見た目の差が大きくなり違和感がある。よって、候補代表色と近似しているとみなせる単位文字における外接矩形サイズの平均値が大きい場合は、入力画像との見た目の差が小さくなるように、候補代表色を所定色(白)に補正する度合いが低くなるような補正係数とする。
逆に、候補代表色と近似しているとみなせる平均色C_ave(m)を持つ単位文字の外接矩形の平均が小さければ、当該単位文字は、入力画像に占めるサイズが小さい文字であると考えられる。この場合は、入力画像と見た目の差異よりも可読性を優先し、候補代表色を所定色(白)に補正する度合いが大きくなるような補正係数とする。このように補正係数αを設定することで、「入力画像との色差分」と「可読性」のバランスがとれた代表色の抽出が可能となる。例えば、色情報が薄い赤である文字領域202に対応する特徴別文字領域1901の外接矩形サイズは十分大きいため、元の色である薄い赤色が保持されるような補正係数αが設定されることになる。これに対し、色情報が同じく薄い赤である文字領域203に対応する特徴別文字領域1902の外接矩形サイズは小さいため、可読性を優先し、候補代表色が所定色(白)に近くなるような補正係数αが設定されることになる。
以上が、本実施例に係る、候補代表色補正処理の内容である。
本実施例によれば、原稿上で目立つ大きい文字に対しては元の文字色をできる限り保持した文字代表色を設定することで、文字色を強調して視認性を高めることと、入力画像と復元画像と間の見た目の差を小さくすることとのバランスを取ることが可能になる。
なお、本実施例では、すべての単位文字を区別することなく扱っていたが、ピリオドやカンマとアルファベットの大文字とでは、外接矩形のサイズが大きく異なる。そこで、各単位文字に対し別途文字認識処理を行うようにし、所定の認識結果(例えば、ピリオドやカンマと判定された文字)については、上述のステップ2006における加算処理の対象外として扱うようにしてもよい。
次に、単位文字のフォント情報を用いて候補代表色の補正を制御する態様について、実施例3として説明する。なお、実施例1及び2と共通する内容についてはその説明を省略し、以下では実施例1との差異点を中心に説明するものとする。
図21は、本実施例に係る、候補代表色補正処理の流れを示すフローチャートである。
ステップ2101において、代表色設定部104は、処理対象の文字領域についての文字領域情報を取得する。前述のとおり、ここで取得する文字領域情報には上述の特徴別文字領域情報が含まれており、単位文字の特徴の1つとして、単位文字のフォントに関する情報が含まれている。
ステップ2102において、代表色設定部104は、取得した特徴別文字領域情報に含まれるフォントに関する情報に基づき、処理対象の単位文字のフォントがボールド体かどうかを判定する。単位文字のフォントがボールド体ではない場合は、ステップ2103に進む。一方、単位文字のフォントがボールド体である場合は、本処理を抜ける。
ステップ2103において、代表色設定部104は、候補代表色を補正係数αで補正する。この場合の補正係数αは任意の定数とし、その範囲は0<α≦1.0とする。
以上が、本実施例に係る、候補代表色補正処理の内容である。なお、本実施例における候補代表色補正処理は、以下のような設計思想に基づいている。
ボールド体で表現される文字は入力画像の中で目立つ文字であるため、入力画像との見た目の差を小さくすることを優先し、補正係数αを用いた補正を行わない(候補代表色をそのまま使用する)。
一方、ボールド体ではない通常のフォントで表現される文字については入力画像の中でそれほど目立たないため、可読性を優先し、例えば背景の色が滲んで回り込んでしまった文字が見やすくなるような補正係数を用いて、候補代表色を白に近い所定の色に補正する。
なお、補正係数αは、フォントの種類毎に設定してもよい。
本実施例によれば、原稿上で目立つように強調したフォントの文字については、元の文字色が維持されるような代表色を設定することが可能になる。
<変形例>
上記実施例の変形例として、候補代表色を決定するのに用いた多値画像の情報(より詳細には解像度の情報)を用いてもよい。この際は、以下のような設計思想に基づいて、候補代表色補正処理を設計すればよい。
解像度が高ければ、多値画像は本来の元の文字色を保持していると考えられるので、フォントがボールド体であった場合と同様、候補代表色をそのまま単位文字の代表色に割り当てるようにする。
一方、解像度が低ければ、文字に背景の色が滲んで回り込んでいるケースが多いと考えられるので、フォントがボールド体でなかった場合と同様、候補代表色を白に近い所定の色に補正する。
以上、本実施例によれば、より簡便に候補代表色の補正係数の設定が可能になる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (7)

  1. 多値画像内の複数の文字領域と、当該複数の文字領域それぞれに含まれる複数の文字とを特定する特定手段と、
    前記特定された複数の文字領域の1つを処理対象の文字領域として、当該処理対象の文字領域が反転文字領域であるか判定する判定手段と、
    前記処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の前記多値画像における色に基づいて複数の代表色を抽出し、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、当該抽出した複数の代表色のいずれかを割り当てる設定手段と、
    を備え、
    前記設定手段は、前記判定手段において前記処理対象の文字領域が反転文字領域であると判定された場合、当該処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の色に基づいて複数の代表色を抽出し、前記抽出された複数の代表色それぞれに対して設定される補正係数を用いて前記抽出された複数の代表色それぞれの補正を行い、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、各文字を構成する画素の平均色に近い当該補正後の代表色のいずれかを割り当てるものであり、
    前記抽出された複数の代表色それぞれに対して設定される前記補正係数は、その代表色に近似しているとみなせる平均色を有する文字の総画素数が多いほど、その代表色が白に近づくように補正される度合いが低くなる補正係数である
    ことを特徴とする画像処理装置。
  2. 多値画像内の複数の文字領域と、当該複数の文字領域それぞれに含まれる複数の文字とを特定する特定手段と、
    前記特定された複数の文字領域の1つを処理対象の文字領域として、当該処理対象の文字領域が反転文字領域であるか判定する判定手段と、
    前記処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の前記多値画像における色に基づいて複数の代表色を抽出し、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、当該抽出した複数の代表色のいずれかを割り当てる設定手段と、
    を備え、
    前記設定手段は、前記判定手段において前記処理対象の文字領域が反転文字領域であると判定された場合、当該処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の色に基づいて複数の代表色を抽出し、前記抽出された複数の代表色それぞれに対して設定される補正係数を用いて前記抽出された複数の代表色それぞれの補正を行い、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、各文字を構成する画素の平均色に近い当該補正後の代表色のいずれかを割り当てるものであり、
    前記抽出された複数の代表色それぞれについて設定される補正係数は、その代表色に近似しているとみなせる平均色を有する文字の数が多いほど、その代表色が白に近づくように補正される度合いが低くなる補正係数である、
    ことを特徴とする画像処理装置。
  3. 前記設定手段は、前記判定手段において前記処理対象の文字領域が反転文字領域でないと判定された場合、当該処理対象の文字領域に含まれる複数の文字それぞれに対して割り当てられる前記代表色を補正しないことを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記代表色に近似しているとみなせる平均色を有する文字は、前記代表色と前記特定された文字の平均色との色空間上の距離を用いて判定されることを特徴とする請求項1または2に記載の画像処理装置。
  5. 多値画像内の複数の文字領域と、当該複数の文字領域それぞれに含まれる複数の文字とを特定するステップと、
    前記特定された複数の文字領域の1つを処理対象の文字領域として、当該処理対象の文字領域が反転文字領域であるか判定するステップと、
    前記処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の前記多値画像における色に基づいて複数の代表色を抽出し、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、当該抽出した複数の代表色のいずれかを割り当てるステップと、
    を含み、
    前記割り当てるステップでは、前記判定するステップにて前記処理対象の文字領域が反転文字領域であると判定された場合、当該処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の色に基づいて複数の代表色を抽出し、前記抽出された複数の代表色それぞれに対して設定される補正係数を用いて前記抽出された複数の代表色それぞれの補正を行い、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、各文字を構成する画素の平均色に近い当該補正後の代表色のいずれかを割り当てる処理がなされ、
    前記抽出された複数の代表色それぞれに対して設定される前記補正係数は、その代表色に近似しているとみなせる平均色を有する文字の総画素数が多いほど、その代表色が白に近づくように補正される度合いが低くなる補正係数である
    ことを特徴とする画像処理方法。
  6. 多値画像内の複数の文字領域と、当該複数の文字領域それぞれに含まれる複数の文字とを特定するステップと、
    前記特定された複数の文字領域の1つを処理対象の文字領域として、当該処理対象の文字領域が反転文字領域であるか判定するステップと、
    前記処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の前記多値画像における色に基づいて複数の代表色を抽出し、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、当該抽出した複数の代表色のいずれかを割り当てるステップと、
    を含み、
    前記割り当てるステップでは、前記判定するステップにて前記処理対象の文字領域が反転文字領域であると判定された場合、当該処理対象の文字領域に含まれる前記特定された複数の文字を構成する画素の色に基づいて複数の代表色を抽出し、前記抽出された複数の代表色それぞれに対して設定される補正係数を用いて前記抽出された複数の代表色それぞれの補正を行い、当該処理対象の文字領域に含まれる複数の文字それぞれに対して、各文字を構成する画素の平均色に近い当該補正後の代表色のいずれかを割り当てる処理がなされ、
    前記抽出された複数の代表色それぞれについて設定される補正係数は、その代表色に近似しているとみなせる平均色を有する文字の数が多いほど、その代表色が白に近づくように補正される度合いが低くなる補正係数である、
    ことを特徴とする画像処理方法。
  7. コンピュータを、請求項1乃至のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
JP2014076079A 2014-04-02 2014-04-02 画像処理装置、画像処理方法及びプログラム。 Active JP6370080B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014076079A JP6370080B2 (ja) 2014-04-02 2014-04-02 画像処理装置、画像処理方法及びプログラム。
US14/669,972 US9438767B2 (en) 2014-04-02 2015-03-26 Image processing apparatus, image processing method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014076079A JP6370080B2 (ja) 2014-04-02 2014-04-02 画像処理装置、画像処理方法及びプログラム。

Publications (3)

Publication Number Publication Date
JP2015198385A JP2015198385A (ja) 2015-11-09
JP2015198385A5 JP2015198385A5 (ja) 2017-05-25
JP6370080B2 true JP6370080B2 (ja) 2018-08-08

Family

ID=54210848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014076079A Active JP6370080B2 (ja) 2014-04-02 2014-04-02 画像処理装置、画像処理方法及びプログラム。

Country Status (2)

Country Link
US (1) US9438767B2 (ja)
JP (1) JP6370080B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426530B (zh) * 2015-12-15 2017-05-10 徐庆 一种商标检索方法、装置和系统
JP6958096B2 (ja) * 2017-08-10 2021-11-02 富士フイルムビジネスイノベーション株式会社 情報処理装置、及びプログラム
JP7067262B2 (ja) * 2018-05-21 2022-05-16 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP7362405B2 (ja) * 2019-10-09 2023-10-17 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956421A (en) 1996-02-28 1999-09-21 Canon Kabushiki Kaisha Image processing method and apparatus for determining a binarization threshold value used for binarizing a multi-valued image and performing binarization processing
JP4047192B2 (ja) * 2003-02-24 2008-02-13 キヤノン株式会社 画像圧縮装置及び方法、画像伸張装置及び方法、プログラム
JP4250483B2 (ja) 2003-08-25 2009-04-08 キヤノン株式会社 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
TWI245557B (en) * 2003-09-11 2005-12-11 Matsushita Electric Ind Co Ltd Image compensation apparatus and method for the same
EP1555804A3 (en) * 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
JP4424309B2 (ja) * 2006-01-23 2010-03-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、文字判定プログラム、および文字判定方法
US8484579B2 (en) * 2007-03-27 2013-07-09 Canon Kabushiki Kaisha Information processing apparatus and information processing method
JP4590433B2 (ja) * 2007-06-29 2010-12-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP4442651B2 (ja) * 2007-07-05 2010-03-31 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置およびプログラム
CN101878214A (zh) * 2007-11-30 2010-11-03 普渡制药公司 苯并吗啡烷化合物
JP5063422B2 (ja) * 2008-03-14 2012-10-31 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5121599B2 (ja) * 2008-06-30 2013-01-16 キヤノン株式会社 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP5049922B2 (ja) * 2008-08-26 2012-10-17 キヤノン株式会社 画像処理装置及び画像処理方法
JP5049920B2 (ja) * 2008-08-26 2012-10-17 キヤノン株式会社 画像処理装置及び画像処理方法
JP5328510B2 (ja) * 2009-06-24 2013-10-30 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
TWI495968B (zh) * 2009-09-04 2015-08-11 Ricoh Co Ltd Toner container and image forming device
JP5321420B2 (ja) * 2009-11-16 2013-10-23 コニカミノルタ株式会社 画像形成装置及び画像形成システム
JP5685895B2 (ja) * 2009-12-11 2015-03-18 株式会社リコー 画像処理装置、画像処理方法およびプログラム
JP2011188367A (ja) * 2010-03-10 2011-09-22 Ricoh Co Ltd 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体
JP5287838B2 (ja) * 2010-03-16 2013-09-11 株式会社デンソー 表示位置設定装置
JP5230705B2 (ja) * 2010-09-10 2013-07-10 株式会社沖データ 画像処理装置
JP5645612B2 (ja) * 2010-11-09 2014-12-24 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP5153857B2 (ja) * 2010-11-25 2013-02-27 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP5631362B2 (ja) * 2011-08-08 2014-11-26 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP5547226B2 (ja) * 2012-03-16 2014-07-09 株式会社東芝 画像処理装置、及び画像処理方法

Also Published As

Publication number Publication date
US9438767B2 (en) 2016-09-06
JP2015198385A (ja) 2015-11-09
US20150288853A1 (en) 2015-10-08

Similar Documents

Publication Publication Date Title
JP5875637B2 (ja) 画像処理装置、画像処理方法
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
US6999619B2 (en) Processing for accurate reproduction of symbols and other high-frequency areas in a color image
US8077986B2 (en) Information processing apparatus, method of controlling same and computer program
US20040165782A1 (en) Image processing apparatus
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
US10523843B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP6370080B2 (ja) 画像処理装置、画像処理方法及びプログラム。
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US8971647B2 (en) Image compression apparatus, image compression method, and storage medium
US10931852B2 (en) Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region
US7724981B2 (en) Adaptive contrast control systems and methods
JP4182891B2 (ja) 画像処理装置
JP4217969B2 (ja) 画像処理装置及びプログラム
JP4259310B2 (ja) 画像処理装置及びプログラム
JP7362405B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP4228905B2 (ja) 画像処理装置及びプログラム
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP2012231261A (ja) 画像処理装置およびその制御方法
JP4193687B2 (ja) 画像処理装置及びプログラム
JP4311183B2 (ja) 画像処理装置及びプログラム
JP2005269269A (ja) 画像処理装置
JP2024080365A (ja) 画像処理装置、その制御方法およびプログラム
JP2005175643A (ja) 画像処理装置
JP2005236697A (ja) 画像処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170403

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180612

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180710

R151 Written notification of patent or utility model registration

Ref document number: 6370080

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151