[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5206503B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP5206503B2
JP5206503B2 JP2009048812A JP2009048812A JP5206503B2 JP 5206503 B2 JP5206503 B2 JP 5206503B2 JP 2009048812 A JP2009048812 A JP 2009048812A JP 2009048812 A JP2009048812 A JP 2009048812A JP 5206503 B2 JP5206503 B2 JP 5206503B2
Authority
JP
Japan
Prior art keywords
image
pixel
character
color
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009048812A
Other languages
English (en)
Other versions
JP2010206438A (ja
Inventor
一憲 宋
俊一 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2009048812A priority Critical patent/JP5206503B2/ja
Priority to US12/511,741 priority patent/US8320673B2/en
Priority to CN200910167112.5A priority patent/CN101827191B/zh
Publication of JP2010206438A publication Critical patent/JP2010206438A/ja
Application granted granted Critical
Publication of JP5206503B2 publication Critical patent/JP5206503B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/58Edge or detail enhancement; Noise or error suppression, e.g. colour misregistration correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
カラースキャンされた画像は、数十Mバイトにもなり、蓄積や伝送には適さないことから、文字・線画等からなる画素塊は色情報等を持った2値画像としてMMR(Modified Modified READ)などの可逆圧縮を行い、グラフィクスや自然画像は多値画像のままJPEG(Joint Photographic Experts Group)圧縮を行うことが行われている。そして、それを再現する場合に、JPEGの伸張画像上に、伸張された文字・線画等を付帯している色情報で貼付ける方式が提案されている。
このとき、例えば、画像中の文字については、スキャナの読み込みによるMTF(Modulation Transfer Function)の劣化やスキャン直後のJPEG圧縮等の影響から、文字の周辺部分の色が変更されることが生じる。より具体的な例として、文字周辺がぼけたり、背景色と文字色とがにじんだり、JPEG圧縮のパラメータによっては文字色が変わる画素が生じる。このような場合にあって、元の色を再現することが望まれている。
これに関連する技術として、例えば、特許文献1には、良好な復元画像を生成することでき、かつ圧縮対象の画像品位を低下させない画像圧縮を行うことができる画像圧縮装置、画像伸長装置及びそれらの方法、プログラムを提供することを課題とし、2値化部で多値画像を2値化し、2値画像中の文字領域の位置を領域特定部Aで特定し、領域特定部Bで、文字領域中の単位文字領域の位置を特定し、代表色部抽出部で、単位文字領域の位置情報と多値画像とに基づいて、単位文字領域の代表色を抽出し、文字領域穴埋め部で、文字領域の位置情報に基づいて、文字領域をその周辺色で穴埋めし、縮小部で、穴埋め多値画像を縮小し、JPEG圧縮部で、縮小多値画像を圧縮し、MMR圧縮部で、文字領域に対応する部分2値画像を圧縮し、位置情報と、各圧縮部で生成された圧縮コードと、単位文字領域の代表色情報を含む圧縮データを出力することが開示されている。
また、例えば、特許文献2には、カラー文書画像の背景部と文字部の境界エッジ部分などの領域分割の誤りを減らし、文字抽出などの精度を上げることを課題とし、画像入力部よりカラー画像を入力し、その使用色を使用色特定部で特定し、特定された使用色別の領域を領域作成部で作成する。領域色補正部で、着目した領域に割り当てられた使用色と、着目領域の近接領域に割り当てられた使用色との色空間上での位置関係に基づいて、着目領域に対する使用色の割り当てを補正し、文字抽出部で、使用色別領域の情報を利用してカラー画像中の文字を抽出することが開示されている。
また、例えば、特許文献3には、第1の色で表現される文字が第2,第3の色で表現される模様に重ねて印刷されているような3色印刷物より、文字だけを容易に抽出できるようにすることを最も主要な特徴とし、データ入力回路より入力される、被読取物の地色及び消去すべき第1、第2の模様のRGB値を基にCPUが濃度変換を行うためのパラメータを算出し、この算出されたパラメータを、予めルックアップテーブル回路に書き込んでおき、このパラメータにしたがって被読取物より収集された画像信号を文字だけが抽出された濃淡画像に変換し、さらに、これを二値化回路で二値画像に変換して出力する構成となっていることが開示されている。
また、例えば、特許文献4には、文字の色を容易かつ高精度に検出することを課題とし、MFPは、カラー画像から文字が表された文字属性の文字領域を抽出する文字領域抽出部と、文字領域に含まれる文字を細線化する細線化部と、細線化された文字を構成する複数の文字中心画素に対応するカラー画像の画素の色に基づいて、文字色を決定する文字色決定部と、カラー画像を2値化することによって、2値画像に変換するノイズ除去部と、2値画像の文字領域を符号化し、符号データを生成する文字領域符号化部と、生成された符号データと、決定された文字色と、文字領域のカラー画像中の位置とを関連付ける統合部と、を備えることが開示されている。
また、例えば、特許文献5には、文字切り処理に色抽出結果をフィードバックし、多値画像の文字色及び文字領域情報の抽出を精度よく行うことを課題とし、カラー画像より文字領域の二値画像を生成する文字領域画像作成手段と、前記文字領域の二値画像に対し文字矩形を作成する文字切り手段と、前記文字矩形の単色判定を行う単色判定手段と、非単色の文字矩形が複数種の単色文字集合であることを判定する手段と、前記判定矩形内を文字切りする詳細文字切り手段を有する画像処理装置が開示されている。
また、例えば、特許文献6には、画像を高能率に符号化・復号化できる画像処理装置を提供することを目的とし、エッジ検出部で画像中のエッジが検出され、第一色検出部で所定の色の検出が行われ、その結果を入力する第一色文字抽出部で色文字の骨格部分が抽出され、そして、色文字として検出された画素の周囲の色が第二色検出部で調べられ、第二色文字抽出部でその結果に応じて第一色文字抽出部で抽出された色文字の骨格に肉付けされた色文字が出力され、また細線検出部にてエッジ画素で所定の色の場合、色文字の細線部と判断され、合成部で第二色文字抽出部からの色文字と合成され、最終的に色文字として出力されることが開示されている。
また、例えば、特許文献7には、スキャナなどで入力した文字画像の表す文字の色を正確に判別することを課題とし、画像形成装置に、スキャンした入力画像に表れる文字の線図形の中央線及びその付近の領域である中央領域を、その入力画像の細線化画像を生成することによって検出する細線化画像生成部と、その中央領域を複数の文字色候補領域RCに分割する文字画像分割部と、小領域毎に、その小領域に属する画素の中から所定の条件に合う画素を近似色画素として検出する近似色画素選出部と、入力画像に表れる文字の色を各小領域の条件合致画素の色情報に基づいて判別する文字色決定部と、を設けることが開示されている。
特開2004−128880号公報 特開2000−357230号公報 特開平05−062013号公報 特開2008−099149号公報 特開2004−242075号公報 特開平05−130426号公報 特開2007−249774号公報
本発明は、色が変更されてしまった画素塊の色を変更される前の色に再現する場合に、その画素塊の中央部分のみで再現した場合に比べて、より忠実に再現するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、入力された第1の画像を2値化する2値化手段と、前記2値化手段によって2値化された第2の画像内の各画素が、該第2の画像内にある画素塊に属する画素、該画素塊の外周部分に属する画素、背景画像に属する画素のいずれに相当するかを判定する判定手段と、前記判定手段によって前記画素塊に属する画素及び該画素塊の外周部分に属する画素判定された画素についての前記第1の画像内の画素値の平均値画素塊に属する画素についての該第1の画像内の画素値の平均値に基づいて、画素塊の領域における画素値を算出する画素値算出手段を具備し、前記画素塊は、前記2値化画像内で同じ画素値である画素の連なりであり、前記画素値算出手段は、r*P1+(1−r)*P2を用いて、画素値を算出し、ただし、P1は前記画素塊と該画素塊の外周部分と判断された領域における前記第1の画像内の画素値の平均値であり、P2は該画素塊の領域における該第1の画像内の画素値の平均値であり、rは予め定められた値(0<r<1)であることを特徴とする画像処理装置である。
請求項の発明は、コンピュータを、入力された第1の画像を2値化する2値化手段と、前記2値化手段によって2値化された第2の画像内の各画素が、該第2の画像内にある画素塊に属する画素、該画素塊の外周部分に属する画素、背景画像に属する画素のいずれに相当するかを判定する判定手段と、前記判定手段によって前記画素塊に属する画素及び該画素塊の外周部分に属する画素判定された画素についての前記第1の画像内の画素値の平均値画素塊に属する画素についての該第1の画像内の画素値の平均値に基づいて、画素塊の領域における画素値を算出する画素値算出手段として機能させ、前記画素塊は、前記2値化画像内で同じ画素値である画素の連なりであり、前記画素値算出手段は、r*P1+(1−r)*P2を用いて、画素値を算出し、ただし、P1は前記画素塊と該画素塊の外周部分と判断された領域における前記第1の画像内の画素値の平均値であり、P2は該画素塊の領域における該第1の画像内の画素値の平均値であり、rは予め定められた値(0<r<1)であることを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、色が変更されてしまった画素塊の色を変更される前の色に再現する場合に、その画素塊の中央部分のみで再現した場合に比べて、より忠実な再現を行うことができる。そして、本構成を有していない場合に比較して、色変更の原因が変わってしまったときの調整の煩雑さを抑制することができる。
請求項の画像処理プログラムによれば、色が変更されてしまった画素塊の色を変更される前の色に再現する場合に、その画素塊の中央部分のみで再現した場合に比べて、より忠実な再現を行うことができる。そして、本構成を有していない場合に比較して、色変更の原因が変わってしまったときの調整の煩雑さを抑制することができる。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 画像圧縮の例を示す説明図である。 色変更が起きた画像の例を示す説明図である。 クラスタリングを用いた場合の文字色の抽出例を示す説明図である。 色変更が起きた画像の詳細例を示す説明図である。 文字色の抽出例を示す説明図である。 スキャナの読み取りによる画素値の変化例を示す説明図である。 文字色の算出例を示す説明図である。 第1の実施の形態による処理例を示すフローチャートである。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 対象とする文字画像の例を示す説明図である。 文字画像のR、G、B画像の例を示す説明図である。 2値画像の例を示す説明図である。 距離画像の例を示す説明図である。 第2の実施の形態による文字色の抽出例を示す説明図である。 第3の実施の形態の構成例についての概念的なモジュール構成図である。 ウィンドウの例を示す説明図である。 ラベル付け処理後の画像の例を示す説明図である。 第3の実施の形態による文字色の抽出例を示す説明図である。 第1〜3の実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
まず、図2から図8を用いて、本実施の形態を利用する技術について説明する。
なお、画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は一定間隔で切り出した画像領域等がある。
なお、1つの画素塊として、1文字の画像となる場合が多い。以下、画素塊を文字又は文字画像ともいう。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。
また、「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
図2は、画像圧縮の例を示す説明図である。
図2(a)の例に示す画像200は、スキャナによって読み込まれる画像であり、この画像には、赤色の文字画像と写真等の自然画像が含まれている。
この画像200に対して、背景技術で示した圧縮を施すと、図2(b)の例に示す文字画像部分210と図2(c)の例に示す背景画像220のようになる。
文字画像部分210は、文字画像211、文字画像属性212を有している。文字画像211はMMR等による可逆圧縮が施されている。そして、その文字画像211の色、文字画像211を背景画像220内のどこに配置するかを示す座標等によって構成されている文字画像属性212が文字画像211に付加されている。背景画像220はJPEG等による非可逆圧縮が施されている。
このような処理を行う場合、画像200内の文字については、MTFの劣化、スキャン直後に行われるJPEG圧縮等の影響から、図3の例に示すように、文字の周辺部分の色が変更されることが生じる。例えば、図3(a)の例に示す原画像300のような文字画像をスキャナで読み込み、JPEG圧縮が施されると、図3(b)の例に示す色変更画像310のようになる。この色変更画像310は、色が変更されてしまった周辺部320と色の変更が色変更画像310よりは比較的少ない中央部330とからなる。
この色変更画像310から、元の原画像300の色を抽出する技術がある。例えば、特許文献1、特許文献2、特許文献3に開示されている技術のように、クラスタリングによる文字色抽出方法がある。これは文字を構成する画素のRGB値をRGB空間上にプロットし(図4(a)の例参照)、クラスタリング処理によって各クラスターにわけ、クラスター毎に平均色又は中心色を算出して、文字色とする。図4(a)の例の丸印でプロットしているマークは図4(b)(図3(b)と同じ)の例に示す色変更画像310内の中央部330に対応するものであり、×印でプロットしているマークは色変更画像310内の周辺部320に対応するものである。
しかし、この文字色抽出方法によるクラスター毎の平均色又は中心色では、スキャナの読み取りによるMTF劣化やJPEG圧縮による文字周辺部の色変わりを除去することができない。
また、文字周辺の色変わりの影響を除去するために、以下の例に示すような技術がある。
(1)文字周辺の画素が色変わりすることを前提に、少なくとも1画素分を細線化処理で削って、残った文字画素から文字色を算出する(特許文献4参照)。
(2)文字に対して細線化処理を施して、文字の中心である幹部分の線幅1の線画像を取り出し、この線画像の画素から文字色を算出する(特許文献5、特許文献6、特許文献7参照)。
しかしこれらの技術では、文字周辺の色変わりの画素数はスキャナなどのMTFの特性によって変わるため、アルゴリズム上、細線化処理で削る画素数が変わってくる。さらに、色相の量子化数、ヒストグラムのしきい値など、いくつかのパラメータと連動して文字色を決める技術の場合、スキャナが変わるたびにパラメータを設計し直す必要がある(特許文献4参照)。
さらに、線幅が小さい文字では、文字周辺部分にも文字色を決める重要な情報がある。このため、かえって文字の幹部の方が、MTFの劣化やJPEG圧縮による影響を受けて色変わりが生じている場合もあり得る。図5は、色変更が起きた画像の詳細例を示す説明図である。スキャナで読み込まれた文字画像500を図5(a)の例に示し、その拡大画像である文字画像510を図5(b)の例に示す。文字画像510は、色変更の影響が少ない周辺部520、周辺部520よりも色が変更されている中央部530からなっていることがわかる。さらに、文字画像510の部分である領域540の拡大画像を図5(c)の例に示す。周辺部520、中央部530は、それぞれ1画素幅であり、線幅が小さい文字では、このような色変更が起こり得る。この場合に、中央部530のみを用いて文字色を決定すると、図6の例に示す色抽出用文字画像600のように、色が変更されている中央部530の色が採用されてしまう。
そもそもスキャナによる読み込みよるMTFの劣化やJPEG圧縮等による文字の周辺部分の色変更は、図7の例に示す文字の濃度プロファイルからわかるように、文字の周辺部分が緩やかになることから生じる。図7は、スキャナの読み取りによる画素値の変化例を示す説明図である。スキャン前文字画素値710が本来の文字色(一定の画素値を示している)であり、スキャナで読み取った後の文字の濃度プロファイルはスキャン後文字画素値720のようになる。スキャン後文字画素値720がスキャン前文字画素値710と相違する部分である周辺部分に色変更が生じていることがわかる。この緩やかな部分の傾きと幅がスキャナの解像度とMTF等の違いによって変化することになる。一般的な文書を読み込む場合の解像度200dpi(dot per inch)では、緩やかな傾きはスキャナ毎に固定でかつ幅は経験的に1画素未満である。また、スキャナの解像度を高い解像度にする場合は、この1画素を大きくすればよい。
そこで、元の文字色を算出する場合は、図8に示す例のように、対象画像800である文字全体(周辺部810と中央部820)の画素の平均値(P2)と、中央部820である文字内部の領域の画素の平均値(P1)と、予め定められた比率(r)を用いて、両者の情報を加味した文字色を算出する。例えば、式(1)を用いる。ただし、0<r<1である。
文字色=r*P1+(1−r)*P2 (1)
スキャナが変わらない場合(同一のスキャナであることの他に、その性質が同等であるスキャナの場合を含む)は、どの文字でも比率rは同じにでき、スキャナが変わった場合(そのスキャナではなく、その性質が異なるものである場合)は、この比率rだけを変更すればよい。したがって、対象とする画像に対しては、予め定められた比率rを用い、文字色変更の原因が変更された場合は、比率rを変更する。
また、文字サイズに応じて比率rを変更するようにしてもよい。例えば、文字サイズが大ならば比率rも大にし、文字サイズが小ならば比率rも小にしてもよい。
また、比率rは、濃度プロファイルを用いて算出するようにしてもよい。つまり、図7の例に示す濃度プロファイルで、MTFのため文字の画素値が変わったスキャン後文字画素値720で、文字画像の中央部の画素値(P1を計算するために用いた画素値)と文字画像全体の画素値(P2を計算するために用いた画素値)の積分値の比を取ればよい。また測色機を用いた測色データに基づいて算出してもよい。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。
第1の実施の形態である画像処理装置は、元の文字画像の色を算出するものであって、図1の例に示すように、2値化処理モジュール110、文字外周判定モジュール120、文字色算出モジュール130を有している。
2値化処理モジュール110は、文字外周判定モジュール120と接続されている。2値化処理モジュール110は、文字カラー画像データ151を受け付けて、その文字カラー画像データ151を2値化する。そして、2値画像152を文字外周判定モジュール120へ渡す。ここで行う2値化処理は、文字画像を抽出するものであれば、既存のものであってよい。
文字外周判定モジュール120は、2値化処理モジュール110、文字色算出モジュール130と接続されている。文字外周判定モジュール120は、2値化処理モジュール110によって2値化された2値画像152内にある文字画像における周辺部分であるか否かを判定する。そして、その判定結果153を文字色算出モジュール130へ渡す。判定結果153として、例えば、背景と外周画素と文字内部が区分できる3値以上のラベル画像がある。
文字色算出モジュール130は、文字外周判定モジュール120と接続されている。文字色算出モジュール130は、文字外周判定モジュール120によって周辺部分でないと判断された領域(文字画像における中央部分)の画素値と文字画像(その中央部分と周辺部分)の画素値に基づいて、その文字画像の文字色155(つまり、画素値)を算出する。例えば、文字外周判定モジュール120によって周辺部分でないと判断された領域の画素値の平均値と文字画像の画素値の平均値とその平均値のいずれかの割合を示す予め定められた文字色算出比率154に基づいて、その文字画像の画素値を算出する。例えば、前述の式(1)を用いる。文字色算出比率154は、文字色の算出にあたって、いずれの領域をどれだけ採用するかを示すものであり、前述(比率rの説明)したように決定すればよい。なお、判定結果153を用いて、文字画像における中央部分の領域であるか、文字画像の領域であるかを判定し、それぞれの画素値を文字カラー画像データ151から抽出して、文字画像における中央部分と文字画像全体の平均値を算出する。
図9は、第1の実施の形態による処理例を示すフローチャートである。
ステップS902では、2値化処理モジュール110が、文字カラー画像データ151を受け付ける。
ステップS904では、2値化処理モジュール110が、受け付けた文字カラー画像データ151に対して2値化処理する。
ステップS906では、文字外周判定モジュール120が、2値画像152から外周か否かの判定を行う。
ステップS908では、文字色算出モジュール130が、文字画像の中央部の画素値、文字画像全体の画素値、比率に基づいて、文字色を算出する。
ステップS910では、文字色算出モジュール130が、文字色155を出力する。
次に、第2の実施の形態について説明する。
図10は、第2の実施の形態の構成例についての概念的なモジュール構成図である。第2の実施の形態は、第1の実施の形態をより具体的にしたものである。なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第2の実施の形態は、図10の例に示すように、2値化処理モジュール110、距離変換モジュール1020、文字色算出モジュール1030を有している。
距離変換モジュール1020は、2値化処理モジュール110、文字色算出モジュール1030と接続されており、図1の例に示した文字外周判定モジュール120をより具体化したものである。距離変換モジュール1020は、文字画像における背景画像からの距離に基づいて、周辺部分であるか否かを判定する。
ここで、図11に示す文字画像1100を例として、第2の実施の形態による処理例を説明する。2値化処理モジュール110は、文字画像1100が含まれている文字カラー画像データ151を受け付ける。文字カラー画像データ151は、RGBで表された画像である。例えば、図11に示すように、文字画像1100の対象領域1110のRGBは、それぞれ図12の例に示すR画像1210、G画像1220、B画像1230のようになっている。2値化処理モジュール110は、これをそれぞれ2値化処理する。R画像1210を2値化処理した画像例を、図13の2値画像1300に示す。
距離変換モジュール1020は、2値画像152に対して、距離変換処理を行う。この距離変換処理は、図14の例に示すように、2値画像1300内で1の画素が0の画素からどのくらいの距離であるかを示す距離画像1400を生成する。より具体的には、距離変換処理は、スキャン走査を行いながら、0の画素からの距離(画素数)をカウントする。図14に示す例では、距離は4近傍距離としているが、8近傍距離としてもよい。
文字色算出モジュール1030は、各色RGB毎に、距離画像1053を参照して距離値1以上の画素に対応する画素(文字画像全体の画素。図15に示す例では周辺部1510(点が描かれている画素)と中央部1520(ハッチングが施されている画素))の平均値と、距離値2以上の画素に対応する画素(文字画像の中央部分にある画素。図15に示す例では中央部1520)の平均値をそれぞれ算出し、これらから文字色算出比率154を用いて、文字色155を算出する。例えば、前述の式(1)を用いる。
次に、第3の実施の形態について説明する。
図16は、第3の実施の形態の構成例についての概念的なモジュール構成図である。第3の実施の形態は、第1の実施の形態をより具体的にしたものである。なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第3の実施の形態は、図16の例に示すように、2値化処理モジュール110、ラベル画像生成モジュール1620、文字色算出モジュール1630を有している。
ラベル画像生成モジュール1620は、2値化処理モジュール110、文字色算出モジュール1630と接続されており、図1の例に示した文字外周判定モジュール120をより具体化したものである。ラベル画像生成モジュール1620は、文字画像と背景画像との境界を検出することによって、周辺部分であるか否かを判定する。
ここで、図11に示す文字画像1100を例として、第3の実施の形態による処理例を説明する。第2の実施の形態による処理と同じように、2値化処理モジュール110は、文字画像1100が含まれている文字カラー画像データ151を受け付け、図12の例に示すR画像1210、G画像1220、B画像1230をそれぞれ2値化処理して、例えば、R画像1210を図13の2値画像1300のように変換にする。
ラベル画像生成モジュール1620は、2値画像152に対して、ラベル付け処理を行う。このラベル付け処理は、図17の例に示すウィンドウ1700を用いて行う。つまり、3×3のウィンドウ1700を用いて、図18の例に示すラベル1800のように、注目画素(ウィンドウ1700内の×印の位置にある画素)が背景の場合はラベル値0を与え、注目画素が文字画素でウィンドウ内に背景が1画素でもあれば注目画素は周辺にある画素としてラベル値1を与え、注目画素が文字画素でウィンドウ内に背景が1画素もなければ注目画素は文字の内側にある画素としてラベル値2を与える。
文字色算出モジュール1630は、各色RGB毎に、ラベル画像1653を参照してラベル値1以上の画素に対応する画素(文字画像全体の画素。図19に示す例では周辺部1910(点が描かれている画素)と中央部1920(ハッチングが施されている画素))の平均値と、ラベル値2の画素に対応する画素(文字画像の中央部分にある画素。図19に示す例では中央部1920)の平均値をそれぞれ算出し、これらから文字色算出比率154を用いて、文字色155を算出する。例えば、前述の式(1)を用いる。
ここで仮に文字画像の周辺部分は1画素幅ではなく2画素幅の場合は、ウィンドウサイズを5×5とすればよい。つまり、スキャナの解像度に応じて、ウィンドウサイズを変更してもよい。
図20を参照して、前述の実施の形態の画像処理装置のハードウェア構成例について説明する。図20に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部2017と、プリンタなどのデータ出力部2018を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)2001は、前述の実施の形態において説明した各種のモジュール、すなわち、2値化処理モジュール110、文字外周判定モジュール120、文字色算出モジュール130、距離変換モジュール1020、ラベル画像生成モジュール1620等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)2002は、CPU2001が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)2003は、CPU2001の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス2004により相互に接続されている。
ホストバス2004は、ブリッジ2005を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス2006に接続されている。
キーボード2008、マウス等のポインティングデバイス2009は、操作者により操作される入力デバイスである。ディスプレイ2010は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)2011は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU2001によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けた画像、2値画像、判定した文字色の結果データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ2012は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2013に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2007、外部バス2006、ブリッジ2005、及びホストバス2004を介して接続されているRAM2003に供給する。リムーバブル記録媒体2013も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート2014は、外部接続機器2015を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2014は、インタフェース2007、及び外部バス2006、ブリッジ2005、ホストバス2004等を介してCPU2001等に接続されている。通信部2016は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部2017は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2018は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図20に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、前述の実施の形態は、図20に示す構成に限らず、前述の実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図20に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
なお、数式を用いて説明したが、数式には、その数式と同等のものが含まれる。同等のものとは、その数式そのものの他に、最終的な結果に影響を及ぼさない程度の数式の変形、または数式をアルゴリズミックな解法で解くこと等が含まれる。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…2値化処理モジュール
120…文字外周判定モジュール
130…文字色算出モジュール
1020…距離変換モジュール
1030…文字色算出モジュール
1620…ラベル画像生成モジュール
1630…文字色算出モジュール

Claims (2)

  1. 入力された第1の画像を2値化する2値化手段と、
    前記2値化手段によって2値化された第2の画像内の各画素が、該第2の画像内にある画素塊に属する画素、該画素塊の外周部分に属する画素、背景画像に属する画素のいずれに相当するかを判定する判定手段と、
    前記判定手段によって前記画素塊に属する画素及び該画素塊の外周部分に属する画素判定された画素についての前記第1の画像内の画素値の平均値画素塊に属する画素についての該第1の画像内の画素値の平均値に基づいて、画素塊の領域における画素値を算出する画素値算出手段
    を具備し、
    前記画素塊は、前記2値化画像内で同じ画素値である画素の連なりであり、
    前記画素値算出手段は、r*P1+(1−r)*P2を用いて、画素値を算出し、ただし、P1は前記画素塊と該画素塊の外周部分と判断された領域における前記第1の画像内の画素値の平均値であり、P2は該画素塊の領域における該第1の画像内の画素値の平均値であり、rは予め定められた値(0<r<1)である
    ことを特徴とする画像処理装置。
  2. コンピュータを、
    入力された第1の画像を2値化する2値化手段と、
    前記2値化手段によって2値化された第2の画像内の各画素が、該第2の画像内にある画素塊に属する画素、該画素塊の外周部分に属する画素、背景画像に属する画素のいずれに相当するかを判定する判定手段と、
    前記判定手段によって前記画素塊に属する画素及び該画素塊の外周部分に属する画素判定された画素についての前記第1の画像内の画素値の平均値画素塊に属する画素についての該第1の画像内の画素値の平均値に基づいて、画素塊の領域における画素値を算出する画素値算出手段
    として機能させ
    前記画素塊は、前記2値化画像内で同じ画素値である画素の連なりであり、
    前記画素値算出手段は、r*P1+(1−r)*P2を用いて、画素値を算出し、ただし、P1は前記画素塊と該画素塊の外周部分と判断された領域における前記第1の画像内の画素値の平均値であり、P2は該画素塊の領域における該第1の画像内の画素値の平均値であり、rは予め定められた値(0<r<1)である
    ことを特徴とする画像処理プログラム。
JP2009048812A 2009-03-03 2009-03-03 画像処理装置及び画像処理プログラム Expired - Fee Related JP5206503B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009048812A JP5206503B2 (ja) 2009-03-03 2009-03-03 画像処理装置及び画像処理プログラム
US12/511,741 US8320673B2 (en) 2009-03-03 2009-07-29 Image processing apparatus, image processing method and computer-readable medium
CN200910167112.5A CN101827191B (zh) 2009-03-03 2009-08-18 图像处理装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009048812A JP5206503B2 (ja) 2009-03-03 2009-03-03 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2010206438A JP2010206438A (ja) 2010-09-16
JP5206503B2 true JP5206503B2 (ja) 2013-06-12

Family

ID=42678311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009048812A Expired - Fee Related JP5206503B2 (ja) 2009-03-03 2009-03-03 画像処理装置及び画像処理プログラム

Country Status (3)

Country Link
US (1) US8320673B2 (ja)
JP (1) JP5206503B2 (ja)
CN (1) CN101827191B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5896203B2 (ja) * 2011-07-22 2016-03-30 富士ゼロックス株式会社 画像処理装置、画像形成装置およびプログラム
JP5919979B2 (ja) * 2012-04-06 2016-05-18 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5875637B2 (ja) * 2013-12-19 2016-03-02 キヤノン株式会社 画像処理装置、画像処理方法
CN204990344U (zh) * 2015-08-11 2016-01-20 山东都香网络传媒有限公司 一种基于3d涂涂识字卡片的人机交互系统
CN105338359B (zh) * 2015-11-02 2018-10-16 浪潮金融信息技术有限公司 一种处理视频数据的方法及装置
JP6790384B2 (ja) * 2016-03-10 2020-11-25 富士ゼロックス株式会社 画像処理装置及びプログラム
US11328503B2 (en) 2016-07-14 2022-05-10 Hewlett-Packard Development Company, L.P. Wireless data communication of binary data as image data
TWI710973B (zh) * 2018-08-10 2020-11-21 緯創資通股份有限公司 手勢識別方法、手勢識別模組及手勢識別系統
CN110031970B (zh) * 2019-04-25 2021-08-03 理念光电(湖北)有限公司 光学镜头成像方法
CN114827586B (zh) * 2022-04-24 2024-04-12 中国科学院新疆理化技术研究所 一种基于图像传感器量子效率的相机辐照后成像分辨率退化评估方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3115041B2 (ja) 1991-09-02 2000-12-04 株式会社東芝 読取装置
JPH05130426A (ja) 1991-11-06 1993-05-25 Canon Inc 画像符号化装置
JP3018949B2 (ja) * 1995-08-10 2000-03-13 日本電気株式会社 文字読取装置およびその方法
US6404919B1 (en) * 1997-08-14 2002-06-11 Minolta Co., Ltd. Image processor for encoding image data
JPH11331615A (ja) * 1998-05-14 1999-11-30 Matsushita Electric Ind Co Ltd 画像圧縮装置
JP4018310B2 (ja) * 1999-04-21 2007-12-05 株式会社リコー 画像二値化装置、画像撮像装置、画像二値化方法、画像撮像方法およびその方法の各工程としてコンピュータを機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体
JP3678941B2 (ja) * 1999-05-28 2005-08-03 シャープ株式会社 画像処理装置及びそれを備えた画像形成装置
JP2000357230A (ja) 1999-06-15 2000-12-26 Ricoh Co Ltd 画像処理方法、画像処理装置及び記録媒体
ATE310358T1 (de) * 1999-07-30 2005-12-15 Indinell Sa Verfahren und vorrichtung zur verarbeitung von digitalen bildern und audiodaten
JP2002218272A (ja) * 2001-01-19 2002-08-02 Sharp Corp 画像処理方法、画像処理装置、それを備えた画像形成装置及び記録媒体
JP3870147B2 (ja) 2002-10-02 2007-01-17 キヤノン株式会社 画像圧縮装置、画像伸長装置及びそれらの方法、プログラム
KR100703284B1 (ko) * 2003-01-30 2007-04-03 삼성전자주식회사 영상신호의 이진화 장치 및 방법
JP2004242075A (ja) 2003-02-06 2004-08-26 Canon Inc 画像処理装置および方法
US7783117B2 (en) * 2005-08-12 2010-08-24 Seiko Epson Corporation Systems and methods for generating background and foreground images for document compression
JP4710672B2 (ja) 2006-03-17 2011-06-29 コニカミノルタビジネステクノロジーズ株式会社 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2008099149A (ja) 2006-10-13 2008-04-24 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法および画像処理プログラム
US8155437B2 (en) * 2007-09-07 2012-04-10 CVISION Technologies, Inc. Perceptually lossless color compression
JP5239883B2 (ja) * 2008-02-26 2013-07-17 株式会社リコー 画像形成装置、および画像形成装置の画像形成方法

Also Published As

Publication number Publication date
CN101827191A (zh) 2010-09-08
CN101827191B (zh) 2014-05-07
US20100226588A1 (en) 2010-09-09
JP2010206438A (ja) 2010-09-16
US8320673B2 (en) 2012-11-27

Similar Documents

Publication Publication Date Title
JP5206503B2 (ja) 画像処理装置及び画像処理プログラム
JP4600491B2 (ja) 画像処理装置及び画像処理プログラム
JP5887770B2 (ja) 画像処理装置及び画像処理プログラム
US8977044B2 (en) Image processing apparatus for area separation of images, image processing method, and computer readable medium
JP5365440B2 (ja) 画像処理装置及び画像処理プログラム
US20100189307A1 (en) Image processing apparatus, image processing method and computer readable medium
JP5742283B2 (ja) 画像処理装置及び画像処理プログラム
US8494272B2 (en) Image processing device, image processing method, and computer readable medium for judging if images are matched
JP5262778B2 (ja) 画像処理装置及び画像処理プログラム
JP5206468B2 (ja) 画像処理装置及び画像処理プログラム
JP4894664B2 (ja) 画像処理システム及び画像処理プログラム
JP5407582B2 (ja) 画像処理装置及び画像処理プログラム
JP5200993B2 (ja) 画像処理装置及び画像処理プログラム
JP5434273B2 (ja) 画像処理装置及び画像処理プログラム
JP2014120832A (ja) 画像処理装置及び画像処理プログラム
JP4872780B2 (ja) 画像処理システム及び画像処理プログラム
JP2010049531A (ja) 画像処理装置及び画像処理プログラム
JP4770863B2 (ja) 画像処理装置及び画像処理プログラム
JP2009230603A (ja) 画像処理装置及び画像処理プログラム
JP2009060216A (ja) 画像処理装置及び画像処理プログラム
JP4539733B2 (ja) 画像処理装置及び画像処理プログラム
JP6481301B2 (ja) 画像処理装置及び画像処理プログラム
JP2013161158A (ja) 画像処理装置及び画像処理プログラム
JP2012142872A (ja) 画像処理装置及び画像処理プログラム
JP2017169047A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5206503

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees