JP2011248702A - 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体 - Google Patents
画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体 Download PDFInfo
- Publication number
- JP2011248702A JP2011248702A JP2010122362A JP2010122362A JP2011248702A JP 2011248702 A JP2011248702 A JP 2011248702A JP 2010122362 A JP2010122362 A JP 2010122362A JP 2010122362 A JP2010122362 A JP 2010122362A JP 2011248702 A JP2011248702 A JP 2011248702A
- Authority
- JP
- Japan
- Prior art keywords
- color
- image
- area
- region
- contour
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
【課題】カラー画像より色分けされた領域を、効率的に高精度に抽出する画像処理装置を提供する。
【解決手段】画像から領域を抽出する画像処理装置において、画像をマトリックス状に分割し、分割した範囲の画素の集合から1つの画素を生成して縮小画像を生成する縮小画像生成手段と、前記縮小画像の色情報を所定の値にクラスタリングするクラスタリング手段と、同じ値を有するクラスタを領域として抽出する色領域抽出手段と、抽出した領域の輪郭を抽出する輪郭抽出手段と、前記輪郭抽出手段により抽出された輪郭から、色分けされた原画像の領域の輪郭を特定する輪郭特定手段とを備える。
【選択図】図1
【解決手段】画像から領域を抽出する画像処理装置において、画像をマトリックス状に分割し、分割した範囲の画素の集合から1つの画素を生成して縮小画像を生成する縮小画像生成手段と、前記縮小画像の色情報を所定の値にクラスタリングするクラスタリング手段と、同じ値を有するクラスタを領域として抽出する色領域抽出手段と、抽出した領域の輪郭を抽出する輪郭抽出手段と、前記輪郭抽出手段により抽出された輪郭から、色分けされた原画像の領域の輪郭を特定する輪郭特定手段とを備える。
【選択図】図1
Description
本発明は、カラー画像において色分けされた領域を抽出する方法、およびその方法を実施するための画像処理装置等に関する。
スキャナやカメラ等で紙の文書を取り込んだ画像を入力データとして、文字認識を行う装置が種々考案されている。例えば、新聞、雑誌、論文などの紙文書から必要な情報を保存する場合、紙ではかさばるため、スキャナなどで画像データに変換して保存しておくことが一般に行われているが、後に保存した画像データから特定の文書を検索するためには、紙面に含まれる文字情報を認識して記憶、保管しておくことが必要になる。あるいは、画像データとして取り込んだ紙面に含まれる文字情報を認識し、特定の文字列を抽出して保存することにより、キー入力の煩わしさを少なくして携帯情報端末などに特定の情報を登録する、という用途にも文字認識の技術が用いられている。
ところで、紙文書の中でも雑誌などのカラー紙面では、背景の色によって1つのまとまりのある領域を表したり、部分的に背景を文書全体の地の色とは別の色にすることによって、文書の一部を強調することがある。
このようなカラー紙面を対象とした文字認識装置では、文字認識を行う前処理として色背景が同じ領域ごとにカラー紙面を分割し、その領域ごとに認識処理を行うことが望ましい。なぜなら一般に文字認識装置は、入力多値画像を前景色と背景色に分離して2値画像を生成し、前景色で描かれた部分を文字として文字認識を行うことが多いが、カラー画像に対して前述のように色背景が異なる領域を分離する処理を行わずに2値画像を生成した場合、2値画像上では別の色背景となっているという情報が失われ、本来分離すべき情報であるにも関わらず1つのまとまりとして文字認識されてしまい、精度良く必要な情報を抽出することができないという問題が発生するためである。
あるいは、文書の一部を強調する目的で異なる色領域になっている場合では、しばしば色背景と文字色の濃淡が逆転しており、この領域を他の領域と同じ処理で2値化した場合、文字色と背景色が逆転した2値画像になってしまい、文字認識ができないなどの問題が発生するためである。
色が異なる領域を分離し、類似した色で構成される領域を抽出するための技術としては、色空間クラスタリング法、領域拡張法などが一般的である。
色空間クラスタリング法は、入力された画像の画素を、RGB、YUVなどの色空間においてK−means法やISODATA(Iterative Self−Organizing Data Analysis Technique A)法などの手法でクラスタリングを行い、同色とみなせる画素の集合を1つの領域とする方法である。
領域拡張法は、入力された画像について、画素の色情報を近傍の画素と比較し、色情報の差が閾値よりも小さければ同じ領域とするという処理を、どの領域にも属さない画素がなくなるまで繰り返すことにより、色が異なる領域を分離する方法である。
しかしながら、上述の従来の技術には以下のような問題点がある。カラー印刷物はCMYKと呼ばれる4色の網点を紙面に配置することにより、色を表現することが一般的である。網点は非常に細かいため、人間の目には個々の点を識別することはできず、1つの色として見えるため、網点の配置方法によってさまざまな色を表現することができる。しかし、近年はデジタルカメラや携帯情報端末に搭載されているカメラなどの高画素化が進んでおり、このような高解像度のデバイスでカラー印刷物からカラー画像を取得した場合、人の目には同じ色に見える領域であっても、取得された画素の分布によってはばらつきが生じることがある。そのため取得した画像に対して色空間クラスタリング法を行った場合、画素のばらつきによって人の目には同色である領域の画素が同色とみなされず、精度よくクラスタリングをすることが難しいという問題が発生する。また領域拡張法においても、人の目には同色である領域でも隣接する画素の色の違いが大きくなってしまい、うまく色領域を分離することができないという問題が発生する。さらに、どちらの手法においても画像全体のすべての画素を対象として処理を行うため、高画素数の画像は処理時間が大きくなるという問題もある。
このような問題に対応するために、特許文献1では、カラー原画像から縮小画像を作成し、縮小画像で同じ色とみなせる領域を求め、同じ色とみなされた領域において、その領域の色の種類、色の種類の数、代表色を求め、それに対応する原画像の中において、縮小画像で抽出した色に近い画素を探索し、領域を抽出することを特徴とするカラー画像処理装置及びパターン抽出装置を提案している。
この装置によれば、縮小画像で抽出した色だけに注目してその領域に対応する原画像の領域を抽出するため、原画像全体の全ての画素を対象として処理を行う従来の方法より、処理時間が短縮できる。
しかしながら、特許文献1では、縮小画像で同じ色とみなされる領域を求め、その領域において、その領域の色の種類、色の種類の数、代表色を求めているが、色の種類、色の種類の数を求めるために、縮小画像上で求めた同色領域を探索してその中の色の種類を全て調査している。また代表色を求めるために、色の種類ごとに頻度分布を求め、最頻値を代表値とする方法が記載されているが、これらの値を求めるためには、同色領域内の全ての画素を調査してヒストグラムなどを作成する必要があるため処理時間がかかる。
また、同文献では縮小画像で求めた領域から、それに対応する原画像の外接矩形を求め、その内部で代表色に近い画素を探索することによって、処理時間を短くしている。確かに、縮小画像で求めた領域が四角形に近い場合は原画像の外接矩形も似たような形状になるため、原画像の探索領域内に同色領域に属さない画素が少なくなり、探索領域を絞ることができる。しかし、縮小画像で求めた領域が四角形に近くない複雑な形状の場合は、対応する原画像の外接矩形では同色領域に属さない画素が多くなるため、同色領域の探索範囲をそれほど大きく絞ることはできず、原画像の外接矩形内のすべての画素について、その領域の代表色や求めた色の種類全てと比較して、同じ領域に属するかを探索しなければならないことから、画素数による処理時間の増大という問題を解決できない場合も多い。また、文字情報は、通常、四角形に近い領域に記録されていることが多いため、複雑な形状の領域を抽出しても、文字認識のための抽出という点では不要となる場合も多い。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、色のばらつきを小さくした縮小画像を用いて効率的にかつ精度よく、色分けされた領域を抽出することができる画像処理装置を提供することにある。
また、本発明の更なる目的は、抽出した領域から文字領域になりえないような領域を除くことで処理時間をさらに短縮できる画像処理装置を提供することにある。
前記の課題を解決するために、本発明に係る画像処理装置は、画像から領域を抽出する画像処理装置において、画像をマトリックス状に分割し、分割した範囲の画素の集合から1つの画素を生成して縮小画像を生成する縮小画像生成手段と、前記縮小画像の色情報を所定の値にクラスタリングするクラスタリング手段と、同じ値を有するクラスタを領域として抽出する色領域抽出手段と、抽出した領域の輪郭を抽出する輪郭抽出手段と、前記輪郭抽出手段により抽出された輪郭から、色分けされた原画像の領域の輪郭を特定する輪郭特定手段とを備えることを特徴としている。
また、本発明に係る画像処理装置は、前記縮小画像生成手段は、分割した範囲の画素集合の平均値を縮小画像の画素とすることを特徴としている。
また、本発明に係る画像処理装置は、同じクラスタに属する画素の連結を膨張または収縮するクラスタ膨張収縮手段を備えることを特徴としている。
また、本発明に係る画像処理装置は、前記色領域抽出手段が、同じクラスタに属する画素を連結した領域の画素数が所定の値より小さい領域を抽出しないことを特徴としている。
また、本発明に係る画像処理装置は、前記色領域抽出手段が、同じクラスタに属する画素を連結した領域の形状を評価し、評価値に合致しない領域を抽出しないことを特徴としている。
また、本発明に係る画像処理方法は、画像から領域を抽出する画像処理方法において、画像をマトリックス状に分割し、分割した範囲の画素の集合から1つの画素を生成して縮小画像を生成する縮小画像生成ステップと、前記縮小画像の色情報を所定の値にクラスタリングするクラスタリングステップと、同じ値を有するクラスタを領域として抽出する色領域抽出ステップと、抽出した領域の輪郭を抽出する輪郭抽出ステップと、前記輪郭抽出ステップにより抽出された輪郭から、色分けされた原画像の領域の輪郭を特定する輪郭特定ステップと
を備えることを特徴としている。
を備えることを特徴としている。
また、本発明に係る画像処理プログラムは、画像から領域を抽出する画像処理プログラムにおいて、画像をマトリックス状に分割し、分割した範囲の画素の集合から1つの画素を生成して縮小画像を生成する縮小画像生成ステップと、前記縮小画像の色情報を所定の値にクラスタリングするクラスタリングステップと、同じ値を有するクラスタを領域として抽出する色領域抽出ステップと、抽出した領域の輪郭を抽出する輪郭抽出ステップと、前記輪郭抽出ステップにより抽出された輪郭から、色分けされた原画像の領域の輪郭を特定する輪郭特定ステップとをコンピュータに実行させることを特徴としている。
また、本発明に係る記憶媒体は、上記前記画像処理プログラムを記憶したことを特徴としている。
本発明の画像処理装置によれば、色のばらつきを小さくした縮小画像を用いて効率的にかつ精度よく、色分けされた領域を抽出することができ、さらに、抽出した領域から文字領域になりえないような領域を除くことで処理時間を短縮することができる。
以下、本発明における画像処理装置の実施の形態に関して、カラー紙面から色分けされた文字領域を抽出する例について、図面を用いて以下に説明する。なお、本発明の図面において、同一の参照符号は、同一部分または相当部分を表わすものとする。
図1は、本発明を実施するための画像処理装置の構成を示すブロック図である。本発明の画像処理装置は、カラー画像を入力する画像入力部101、入力したカラー画像を記憶する画像メモリ102、画像メモリ102に記憶されたカラー画像よりグレースケール画像データを生成するグレースケール画像生成部103、生成されたグレースケール画像を記憶するグレースケール画像メモリ104、画像メモリ102に記憶されたカラー画像より縮小画像データを生成する縮小画像生成部105、生成された縮小画像を記憶する縮小画像メモリ106、縮小画像の色情報をクラスタリングするクラスタリング部107、同じクラスタに属する画素の連結の膨張または収縮を行うクラスタ膨張収縮部108、同じクラスタに属する画素の連結を領域として抽出する色領域抽出部109、色情報のクラスタリング分類や抽出した色領域を記憶する色領域メモリ110、色領域メモリ110に記憶された色領域に対して、所定の条件に合致した色領域を消去する色領域消去部112、抽出した色領域の輪郭を追跡し、輪郭画素を抽出する輪郭抽出部111、輪郭画素が対応するカラー画像の範囲を設定する輪郭特定範囲設定部113、輪郭画素のエッジ方向を記憶するエッジ方向テーブル114、設定したカラー画像の輪郭特定範囲よりカラー画像の色領域の輪郭を特定する輪郭特定部より構成されている。
図2は本発明の全体の処理の流れを示したフローチャートである。まず、画像処理装置を起動し、画像入力部101において、カラー紙面をCCDカメラやスキャナなどの電子データに変換して入力し、カラー画像(以下では原画像と呼ぶ)として画像メモリ102に記憶する(ステップS201)。なお、本実施の形態では、R,G,Bによりカラー画素を表現している場合について説明するが、YUVやHSVなど他の表色系を用いてもよい。
次にグレースケール画像生成部103において、画像メモリ102に記憶された原画像よりグレースケール画像を生成し、グレースケール画像メモリ104に記憶する(ステップS202)。グレースケール画像を生成する処理としては、R,G,Bの加重平均によって輝度値を計算して画像値とするなどの方法がある。
続いて縮小画像生成部105において画像メモリ102に記憶された原画像より縮小画像を生成し、縮小画像メモリ106に記憶する(ステップS203)。縮小画像を生成する処理は、例えば以下のような方法がある。
画像メモリ102に記憶された原画像のN×N画素を1画素とする縮小画像を生成するためには、原画像をN×N画素ごとのマトリクス状に区切り、区切られた各範囲内にある画素の値について、R,G,Bごとに平均値を算出し、その平均値のR,G,Bにより、1つの画素を割り当てる。ここでNが小さすぎる場合は、縮小画像の総画素数が多くなるため、以降の処理において時間がかかり、またカラー印刷物の網点が荒い場合は、縮小画像の画素のばらつきが大きくなるため、後述するクラスタリングにおいて精度も悪くなる。また、Nが大きすぎる場合は小さい色領域を抽出することが難しくなる。一般的にはNは4〜16程度で、入力対象画像に応じた値を選択することが望ましい。このように縮小画像を用いることにより、効率よく色分けされた領域を抽出することができる。また、原画像の画素の平均値を縮小画像とすることにより、原画像における色のばらつきを小さくした縮小画像を用いて精度よく色分けされた領域を抽出することができる。
次にクラスタリング部107は縮小画像メモリ106に記憶された縮小画像の色情報を抽出し、クラスタリング処理を行う。クラスタリングとは、データ集合において、何らかの特徴空間上で分布の群れ(クラスタ)を見つけることである。本発明においては、色空間のクラスタリングによりクラスタリング処理を行い、縮小画像上の画素をクラスタに分類し、その分布状況を示すクラスタマップを作成し、色領域メモリ110に記憶する(ステップS204)。色空間のクラスタリングの具体的な方法については、K−means法やISODATA法などの既存の手法を用いればよい。
図3はクラスタマップの一例を表しており、番号0から3までの4色のクラスタに分類されている。本発明では画像全体と違う色領域を抽出することが目的であるため、これ以降の処理は背景色以外のクラスタに対して行う。一般的な紙面の画像を取り込んだ場合、背景色は白である場合が多いが、カラー印刷物の種類によってさまざまな色が考えられるため、分類したクラスタの中でもっとも属している画素数が多いものを選べばよい。図3の例においては、0番が背景色を表すクラスタであると判断する。
次にクラスタ膨張収縮部108はクラスタマップに対して個々のクラスタごとに膨張処理や収縮処理を行う(ステップS205)。膨張処理とは、ある図形成分の境界画素に接する背景成分中の画素の値を図形成分の画素の値に変換して一画素分膨らませる処理である。逆に収縮処理とは、ある図形成分の境界にある画素の値を全て背景成分の画素に変換して一画素分縮める処理である。これらの処理は、画素の欠けや、不要な画素などのノイズ除去を目的に行われる。本実施の形態では、対象とするクラスタに属する画素の集合を膨らませることを膨張処理、縮めることを収縮処理とする。
図4は、画素のノイズのあるクラスタマップの一例である。この例では、ノイズによって0番のクラスタに2箇所の不要な孤立画素10があり、2番のクラスタは本来長方形であるはずの形状に一部、画素の欠け11が生じている。後述する次のステップS206の色領域抽出処理では、クラスタマップの個々のクラスタごとにラベリング処理(連結している画素に同じラベルを付加する処理)を行い、連結領域を抽出して色領域とするため、このままでは領域の一部が欠けたり、不要な小領域が抽出されること起こりうる。そこで、クラスタマップに対して個々のクラスタごとに膨張処理や収縮処理を行い、ノイズ除去を行う。
図5は、図4のクラスタマップに対して膨張処理を行った後のクラスタマップである。図4のクラスタマップに対してクラスタごとに8近傍(上下左右斜め方向の周辺)の膨張処理を行っている。
図6は、図5のクラスタマップに対して収縮処理を行った後のクラスタマップである。図4のクラスタマップに対して膨張処理を行った後、この状態で、さらに、8近傍の収縮処理を行うと、図6のようなクラスタマップが作成され、図4において画素の欠け11として存在していた2番のクラスタの欠けた部分が埋まり、本来の長方形の領域を抽出することができる。
図7は、図6のクラスタマップに対して収縮処理した後に膨張処理を行った後のクラスタマップである。このような処理により、図4において孤立画素10として存在していた1番のクラスタの2箇所の不要な領域が除去される。
このように膨張収縮処理を行うことにより、クラスタリングの段階でクラスタ分布に欠けや余分な画素が存在した場合でも、精度よく色分けされた領域を抽出することができる。
次に色領域抽出部109は、色領域メモリ110に記憶されたクラスタマップの個々のクラスタごとにラベリング処理を行い、連結領域を抽出し、色領域マップを作成して色領域メモリ110に記憶する(ステップS206)。その際に、色分けされた文字領域になりえないような小さな領域を除くため、抽出した連結領域についてその連結領域を構成する画素数をカウントし、画素数があらかじめ定められた閾値より多い領域にのみ色領域メモリ110に記憶する。この閾値は、縮小画像に応じて、文字領域になりえないと判定する値を適宜設定すればよい。このように、抽出した色領域から色分けされた文字領域になりえないような小さな領域を抽出しないことにより、処理時間を短縮することができる。
図8は、図3のクラスタ分類に対して背景色以外のクラスタについてラベリング処理を行い、色領域マップを作成した結果である。この例においてはR2とR3のクラスタが連結しているが、クラスタが異なる領域が連結していても別のラベルとしてラベリングを行う。そしてこれらのラベルに一意の番号R1からR4を振って、色領域マップを作成し、色領域メモリ110に記憶する。
次のステップS207からS210までの処理は、ステップS206で抽出した色領域ごとに行う。
まず、輪郭抽出部111は、色領域メモリ110に記憶された色領域マップを用いて、縮小画像で色領域の輪郭となる画素を抽出するために輪郭抽出処理を行う(ステップS207)。輪郭抽出処理とは、領域の境界線をたどるようにして輪郭線を抽出する処理である。
図9は、本実施の形態で使用する4連結の輪郭抽出処理についての説明図である。まず図9(a)に示すように画像の左上より破線の矢印のようにラスタスキャンを行い、輪郭抽出を行う領域で最初に見つかった画素(●印がついた画素)を開始点とする。ラスタスキャンにより、開始点の位置においては上と左に画素がないことが確認済であるため、下、右の順番で抽出方向に画素があるかどうかを調べる。どちらの方向にも画素がない場合は、孤立点として終了する。この図においては下に画素があるため、図9(b)のように下の点へ進みこの点を新しい抽出点とする。これ以降は、抽出点の進行方向に対して右手側の画素から反時計回りの優先順位で画素があるかどうかを調べる。この優先順位を図に表すと、図中の1〜4となる。図9(b)においては進行方向が下であるため、図に示したように左、下、右、上の順で画素があるかどうかを調べ、画素があった時点でその方向に進む。この場合は左に画素がなく、下に画素があるため、下方向に進む。
同様にして輪郭抽出処理を進め、図9(c)においては進行方向が右であるため、図に示したように下、右、上、左の順番で画素があるかどうかを調べる。この場合では、下に画素があるため、下への画素を新しい抽出点とする。以上の処理を繰り返し行い、図9(d)のように抽出点が開始点に戻ったときに終了とする。
図10は、図8で抽出した色領域R1に対して以上の輪郭抽出処理を行った図である。この輪郭抽出処理によって抽出した輪郭線を、色領域メモリ110の色領域マップに記憶する。輪郭抽出処理においては輪郭を抽出する際に進んだ方向、すなわち図10における矢印の方向に輪郭線を持つということがわかるため、輪郭線の方向を合わせて記憶しておく。
またこのとき、抽出した輪郭線の長さをカウントする。輪郭線の長さのカウント方法は、開始画素から再び開始画素に戻るまでにたどった画素の数を輪郭線の長さとする。例えば、図9においては、開始画素から下方向に3、右方向に3、下方向に1、右方向に9、上方向へ3、左方向へ3、上方向へ1、左方向へ9進むことにより開始画素に戻る。よって輪郭線の長さは、これらを合計して32となる。
次に色領域消去部112において、抽出した色領域から色分けされた文字領域になりえないような複雑な形状の領域を除く(ステップS208)。具体的には、輪郭線の長さと色領域を構成する画素数を用いて、“(輪郭線の長さ)2/構成画素数”という計算式を用いて評価値を計算する。この値は、色領域の輪郭線が入り組んで、形状が複雑になるほど大きくなる。
図11は、色領域の輪郭線が複雑に入り組んだ例である。図11に示した色領域においては、構成画素数は54で先ほど説明した図9と同じである。しかし輪郭追跡処理を行うと矢印のように、輪郭線の長さは62と図9の輪郭線の長さ32よりも長くなる。この2つの図に示された色領域についてそれぞれ評価値を計算すると、図9は19.0、図11は71.2となり、図11のほうがかなり大きくなることがわかる。そして、この評価値があらかじめ定められた閾値以上である場合は、評価した色領域を色領域メモリ110に記憶された色領域マップから削除する。この閾値は、縮小画像に応じて、色領域の形状が複雑と判定する値を適宜設定すればよい。このように、抽出した色領域から色分けされた文字領域になりえないような複雑な形状の領域を除くことにより、処理時間を短縮することができる。
次に、輪郭特定範囲設定部113は色領域マップを参照し、原画像上での輪郭線の抽出範囲の設定を行う(ステップS209)。ここで縮小画像は原画像の画素のN×Nの範囲を1画素として作成しているため、縮小画像の座標が{m,n}であれば、それに対応する原画像は{m*N,n*N}を左上、{(m+1)*N−1,(n+1)*N−1}を右下とするN×Nの範囲になる。ここで、縮小画像は原画像のN×Nの範囲の色情報の平均値を画素値としているため、必ずしも縮小画像上の輪郭線の画素に相当する原画像の範囲に、原画像の色領域の輪郭線が含まれているわけではない。これについて、図12を用いて説明する。
図12は原画像における色領域を示している。破線で区切ったブロックは縮小画像の1つ1つの画素に相当する範囲を示している。
図13は縮小画像において抽出した色領域を原画像に対応づけた図を表しており、“×”がついたブロックは抽出された色領域の輪郭線が存在することを表している。このように色領域の輪郭線が存在するブロックは、縮小画像を生成したときに原画像における色領域部分を多く含む場合は、平均値によって算出した縮小画像の画素の色情報が、完全に色領域を含む縮小画像の画素の色情報と近くなるため同じクラスタに分類され、同じ色領域として抽出される。それに対して原画像における色領域部分をあまり含まない場合は、画素の色情報が完全に色領域を含む画素の色情報と近くならないため、同じクラスタに分類されない。しかしその場合は、抽出された色領域の輪郭線に隣接する外側のブロックに、原画像の輪郭線が存在することになる。そこで、抽出した輪郭線の方向によって輪郭線の抽出範囲を拡張する。
図14の矢印は、図13で示した色領域の輪郭線の方向を表している。このように輪郭線の外側のブロックは、輪郭線の方向に対して右手側のブロックになる。例えば、{3,3}のブロックでは輪郭線の方向は左であるため、図に示したように上方向のブロックに輪郭線の抽出範囲を拡張する。また{2,3}のブロックにおいては色領域の角に当たるため、左と上の2つの方向の輪郭線が存在する。この場合は、図に示したように上と左を含む正方形のブロックに輪郭線の抽出範囲を拡張する。以上の処理を輪郭線が存在するすべてのブロックについて行う。
図15は、輪郭線の抽出範囲が設定された範囲を示している。さらに、それに対応するエッジ方向テーブル114を作成する。
図16は、エッジ方向テーブル114の一例を示したものである。横が縮小画像のX座標、縦が縮小画像のY座標、表の矢印は抽出するエッジの方向である。ここでエッジの方向とは、抽出した色領域から背景領域へ向かう方向、すなわち輪郭線の方向に対して右手側の方向となる。また複数の方向の輪郭線を持つブロックについては、複数のエッジ方向が値としてセットされる。
次に輪郭特定部115はステップS209で設定した原画像の範囲内において輪郭特定処理を行う(ステップS210)。輪郭特定処理は、微分オペレータやテンプレートマッチングなどさまざまな方法を用いて輪郭となるエッジを検出する処理であり、一般的に知られている画像処理技術である。本実施例においては、代表的なテンプレートマッチングであるPrewittの方法を用いて説明する。
図17は輪郭抽出処理におけるPrewittの方法におけるエッジ方向とマスクパターを示している。Prewittの方法は、図17に示したように、輪郭を表す標準パターンとして8つのエッジ方向に対応する8種類のマスクパターンを用意する。入力画素とその近傍の画素に、入力画素をマスクパターンの中央にあてマスクパターンの値を乗じて和をとり、その計算値がマスクパターンに対応するエッジの方向の強さとなる。入力画像は、グレースケール画像メモリ104に記憶されているグレースケール画像を使用する。
輪郭特定部115はエッジ方向テーブル114を参照し、テーブルに値が設定されている原画像の範囲内において、対応するマスクパターンによりエッジの強さを計算する。例えば図16のエッジ方向テーブル114の{1,2}においては、左方向と上方向のエッジがあることがわかる。それに対応する原画像の範囲は{N,2N}を左上、{2N−1,3N−1}を右下とする範囲になり、その範囲のグレースケール画像の画素に対して、左方向と上方向のエッジを計算する図17のテンプレート(b)、(h)及びその周囲のテンプレート(a)、(c)、(g)を用いて、最もエッジが検出される方向とエッジの強さを計算する。同様に{3,2}においては上方向のエッジがあることがわかるため、対応する原画像の範囲は{3N,2N}を左上、{4N−1,3N−1}を右下とする範囲になり、その範囲のグレースケール画像の画素に対して、上方向のエッジを計算するテンプレート(b)及びその周囲のテンプレート(a)、(c)を用いて、最もエッジが検出される方向とエッジの強さを計算する。
このような処理をエッジ方向テーブル114に値が設定されているすべての範囲について行い、原画像における色領域の輪郭特定を行う。一般的な輪郭特定処理では各画素において検出されるエッジの方向はわからないため、全方向に対応するテンプレートを各画素に対して適用しなければならないが、本実施の形態においては、エッジ方向テーブル114に輪郭線の方向が記憶されているため、輪郭線の方向に対応するテンプレートのみを用いればよく、エッジ検出処理時間を大幅に短縮することができる。
次に、まだ輪郭特定処理がされていない色領域があるかどうかを調べる(ステップS211)。ある場合はステップS207へ戻り、まだ輪郭特定処理がされていない色領域について、ステップS207からS210までの処理を繰り返し行う。
本実施の形態によれば、原画像より色のばらつきを小さくした縮小画像を生成し、これを用いて効率的にかつ精度よく、色分けされた領域を抽出することができ、さらに、抽出した領域から文字領域になりえないような領域を除くことで処理時間を短縮することができる。
なお、本発明は上記に記載した実施の形態に限らず、請求項で示した範囲で数々の変更が可能であり、処理対象もカラー紙面に限らず、物体までの距離を色分けした距離画像からの色領域抽出など、さまざまなカラー画像に応用が可能である。
101 画像入力部
102 画像メモリ
103 グレースケール画像生成部
104 グレースケール画像メモリ
105 縮小画像生成部
106 縮小画像メモリ
107 クラスタリング部
108 色領域抽出部
109 クラスタ膨張収縮部
110 色領域メモリ
111 輪郭抽出部
112 色領域消去部
113 輪郭特定範囲設定部
114 エッジ方向テーブル
115 輪郭特定部
102 画像メモリ
103 グレースケール画像生成部
104 グレースケール画像メモリ
105 縮小画像生成部
106 縮小画像メモリ
107 クラスタリング部
108 色領域抽出部
109 クラスタ膨張収縮部
110 色領域メモリ
111 輪郭抽出部
112 色領域消去部
113 輪郭特定範囲設定部
114 エッジ方向テーブル
115 輪郭特定部
Claims (8)
- 画像から領域を抽出する画像処理装置において、画像をマトリックス状に分割し、分割した範囲の画素の集合から1つの画素を生成して縮小画像を生成する縮小画像生成手段と、前記縮小画像の色情報を所定の値にクラスタリングするクラスタリング手段と、同じ値を有するクラスタを領域として抽出する色領域抽出手段と、抽出した領域の輪郭を抽出する輪郭抽出手段と、前記輪郭抽出手段により抽出された輪郭から、色分けされた原画像の領域の輪郭を特定する輪郭特定手段とを備えることを特徴とする画像処理装置。
- 前記縮小画像生成手段は、分割した範囲の画素集合の平均値を縮小画像の画素とすることを特徴とする、請求項1に記載の画像処理装置。
- 前記画像処理装置は、同じクラスタに属する画素の連結を膨張または収縮するクラスタ膨張収縮手段をさらに備えることを特徴とする、請求項1または2に記載の画像処理装置。
- 前記画像処理装置は、前記色領域抽出手段が、同じクラスタに属する画素を連結した領域の画素数が所定の値より小さい領域を抽出しないことを特徴とする、請求項1から3のいずれかに記載の画像処理装置。
- 前記画像処理装置は、前記色領域抽出手段が、同じクラスタに属する画素を連結した領域の形状を評価し、評価値に合致しない領域を抽出しないことを特徴とする、請求項1から4のいずれかに記載の画像処理装置。
- 画像から領域を抽出する画像処理方法において、画像をマトリックス状に分割し、分割した範囲の画素の集合から1つの画素を生成して縮小画像を生成する縮小画像生成ステップと、前記縮小画像の色情報を所定の値にクラスタリングするクラスタリングステップと、同じ値を有するクラスタを領域として抽出する色領域抽出ステップと、抽出した領域の輪郭を抽出する輪郭抽出ステップと、前記輪郭抽出ステップにより抽出された輪郭から、色分けされた原画像の領域の輪郭を特定する輪郭特定ステップとを備えることを特徴とする画像処理方法。
- 画像から領域を抽出する画像処理プログラムにおいて、画像をマトリックス状に分割し、分割した範囲の画素の集合から1つの画素を生成して縮小画像を生成する縮小画像生成ステップと、前記縮小画像の色情報を所定の値にクラスタリングするクラスタリングステップと、同じ値を有するクラスタを領域として抽出する色領域抽出ステップと、抽出した領域の輪郭を抽出する輪郭抽出ステップと、前記輪郭抽出ステップにより抽出された輪郭から、色分けされた原画像の領域の輪郭を特定する輪郭特定ステップとをコンピュータに実行させるための画像処理プログラム。
- 請求項7に記載の画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010122362A JP2011248702A (ja) | 2010-05-28 | 2010-05-28 | 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010122362A JP2011248702A (ja) | 2010-05-28 | 2010-05-28 | 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011248702A true JP2011248702A (ja) | 2011-12-08 |
Family
ID=45413869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010122362A Pending JP2011248702A (ja) | 2010-05-28 | 2010-05-28 | 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011248702A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017004295A (ja) * | 2015-06-11 | 2017-01-05 | 株式会社ミツバ | 信号機認識装置及び信号機認識方法 |
JP2019515374A (ja) * | 2016-08-31 | 2019-06-06 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 画像内の文字領域を認識するための方法及び装置 |
CN110120080A (zh) * | 2019-04-12 | 2019-08-13 | 青岛九维华盾科技研究院有限公司 | 一种快速生成标准伪装迷彩主色的方法 |
CN111402232A (zh) * | 2020-03-16 | 2020-07-10 | 深圳市瑞图生物技术有限公司 | 精液中精子聚集检测方法 |
CN111783807A (zh) * | 2019-04-28 | 2020-10-16 | 北京京东尚科信息技术有限公司 | 图片提取方法、装置和计算机可读存储介质 |
CN112464850A (zh) * | 2020-12-08 | 2021-03-09 | 东莞先知大数据有限公司 | 图像处理方法、装置、计算机设备及介质 |
CN116385435A (zh) * | 2023-06-02 | 2023-07-04 | 济宁市健达医疗器械科技有限公司 | 基于图像分割的制药胶囊计数方法 |
CN117812275A (zh) * | 2024-02-28 | 2024-04-02 | 哈尔滨学院 | 用于排球辅助训练的图像优化通信方法 |
-
2010
- 2010-05-28 JP JP2010122362A patent/JP2011248702A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017004295A (ja) * | 2015-06-11 | 2017-01-05 | 株式会社ミツバ | 信号機認識装置及び信号機認識方法 |
JP2019515374A (ja) * | 2016-08-31 | 2019-06-06 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 画像内の文字領域を認識するための方法及び装置 |
US10803338B2 (en) | 2016-08-31 | 2020-10-13 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and device for recognizing the character area in a image |
CN110120080B (zh) * | 2019-04-12 | 2024-01-05 | 青岛九维华盾科技研究院有限公司 | 一种快速生成标准伪装迷彩主色的方法 |
CN110120080A (zh) * | 2019-04-12 | 2019-08-13 | 青岛九维华盾科技研究院有限公司 | 一种快速生成标准伪装迷彩主色的方法 |
CN111783807A (zh) * | 2019-04-28 | 2020-10-16 | 北京京东尚科信息技术有限公司 | 图片提取方法、装置和计算机可读存储介质 |
CN111402232A (zh) * | 2020-03-16 | 2020-07-10 | 深圳市瑞图生物技术有限公司 | 精液中精子聚集检测方法 |
CN111402232B (zh) * | 2020-03-16 | 2023-05-16 | 深圳市瑞图生物技术有限公司 | 精液中精子聚集检测方法 |
CN112464850A (zh) * | 2020-12-08 | 2021-03-09 | 东莞先知大数据有限公司 | 图像处理方法、装置、计算机设备及介质 |
CN112464850B (zh) * | 2020-12-08 | 2024-02-09 | 东莞先知大数据有限公司 | 图像处理方法、装置、计算机设备及介质 |
CN116385435B (zh) * | 2023-06-02 | 2023-09-26 | 济宁市健达医疗器械科技有限公司 | 基于图像分割的制药胶囊计数方法 |
CN116385435A (zh) * | 2023-06-02 | 2023-07-04 | 济宁市健达医疗器械科技有限公司 | 基于图像分割的制药胶囊计数方法 |
CN117812275A (zh) * | 2024-02-28 | 2024-04-02 | 哈尔滨学院 | 用于排球辅助训练的图像优化通信方法 |
CN117812275B (zh) * | 2024-02-28 | 2024-05-28 | 哈尔滨学院 | 用于排球辅助训练的图像优化通信方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011248702A (ja) | 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体 | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
US8947736B2 (en) | Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern | |
Ferrer et al. | Lbp based line-wise script identification | |
CN110781877B (zh) | 一种图像识别方法、设备及存储介质 | |
JP5974589B2 (ja) | 画像処理装置およびプログラム | |
CN110766017B (zh) | 基于深度学习的移动终端文字识别方法及系统 | |
KR20130105952A (ko) | 차량 번호판 인식 방법과 그 장치 | |
JP2010218420A (ja) | 文字認識装置、画像読取装置、およびプログラム | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
JP4391704B2 (ja) | 多値画像から二値画像を生成する画像処理装置および方法 | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
Ntzios et al. | An old greek handwritten OCR system based on an efficient segmentation-free approach | |
CN115578741A (zh) | 一种基于Mask R-cnn算法和类型分割的扫描文件版面分析方法 | |
JP5796107B2 (ja) | テキスト検出の方法及び装置 | |
CN115410191B (zh) | 文本图像识别方法、装置、设备和存储介质 | |
CN116030472A (zh) | 文字坐标确定方法及装置 | |
Hesham et al. | A zone classification approach for arabic documents using hybrid features | |
JP4492258B2 (ja) | 文字・図形の認識方法および検査方法 | |
Sherkat et al. | Use of colour for hand-filled form analysis and recognition | |
Chitrakala et al. | An efficient character segmentation based on VNP algorithm | |
KR102668050B1 (ko) | 그림 이미지를 추출하는 방법, 장치 및 컴퓨터 프로그램 | |
Sambyal et al. | Connected component based English character set segmentation | |
JPH05342412A (ja) | グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式 | |
De Nardin et al. | A One-Shot Learning Approach to Document Layout Segmentation of Ancient Arabic Manuscripts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20130131 |