JP2003087562A - 画像処理装置および画像処理方法 - Google Patents
画像処理装置および画像処理方法Info
- Publication number
- JP2003087562A JP2003087562A JP2001278478A JP2001278478A JP2003087562A JP 2003087562 A JP2003087562 A JP 2003087562A JP 2001278478 A JP2001278478 A JP 2001278478A JP 2001278478 A JP2001278478 A JP 2001278478A JP 2003087562 A JP2003087562 A JP 2003087562A
- Authority
- JP
- Japan
- Prior art keywords
- image
- color
- area
- pixel
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Abstract
多値画像データから種類対応の領域を色分布の状態を識
別条件に含めて抽出識別できるようにしたことをことを
特徴とする。 【解決手段】画像入力部101により取り込んだ画像デ
ータ(カラー画像)を領域識別部102に於いて画素値
の濃度差や彩度などの状態により複数の画像データに分
離し、物理的あるいは論理的に連結しているものを一つ
の領域として抽出した後、個々の領域の画像上の位置、
大きさ、形状、構造、濃度分布等の特徴量を計測し、色
分類部103に於いて画素値の色相や彩度等の状態によ
って幾つかの色に分類し、その結果を色分布画像データ
として保持し、画素属性識別部104に於いて領域識別
データと色分布画像データから文書内の各画素の属性を
決定し、画像出力部105によって構造的な画素属性を
出力する。
Description
ファイリングや複写のために文書の構成要素と色情報に
よって変換処理を行なう画像処理装置および画像処理方
法に関する。
で、その画像をハードコピーとして出力したり、イメー
ジファイルとして保存したりする技術として、複写機
や、パーソナルコンピュータ等に於ける、イメージ取り
込みの分野に利用されている技術や、ファイリングシス
テム装置やデータベースに利用される技術等がある。
取り込んだ画像をハードコピーとして出力する場合、文
書画像として利用者が見易いものにするために、画像処
理を施す場合がある。例えば、文書画像に文字が含まれ
ている場合、ハイパスフィルタ処理を施すことによっ
て、文字のエッジ部分が強調され、くっきりとした、読
み易い文字となる。また、写真の場合、写真の滑らかな
階調を再現するために、ローパスフィルタを施すことに
よって、ざらつき感が無くなり、奇麗な出力となる。網
点で構成された網点写真であるのか、あるいは銀塩写真
であるのかによっても処理を切り替えることも可能であ
る。
合、カラー画像や濃淡画像のデータ量は非常に大きいた
め、データ量を削減するためにデータ圧縮を施すことが
多い。このような場合、文字は2値化することによって
データ量を削減することが可能となり、写真は階調性を
保存するような圧縮処理を施すことにより写真の美しさ
を保存しつつ、データ量を圧縮することが可能となる。
理手法を変更することは、ハードコピーとして出力する
際も、イメージファイルとして保存する際にも非常に有
効である。
等の領域がそれぞれ単独にあるいは重なり合うことによ
って構成されている。したがって、画像処理を行なう場
合、文書画像にどのような領域がどのように構成されて
いるかを検知する必要がある。
成する要素を識別するために、入力画像データの濃度値
を利用する方法が用いられてきた。2×2から4×4画
素程度のブロック内に於ける最大値と最小値の差を用い
て写真領域と非写真領域に分離する方法、ブロック内で
エッジ画素を検出し、そのエッジ画素が文字の一部か否
かをパターンマッチングによって判別する方法、3値化
された画像に対しパターンマッチングによりエッジ検出
およびピーク画素検出を行ない判定する方法、ブロック
内の各画素に於けるエッジ量の総和を算出し分離する方
法等である。これらの手法に共通しているのは、高速な
処理を実現するため、数画素単位のブロック毎に処理を
行なっていることである。
の変化によっては、同一の構成要素に於ける隣接ブロッ
ク間で違う要素であると誤って識別される虞があり、そ
の結果として同じ領域でありながら異なった画像処理が
施される。
4702号に記載されているように、レイアウト解析を
利用して、文書画像の構造を抽出するものがある。この
方法では、2値化処理を行なった後に、画素の連結性を
調べ、連結している画素同士を領域として抽出して、そ
の位置や大きさ等の特徴量を利用して識別するものであ
る。さらに、特願平10−191286号に記載されて
いるように、入力された画像に対し、複数の2値画像に
分離して、各々の2値画像データに於いてレイアウト解
析を行なう方法もある。この方法では濃度値によって画
像を分離しているため、各々の画像を処理した結果を比
較することで、通常の2値化では困難であった正確な文
書要素の抽出や識別を行なうことができる。またカラー
画像や濃淡画像を複数の2値画像で表現しているため、
処理時間の短縮とメモリ容量の削減が図られている。
ー、黒といった彩度の違いによる色属性を文書要素毎に
与えることは可能であったが、どのような色によって描
かれているかは分からなかった。
うな複雑な線図形は、その領域に於ける特徴量が写真と
類似することがあり、そのため写真と誤って識別する場
合がある。逆に、薄い写真領域は、その領域における特
徴量が線図形に類似することがあり、そのため線図形と
誤って識別する場合がある。誤った識別の結果、写真領
域に対してハイパスフィルタ処理を行なって、ざらつい
た画像となり、逆に、線図形にローパスフィルタ処理を
行なって文字や線がぼやけた画像となる虞がある。通
常、カラー写真は、多色により表現されており、色の分
布は、散らばっていることが多い。線図形では限定され
た色により表現され、色の分布は塊のようになっている
ことが多い。したがって、色の分布を調べることにより
誤識別を防ぐことが可能となる。しかし、カラー属性だ
けでは色の分布を調べることが難しい。
合、他の部分より注目すべき部分であることが多い。こ
のような文字は、ファイリングを行なう際のキーワード
となることが想定されるため、より高度な文書処理を考
慮した場合、他の文字と区別して扱うことが重要となっ
てくる。しかし、この場合もカラー属性だけでは、赤色
の文字と他の色との区別をつけるのは難しい。
予め使われている色が分かっているならば、色変換テー
ブルを構築する際に、使われていない色を除外し、逆に
使われている色の分解能をあげることにより、綺麗な出
力を得ることが可能となるが、どのような色分布である
か分からないため、このような適応的なカラーテーブル
を構築することは難しい。
に記載されている方法では、文書要素がどのような色で
描かれているかを示す色分布が分からないため、カラー
画像に於ける特徴を抽出することが困難であった。
は、画像データとして読み込まれた画像の各画素を、前
記画像の画素およびその近傍画素の濃度情報に応じて複
数の画像に分離し、当該各画像から領域を抽出し、抽出
した領域の特徴量により分離された画像毎の属性を識別
する画像処理に於いて、例えば写真領域、線図形領域等
を弁別するための有効な処理手段が存在しなかった。
画像データとして読み込まれた画像の各画素を、前記画
像の画素およびその近傍画素の濃度情報に応じて複数の
画像に分離し、当該各画像から領域を抽出し、抽出した
領域の特徴量により分離された画像毎の属性を識別する
画像処理に於いて、例えば写真領域、線図形領域等を弁
別するための有効な処理が期待できる画像処理装置およ
び画像処理方法を提供することを目的とする。
して読み込まれた画像の各画素を、前記画像の画素およ
びその近傍画素の濃度情報に応じて複数の画像に分離
し、当該各画像から領域を抽出し、抽出した領域の特徴
量により分離された画像毎の属性を識別する画像処理方
法に於いて、前記抽出した領域の複数色毎若しくは特定
色の色の固まり形状を認識し、当該認識した色の固まり
状態の情報を識別条件に前記画像の属性を識別すること
を特徴とする。
データとして読み込まれた画像の各画素を、前記画像の
画素およびその近傍画素の濃度情報に応じて複数の画像
に分離し、当該各画像から領域を抽出し、抽出した領域
の特徴量により分離された画像毎の属性を識別する領域
識別手段と、前記画像データとして読み込まれた画像の
各画素を、前記画像の画素およびその近傍画素の色情報
によって数種類の色に分類する色分類手段と、前記領域
識別手段で取得した画像の属性、および前記色分類手段
で取得した色の各情報をもとに、前記画像データとして
読み込まれた画像の各画素の属性を識別する画素属性識
別手段と、この画素属性識別手段により識別された属性
を画像に変換して出力する画像出力手段とを具備するこ
とを特徴とする。
データとして読み込まれた画像の各画素を、前記画像の
画素およびその近傍画素の濃度情報に応じて複数の画像
に分離し、当該各画像から領域を抽出し、抽出した領域
の特徴量により分離された画像毎の属性を識別する領域
識別手段と、前記画像データとして読み込まれた画像の
各画素を、前記画像の画素およびその近傍画素の色情報
によって数種類の色に分類する色分類手段と、前記領域
識別手段で取得した画像の属性、および前記色分類手段
で取得した色の各情報をもとに、前記画像データとして
読み込まれた画像の各画素の属性を決定する画素属性識
別手段と、前記画素属性識別手段で取得した特定の属性
に対して画像生成方法の変更を行なう画像出力制御手段
と、前記画素属性識別手段で取得した属性を画像に変換
して出力する画像出力手段とを具備することを特徴とす
る。
データとして読み込まれた画像の各画素を、前記画像の
画素およびその近傍画素の濃度情報に応じて複数の画像
に分離し、当該各画像から領域を抽出し、抽出した領域
の特徴量により分離された画像毎の属性を識別する領域
識別手段と、前記領域識別手段で抽出された領域内の各
画素の色情報から前記領域内の色分布の情報を取得する
色分類手段と、前記領域識別手段で取得した画像の属
性、および前記色分類手段で取得した色の各情報をもと
に、前記画像データとして読み込まれた画像の各画素の
属性を識別する画素属性識別手段と、この画素属性識別
手段により識別された属性を画像に変換して出力する画
像出力手段とを具備することを特徴とする。
り、従来発生していた写真領域や線図形領域の誤識別の
軽減につながり、例えばハードコピーをとる場合、写真
領域に対してはローパスフィルタ処理を行って滑らかな
階調を再現するためにローパスフィルタを施すことによ
って、ざらつき感が無くなり、奇麗な出力となり、ま
た、線図形領域に対してはハイパスフィルタ処理を施す
ことによって、文字のエッジ部分が強調され、くっきり
とした出力にすることが可能となる。また、色によって
画像編集の指示を行なったり、ファイリングの際に色付
きの文字をキーワードとして自動登録を行なったりする
ことも可能となる。
施形態を説明する。
システムの構成を示すブロック図である。
取り込み、領域識別部に於いて画素値の濃度差や彩度な
どの状態によって複数の画像データに分離し、物理的あ
るいは論理的に連結しているものを一つの領域として抽
出した後、個々の領域の画像上の位置、大きさ、形状、
構造、濃度分布等の特徴量を計測し、その計測結果を予
め定められたルールに基づいて文書構成要素として識別
し、色分類部に於いて画素値の色相や彩度などの状態に
よって、幾つかの色に分類し、その結果を色分布画像デ
ータとして保持し、更に複数の画像データから抽出され
た領域の情報や色分布画像データより画像の各画素の属
性を決定することによって、文書画像内の領域毎の属性
を検知することができる。また、画像出力制御部で特定
の属性を持った画素に対して色分布画像データに基づ
き、編集処理を行なわせることができる。
ついて、図面を参照して説明する。
処理装置の要部の構成要素を示すブロック図である。
2は領域識別部、103は色分類部、104は画素属性
識別部、105は画像出力部である。
る装置であり、書類を読み取って画像データに変換する
装置であるイメージスキャナ等の画像入力装置により、
文書等の書類から描かれているものを取り込む装置であ
る。尚、この画像入力部101はイメージスキャナ等の
読み取り装置で構成されたものでもよいし、保存された
画像イメージを取り込む装置であってもよい。
於いて入力された画像データから文書要素を領域として
抽出する。先ず、画像入力部101に於いて入力された
画像データに対して、周辺画素の濃度差や彩度などの状
態によって複数の2値の画像データに分離し、各画像よ
り文字や図形等が物理的にあるいは論理的に連結されて
いる各領域に分割して抽出し、その領域の位置、大き
さ、形状、構造、濃度分布等の特徴量を計測して、文書
要素としての各種類や重要度を識別する。文書要素の種
類としては、例えば、文字、写真、図、表、網点などが
あげられる。複数の2値の画像データに分離する具体的
な手法として、既に公知となっているものがあり、例え
ば、特願平10−053317号で開示されている手法
により実現してもよい。この場合、文字画像、中間調画
像、下地画像、網点画像、カラー画像、グレー画像、黒
画像の7つの2値分離画像データが生成される。また、
文書要素の抽出および識別の具体的な手法として、既に
公知となっているものがあり、例えば、特願平8−34
702号で開示されている手法により実現してもよい。
この領域抽出部102では、単一画像データからだけで
はなく、複数画像データでの特徴量をルールに従って統
合し、入力された画像データの領域属性を決定する。例
えば、文字画像と中間調画像の双方から同じ位置に領域
が抽出された場合、その領域の種類や領域の大きさはど
れだけなのかを決定する。具体的な例として、文字画像
上に写真領域が存在し、同じ位置に中間調画像に中間調
画素が存在する場合、銀塩写真領域と決定する。複数画
像データからの領域属性決定の具体的な手法として、既
に公知となっているものがあり、例えば、特願平10−
053317号で開示されている手法により実現しても
よい。
像入力部101に於いて入力された画像データに対し
て、周辺画素の色相や彩度などの状態から幾つかの色
(数種類の色について、その同色の分布の状態)に分類
し、その結果を色分類画像データとして生成するもので
ある。
が、領域識別部102で識別された複数画像データの領
域の種類や重要度と色分離部103で分類された色分類
画像データを用いて、入力された画像データの画素毎の
属性を決定するものである。
4によって決定された領域情報に従って出力を行なう。
出力形態としては、例えば属性の領域情報を画像に変換
したものでもよい。属性の領域情報を画像に変換する具
体的な手法として、既に公知となっているものがあり、
例えば、特願平10−053317号で開示されている
手法により実現してもよい。
形態に於ける画像処理装置の文書処理手順の一例を示す
フローチャートである。
に於ける処理動作を説明する。
り取り込む(ステップST201)。すなわち、スキャ
ナ等の画像入力装置を利用して書類から画像を読み取っ
たり、またはファイリングシステム等の画像ファイルデ
ータを入力したりしたものを、画像入力部101により
画像データに変換する。
1より出力される画像データを1ライン分、または数ラ
イン分ずつ読み取り、周辺画素の濃度差や彩度などの画
素毎の状態によって複数の2値画像データに分離し、更
に文字や図形等が物理的にあるいは論理的に連結されて
いる領域毎に分割して抽出し、その領域の位置、大き
さ、形状、構造、濃度分布等の特徴量を計測して、領域
の種類や重要度等の識別を行ない、その結果、文字、写
真、図、表、網点領域などの文書要素を抽出する(ステ
ップST202)。この処理を入力された画像の全画素
に対して処理が終了するまで繰り返す(ステップST2
03)。
より出力される画像データを1ライン分、または数ライ
ン分ずつ読み取り、周辺画素の色相や彩度などの画素毎
の状態によって各画素がどのような色であるか分類を行
ない、色分布画像データを生成する。その際、データ圧
縮のため、周辺画素の色分布から微小な色分布をその周
囲の大きな色分布に置き換える(ステップST20
4)。この処理を入力された画像の全画素に対して処理
が終了するまで繰り返す(ステップST205)。
類が終了した後、画素属性判別部104に於いて、各画
素の最終的な属性を決定する(ステップST206)。
ここで決定される属性の一例としては、写真と線図形の
区別や色分布情報の付加などである。そして、上記の処
理をすべての画素に対して終了するまで繰り返す(ステ
ップST207)。
の画素属性を画像データとして変換した出力画像を出力
する(ステップST208)。
処理装置の大まかな処理動作である。
理の詳細を説明する。
処理装置に設けられた色分類部103の処理手順の一例
を示すフローチャートであり、図2に示したステップS
T204で行われる処理の手順を示すフローチャートで
ある。
や彩度および輝度値の特徴から入力画像を数種類の色に
分類する。ここで、色の数は、画素属性識別部104で
処理を行なう内容によって決定される。厳密に色を調べ
る必要がある場合、分類数を増やし、逆に大まかな色の
分布が分かればよい場合は、分類数を減らす。一般に分
類数を増やすとデータ量が増大して、コスト的に不具合
が生じる。本発明では、後者の大まかな色の分布が分か
ればよい場合について述べる。
d)、黄色(yellow)、緑(green)、シアン(cyan)、青(blu
e)、マゼンダ(magenta)、白(white)、グレー(gray)、黒
(black)の9通りの色に分類する一例を示す。
タ151は、RGBで表現されるカラー情報を含んだも
のである。このRGBで表わされた画像データを一例と
して次式によって示されるYUV線形変換によって輝度
値Yに変換する(ステップST301)。
に於ける画素のRGB値である。また、同じRGBで表
わされた画像データを一例として表1に示される変換式
を用いて彩度Sに変換する。
ーモデルを示し、図5はそのモデルの断面を表してい
る。図5の中央部の小さい円の領域は、白、グレー、黒
のいずれかになる領域である。
(green)、シアン(cyan)、青(blue)、マゼンダ(magenta)
の何れかに分類される。
色(yellow)、緑(green)、シアン(cyan)、青(blue)、マ
ゼンダ(magenta)、白(white)、グレー(gray)、黒(blac
k)の何れかになる。
の一行分行ない、その結果をメモリ内に保存する。
を行なう(ステップST302)。ここでは、現在の行
の色分布データと一つ前の行の色分布データからx方向
の解像度を落としながら色分布を決定していく。
を決定する画素位置を(i,j)とすると、i−1行で
前後3N画素、i行で前後3N画素分の色分布を調べ、
赤(red)、黄色(yellow)、緑(green)、シアン(cyan)、青
(blue)、マゼンダ(magenta)、白(white)、グレー(gra
y)、黒(black)ごとにカウントする。その結果、最もカ
ウント数が多い色をその画素の色分布と決定する。
のrは赤(red)を、mはマゼンダ(magenta)を、gはグレ
ー(gray)を、bは黒(black)を表している。該当する画
素に於いて各々の色をカウントすると、r=8、g=
5、m=3、b=2となる。これより色分布は赤と決定
できる。以上の処理により、解像度を落とした大まかな
色の分布状態がわかる色分布を決定できる。
ータを生成する(ステップST303)。これは、ラン
レングスデータのように「色の識別子+連続する画素
数」という表現でデータを記述することにより、更に圧
縮することが可能となる。その結果、色分布画像データ
152が出力される。
色分布画像データが生成される。
図7は本発明の第1実施形態に於ける画像処理装置に設
けられた画素属性識別部104の画素属性識別処理手順
を示すフローチャートであり、図2のステップST20
6で行われる処理の詳細を示すフローチャートである。
の結果を比較することによって、領域識別結果の確認と
修正を行なう処理である。以下、図7に示すフローチャ
ートに従って画素属性識別処理動作を説明する。
て、識別を行ない、その結果を出力する。また、色分類
部103では、数種類の色の分類を行ない、その結果を
色分布画像データとして出力する。画素属性識別部10
4では、領域識別の結果とそれに対応する位置の色分布
画像データの情報から領域識別結果の再判定を行なう。
以下の例では、カラー写真と識別された領域に対しての
再判定方法を述べる。尚、ここでの写真はカラー写真の
ことを指す。
うかを調べる(ステップST401)。写真属性を持っ
ていない場合、例えばテキスト属性である場合、そのま
ま修正領域データ154として出力する。
タ153が写真属性であった場合、色分布画像データ1
52から該当する領域の色分布情報のうち、色数を調査
する(ステップST402)。写真であるならば、さま
ざまな色で表現されることが多い。そのような領域で
は、色分類の結果として、いくつもの色が検出される。
逆に、色分類の結果、単色に近い場合、複雑な線図形と
みなすことができる。多くの色が存在している場合、写
真と判定し、そのまま修正領域データ154として出力
する(ステップST403)。また、単色に近い場合、
次に色分布画像データ152から該当する領域の色分布
の偏りを調査する(ステップST404)。写真である
ならば、色が領域中に散らばっていることが多い。逆
に、線図形であるならば、オブジェクトに単一色を割り
当てることが多いため、色の分布に偏りが生じることが
予想される。色の偏りを調べる方法としては、色分布画
像データが色情報をもったランレングスデータで表現さ
れているため、色毎の領域抽出処理を行ない、写真と同
じ領域で抽出された同一色領域の大きさや形状や画素の
分布といった特徴量を抽出してもよい。その結果、色に
偏りが無い場合、写真と判定し、そのまま修正領域デー
タ154として出力する(ステップST405)。偏り
がある場合、線図形と判定し、写真属性から線図形属性
に修正した修正領域データ154を出力する(ステップ
ST406)。
で、識別精度の向上を図ることが可能となる。
ける画像処理装置に入力される一例としての画像データ
の例である。ここでは画像データ501として、線図形
部分502と、文章部分503が描かれているものを示
してある。この例を用いて画素属性識別部104に於け
る実際の処理過程を説明する。
力部101より取り込み、領域識別部102によって領
域として抽出した線図形部分502は、複雑なグラフで
あるために、写真領域と誤識別され、文章部分503は
文字領域として識別される。その結果は、例えば、線図
形領域、は写真領域と誤識別され、図9の502aの如
く、文字領域は503aの如く出力される。
502aは、画素属性識別部104によって写真である
か否か再判定される。この際は、色分類部103で生成
された色分布画像データによって、写真領域と誤識別さ
れた線図形領域502aは色が少ないと判定されたとす
る。その後、色分布画像データから同一色領域の抽出を
行ない、その大きさや形状や画素の分布状態から、色の
分布に偏りがあると判定される。したがって、画素属性
識別部104の出力としては、修正領域データとして、
写真領域を線図形領域と変更し、出力することとなる。
置によると複雑な線図形領域を写真領域として誤識別し
た場合であっても、色の分布状態から、線図形として正
しく識別することが可能となる。
細であるまた、別の形態では、色分類部103で生成さ
れる色分布画像データにしたがって、出力を制御するこ
とも可能である。この機能を実現した画像処理装置の一
例を本発明の第2実施形態として説明する。
り具体的な処理の一例について、図面を参照して説明す
る。
像処理装置の一構成例を示すブロック図である。
02は領域識別部、103は色分類部、104は画素属
性識別部、105は画像出力部、106は画像出力制御
部である。
分類部103、および画素属性識別部104について
は、上述した第1実施形態に於いて、図1を用いて説明
した構成要素と同様のものであり、ここではその説明を
省略する。
で生成される色分布画像データにしたがって、画像出力
方法の変更を行ない、その情報を画像出力部105へ渡
す。
る一例としての画像データの例である。ここでは画像デ
ータ601として、写真部分602と、文章部分603
と、閉曲線604が描かれているものを示している。文
章部分603は黒で、閉曲線604は赤で描かれている
とする。この例を用いて画像出力制御部106に於ける
処理の一例を説明する。
ータ601は、領域識別部102によって領域抽出され
る。ここでは、図12に於ける写真領域602aと文字
領域603aと赤の平曲線604aとに識別される。
の状態と色が対応付けられたルールによって構成され
る。例えば、「赤の閉曲線で囲まれた領域内に存在する
文字の色を赤で置き換える」というルールが記述されて
いるならば、色分類部103で生成される色分布画像デ
ータを参照することによって、閉曲線604a内に存在
する文字領域603aの文字を「黒」から「赤」に置き
換えることが可能となる。上述した従来技術では、閉曲
線604a内の全て黒が赤に置き換えられてしまうが、
本発明に於いては、画素属性とその色を対応付けること
が可能であるため、このような高度な編集も可能とな
る。
画像ファイリングであっても効果がある。
り具体的な処理の一例について、図面を参照して説明す
る。
像処理装置に入力される一例としての画像データの例で
ある。ここでは画像データ701として、線図形部分7
02と、文章部分703が描かれており、更に文字70
4と文字705は赤で描かれているとする。この例を用
いて、上記画像出力制御部106に於ける処理の一例を
説明する。
像データ701は、領域識別部102によって領域抽出
される。ここでは、図14に於ける線図形領域702a
と文字領域703aとに識別される。
書に於いて重要な意味を成すことが多いため、ファイリ
ング時のキーワードとして利用することが考えられる。
する場合、その文字領域に対して文字認識処理を行なわ
せ、キーワードとして登録する」というルールを記述し
ておくと、上述した色分類部103で生成される色分布
画像データを参照することによって、文字領域703a
中に赤で描かれている文字704aと705aを自動的
に抽出して、キーワード登録することも可能となる。
画像データを画像入力部101により取り込み、この画
像データ(カラー画像)を領域識別部102に於いて画
素値の濃度差や彩度などの状態により複数の画像データ
に分離し、物理的あるいは論理的に連結しているものを
一つの領域として抽出した後、個々の領域の画像上の位
置、大きさ、形状、構造、濃度分布等の特徴量を計測
し、更に、その計測結果を予め定められたルールに基づ
いて文書構成要素として識別し、色分類部103に於い
て画素値の色相や彩度などの状態によって、幾つかの色
に分類し、その結果を色分布画像データとして保持し、
画素属性識別部104に於いて領域識別データと色分布
画像データから文書内の各画素の属性を決定し、画像出
力部105によって、構造的な画素属性を出力してい
る。このような処理機能をもつことで、文書要素の識別
精度を向上させることが可能となり、また色の違いを利
用した、より高度な編集処理を行なうことが可能とな
る。
画像データとして読み込まれた画像の各画素を、前記画
像の画素およびその近傍画素の濃度情報に応じて複数の
画像に分離し、当該各画像から領域を抽出し、抽出した
領域の特徴量により分離された画像毎の属性を識別する
画像処理に於いて、例えば写真領域、線図形領域等を弁
別するための有効な処理が期待できる。
ーしたり、イメージデータに変換して保存しようとする
場合、入力されたカラー画像に対して、画素値の濃度差
や彩度などの状態によって複数の画像データに分離し、
物理的あるいは論理的に連結しているものを一つの領域
として抽出した後、個々の領域の画像上の位置、大き
さ、形状、構造、濃度分布等の特徴量を計測し、その計
測結果を予め定められたルールに基づいて文書構成要素
として識別し、画素値の色相や彩度などの状態によっ
て、幾つかの色に分類して、その結果を色分布画像デー
タとして保持し、領域識別結果と色分布画像データの比
較により、文書要素の識別精度を向上させることが可能
となる。その結果、従来発生していた写真領域や線図形
領域の誤識別の軽減につながり、例えばハードコピーを
とる場合、写真領域に対してはローパスフィルタ処理を
行って滑らかな階調を再現するためにローパスフィルタ
を施すことによって、ざらつき感が無くなり、奇麗な出
力となる。また、線図形領域ではハイパスフィルタ処理
を施すことによって、文字のエッジ部分が強調され、く
っきりとした出力にすることが可能となる。また、色に
よって画像編集の指示を行なったり、ファイリングの際
に色付きの文字をキーワードとして自動登録を行なった
りすることも可能となる。
要部の構成要素を示すブロック図。
すフローチャート。
例を示すフローチャート。
明するための画素変換のカラーモデルを示す図。し、図
5はそのモデルの断面を表している。
作説明図。
順を示すフローチャート
データの一例を示す図。
図。
の要部の構成要素を示すブロック図。
像データの一例を示す図。
示す図。
像データの一例を示す図。
示す図。
文字
Claims (9)
- 【請求項1】 画像データとして読み込まれた画像の各
画素を、前記画像の画素およびその近傍画素の濃度情報
に応じて複数の画像に分離し、当該各画像から領域を抽
出し、抽出した領域の特徴量により分離された画像毎の
属性を識別する領域識別手段と、 前記画像データとして読み込まれた画像の各画素を、前
記画像の画素およびその近傍画素の色情報によって数種
類の色に分類する色分類手段と、 前記領域識別手段で取得した画像の属性、および前記色
分類手段で取得した色の各情報をもとに、前記画像デー
タとして読み込まれた画像の各画素の属性を識別する画
素属性識別手段と、 この画素属性識別手段により識別された属性を画像に変
換して出力する画像出力手段とを具備することを特徴と
する画像処理装置。 - 【請求項2】 画像データとして読み込まれた画像の各
画素を、前記画像の画素およびその近傍画素の濃度情報
に応じて複数の画像に分離し、当該各画像から領域を抽
出し、抽出した領域の特徴量により分離された画像毎の
属性を識別する領域識別手段と、 前記画像データとして読み込まれた画像の各画素を、前
記画像の画素およびその近傍画素の色情報によって数種
類の色に分類する色分類手段と、 前記領域識別手段で取得した画像の属性、および前記色
分類手段で取得した色の各情報をもとに、前記画像デー
タとして読み込まれた画像の各画素の属性を決定する画
素属性識別手段と、 前記画素属性識別手段で取得した特定の属性に対して画
像生成方法の変更を行なう画像出力制御手段と、 前記画素属性識別手段で取得した属性を画像に変換して
出力する画像出力手段とを具備することを特徴とする画
像処理装置。 - 【請求項3】 画像データとして読み込まれた画像の各
画素を、前記画像の画素およびその近傍画素の濃度情報
に応じて複数の画像に分離し、当該各画像から領域を抽
出し、抽出した領域の特徴量により分離された画像毎の
属性を識別する領域識別手段と、 前記領域識別手段で抽出された領域内の各画素の色情報
から前記領域内の色分布の情報を取得する色分類手段
と、 前記領域識別手段で取得した画像の属性、および前記色
分類手段で取得した色の各情報をもとに、前記画像デー
タとして読み込まれた画像の各画素の属性を識別する画
素属性識別手段と、 この画素属性識別手段により識別された属性を画像に変
換して出力する画像出力手段とを具備することを特徴と
する画像処理装置。 - 【請求項4】 前記色分類手段は、数種類の色に分類し
た結果を画像として保持することを特徴とする請求項1
または2記載の画像処理装置。 - 【請求項5】 前記色分類手段は、前記画像データとし
て読み込まれた画像の各画素を、前記画像の画素および
その近傍画素の色情報によって数種類の色に分類し、そ
の各色毎若しくは特定色の分布の状態を表す情報を色の
情報として取得する請求項1または2記載の画像処理装
置。 - 【請求項6】 前記色分類手段により取得された色の情
報に従う、少なくとも、色の数、若しくは同色画素の固
まり状態、若しくは同色系画素の固まり形状を判別条件
として、前記領域識別手段で抽出された領域の属性を認
識する請求項1または2または3記載の画像処理装置。 - 【請求項7】 前記色分類手段で取得した色の情報を一
判別条件に、前記画像データとして読み込まれた画像
に、写真領域が存在することを認識する請求項1または
2または3記載の画像処理装置。 - 【請求項8】 前記色分類手段で取得した色の情報を一
判別条件に、前記画像データとして読み込まれた画像
に、線図領域が存在することを認識する請求項1または
2または3記載の画像処理装置。 - 【請求項9】 画像データとして読み込まれた画像の各
画素を、前記画像の画素およびその近傍画素の濃度情報
に応じて複数の画像に分離し、当該各画像から領域を抽
出し、抽出した領域の特徴量により分離された画像毎の
属性を識別する画像処理方法に於いて、 前記抽出した領域の複数色毎若しくは特定色の色の固ま
り形状を認識し、当該認識した色の固まり状態の情報を
識別条件に前記画像の属性を識別することを特徴とする
画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001278478A JP4060559B2 (ja) | 2001-09-13 | 2001-09-13 | 画像処理装置および画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001278478A JP4060559B2 (ja) | 2001-09-13 | 2001-09-13 | 画像処理装置および画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003087562A true JP2003087562A (ja) | 2003-03-20 |
JP4060559B2 JP4060559B2 (ja) | 2008-03-12 |
Family
ID=19102841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001278478A Expired - Fee Related JP4060559B2 (ja) | 2001-09-13 | 2001-09-13 | 画像処理装置および画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4060559B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006256299A (ja) * | 2005-03-15 | 2006-09-28 | Toshiba Corp | 画像形成装置及び画像生成方法 |
US7271784B2 (en) | 2002-12-18 | 2007-09-18 | Semiconductor Energy Laboratory Co., Ltd. | Display device and driving method thereof |
US7425937B2 (en) | 2002-08-09 | 2008-09-16 | Semiconductor Energy Laboratory Co., Ltd. | Device and driving method thereof |
US7684620B2 (en) | 2005-03-22 | 2010-03-23 | Kabushiki Kaisha Toshiba | Image processing apparatus and method for dividing an image into component images |
JP2010146218A (ja) * | 2008-12-17 | 2010-07-01 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
JP2010193154A (ja) * | 2009-02-18 | 2010-09-02 | Mitsubishi Electric Corp | 画像処理装置および画像処理方法 |
JP2012185810A (ja) * | 2011-02-18 | 2012-09-27 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2017175524A (ja) * | 2016-03-25 | 2017-09-28 | 株式会社日立ドキュメントソリューションズ | 文書管理システムおよびイメージデータ管理方法 |
CN116977998A (zh) * | 2023-07-27 | 2023-10-31 | 江苏苏力机械股份有限公司 | 涂装生产线工件上件视觉识别系统及识别方法 |
-
2001
- 2001-09-13 JP JP2001278478A patent/JP4060559B2/ja not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7425937B2 (en) | 2002-08-09 | 2008-09-16 | Semiconductor Energy Laboratory Co., Ltd. | Device and driving method thereof |
US7271784B2 (en) | 2002-12-18 | 2007-09-18 | Semiconductor Energy Laboratory Co., Ltd. | Display device and driving method thereof |
JP2006256299A (ja) * | 2005-03-15 | 2006-09-28 | Toshiba Corp | 画像形成装置及び画像生成方法 |
US7684620B2 (en) | 2005-03-22 | 2010-03-23 | Kabushiki Kaisha Toshiba | Image processing apparatus and method for dividing an image into component images |
JP2010146218A (ja) * | 2008-12-17 | 2010-07-01 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
US8363934B2 (en) | 2008-12-17 | 2013-01-29 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and computer program |
JP2010193154A (ja) * | 2009-02-18 | 2010-09-02 | Mitsubishi Electric Corp | 画像処理装置および画像処理方法 |
JP2012185810A (ja) * | 2011-02-18 | 2012-09-27 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2017175524A (ja) * | 2016-03-25 | 2017-09-28 | 株式会社日立ドキュメントソリューションズ | 文書管理システムおよびイメージデータ管理方法 |
CN116977998A (zh) * | 2023-07-27 | 2023-10-31 | 江苏苏力机械股份有限公司 | 涂装生产线工件上件视觉识别系统及识别方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4060559B2 (ja) | 2008-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7376272B2 (en) | Method for image segmentation to identify regions with constant foreground color | |
JP3258122B2 (ja) | 画像処理装置 | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
CN104899586B (zh) | 对图像中包含的文字内容进行识别方法及装置 | |
US9171224B2 (en) | Method of improving contrast for text extraction and recognition applications | |
EP1327955A2 (en) | Text extraction from a compound document | |
CN101551859B (zh) | 图像辨别装置及图像检索装置 | |
KR20010113578A (ko) | 코드인식을 위한 장치 및 그 방법 | |
JP2001297303A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
US8611658B2 (en) | Image processing apparatus and image processing method | |
TW200842734A (en) | Image processing program and image processing device | |
JP2008187710A (ja) | 画像特性特定方法、画像特性特定システム、背景色決定方法、制御プログラム、および、記録媒体 | |
JP3018949B2 (ja) | 文字読取装置およびその方法 | |
JP4060559B2 (ja) | 画像処理装置および画像処理方法 | |
KR100513784B1 (ko) | 영상 개선 방법 및 장치 | |
CN108877030B (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
JP5887242B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JPH08242375A (ja) | 画像処理装置及び方法 | |
JP5929282B2 (ja) | 画像処理装置及び画像処理プログラム | |
US10887491B2 (en) | Image processing apparatus for processing of highlighted regions | |
JP2010186246A (ja) | 画像処理装置、方法、及び、プログラム | |
JP4001446B2 (ja) | 画像背景色特定のための方法、装置及びコンピュータ読み取り可能な記録媒体 | |
JP3955467B2 (ja) | 画像処理プログラム及び画像処理装置 | |
RU2571510C2 (ru) | Метод и устройство, использующие увеличение изображения для подавления визуально заметных дефектов на изображении | |
JP4116377B2 (ja) | 画像処理方法および画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070122 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071112 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20071119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071220 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101228 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4060559 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101228 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111228 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121228 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131228 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |