〔実施形態1〕
本発明の一実施形態について説明する。なお、本実施形態では、本発明をデジタルカラー複合機(MFP:Multi-Function Printer)に適用する場合の一例について説明する。
(1−1. デジタルカラー複合機1の構成)
図2は、本実施形態にかかるデジタルカラー複合機(画像処理装置、画像形成装置、画像読取装置)1の概略構成を示すブロック図である。このデジタルカラー複合機1は、コピー機能、プリンタ機能、ファクシミリ送信機能、スキャナ機能、scan to e-mail機能等を有している。
図2に示すように、デジタルカラー複合機1は、カラー画像入力装置2、カラー画像処理装置3、カラー画像出力装置4、通信装置5、操作パネル6を備えている。
カラー画像入力装置(画像読取装置)2は、例えばCCD(Charge Coupled Device )などの光学情報を電気信号に変換するデバイスを備えたスキャナ部(図示せず)より構成され、原稿からの反射光像を、RGB(R:赤・G:緑・B:青)のアナログ信号としてカラー画像処理装置3に出力する。
カラー画像処理装置3は、A/D変換部11、シェーディング補正部12、文書照合処理部13、入力階調補正部14、領域分離処理部15、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、出力階調補正部19、および階調再現処理部20を備えている。カラー画像入力装置2からカラー画像処理装置3に出力されたアナログ信号は、カラー画像処理装置3内を、A/D変換部11、シェーディング補正部12、文書照合処理部13、入力階調補正部14、領域分離処理部15、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、出力階調補正部19、階調再現処理部20の順で送られ、CMYKのデジタルカラー信号としてカラー画像出力装置4に出力される。
A/D(アナログ/デジタル)変換部11は、RGBのアナログ信号をデジタル信号に変換するものである。
シェーディング補正部12は、A/D変換部11より送られてきたデジタルのRGB信号に対して、カラー画像入力装置2の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施すものである。また、シェーディング補正部12は、カラーバランスの調整、および濃度信号などカラー画像処理装置3に採用されている画像処理システムの扱い易い信号に変換する処理を施す。
文書照合処理部13は、入力画像データと登録画像との類似性(類似あり/類似なし)を判定する。また、文書照合処理部13は入力されたRGB信号をそのまま後段の入力階調補正部14へ出力する。なお、文書照合処理部13の詳細については後述する。
入力階調補正部14は、シェーディング補正部にて各種の歪みが取り除かれたRGB信号に対して、下地色(下地色の濃度成分:下地濃度)の除去やコントラストなどの画質調整処理を施す。
領域分離処理部15は、RGB信号より、入力画像中の各画素を文字領域、網点領域、写真領域のいずれかに分離するものである。領域分離処理部15は、分離結果に基づき、画素がどの領域に属しているかを示す領域識別信号を、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、および階調再現処理部20へと出力するとともに、入力階調補正部14より出力された入力信号をそのまま後段の色補正部16に出力する。
色補正部16は、色再現の忠実化実現のために、不要吸収成分を含むCMY(C:シアン・M:マゼンタ・Y:イエロー)色材の分光特性に基づいた色濁りを取り除く処理を行うものである。
黒生成下色除去部17は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行うものである。これにより、CMYの3色信号はCMYKの4色信号に変換される。
空間フィルタ処理部18は、黒生成下色除去部17より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正する。これにより、出力画像のぼやけや粒状性劣化を軽減することができる。階調再現処理部20も、空間フィルタ処理部18と同様、CMYK信号の画像データに対して領域識別信号を基に所定の処理を施すものである。
例えば、領域分離処理部15にて文字に分離された領域は、特に黒文字あるいは色文字の再現性を高めるために、空間フィルタ処理部18による空間フィルタ処理における鮮鋭強調処理で高周波数の強調量が大きくされる。同時に、階調再現処理部20においては、高域周波数の再現に適した高解像度のスクリーンでの二値化または多値化処理が選択される。
また、領域分離処理部15にて網点領域に分離された領域に関しては、空間フィルタ処理部18において、入力網点成分を除去するためのローパス・フィルタ処理が施される。そして、出力階調補正部19では、濃度信号などの信号をカラー画像出力装置4の特性値である網点面積率に変換する出力階調補正処理を行った後、階調再現処理部20で、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理(中間調生成)が施される。領域分離処理部15にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの二値化または多値化処理が行われる。
上述した各処理が施された画像データは、いったん記憶装置(図示せず)に記憶され、所定のタイミングで読み出されてカラー画像出力装置4に入力される。
カラー画像出力装置4は、カラー画像処理装置3から入力された画像データを記録材(例えば紙等)上に出力するものである。カラー画像出力装置4の構成は特に限定されるものではなく、例えば、電子写真方式やインクジェット方式を用いたカラー画像出力装置を用いることができる。
通信装置5は、例えばモデムやネットワークカードより構成される。通信装置5は、ネットワークカード、LANケーブル等を介して、ネットワークに接続された他の装置(例えば、パーソナルコンピュータ、サーバー装置、他のデジタル複合機等)とデータ通信を行う。
なお、通信装置5は、画像データを送信する場合、相手先との送信手続きを行って送信可能な状態が確保されると、所定の形式で圧縮された画像データ(スキャナで読み込まれた画像データ)をメモリから読み出し、圧縮形式の変更など必要な処理を施して、通信回線を介して相手先に順次送信する。
また、通信装置5は、画像データを受信する場合、通信手続きを行うとともに、相手先から送信されてくる画像データを受信してカラー画像処理装置3に入力する。受信した画像データは、カラー画像処理装置3で伸張処理、回転処理、解像度変換処理、出力階調補正、階調再現処理などの所定の処理が施され、カラー画像出力装置4によって出力される。なお、受信した画像データを記憶装置(図示せず)に保存し、カラー画像処理装置3が必要に応じて読み出して上記所定の処理を施すようにしてもよい。
操作パネル6は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどより構成され(いずれも図示せず)、デジタルカラー複合機1の主制御部(図示せず)の指示に応じた情報を上記表示部に表示するとともに、上記設定ボタンを介してユーザから入力される情報を上記主制御部に伝達する。ユーザは、操作パネル6を介して入力画像データに対する処理要求(例えば処理モード(複写、印刷、送信、編集など)、処理枚数(複写枚数、印刷枚数)、入力画像データの送信先など)を入力することができる。上記主制御部は、例えばCPU(Central Processing Unit)等からなり、図示しないROM等に格納され
たプログラムや各種データ、操作パネル6から入力される情報等に基づいて、デジタルカラー複合機1の各部の動作を制御する。
(1−2. 文書照合処理部の構成)
次に、文書照合処理部13の詳細について説明する。本実施形態にかかる文書照合処理部13は、入力画像データから複数の特徴点を抽出し、抽出した各特徴点に対して局所的な特徴点の集合を決定し、決定した各集合から特徴点の部分集合を選択し、選択した各部分集合を特徴付ける量として、部分集合中の特徴点に関する複数の組み合わせに基づいて、幾何学的変換に対する不変量をそれぞれ求め、求めた各不変量を組み合わせてハッシュ値を計算し、計算したハッシュ値に対応する登録画像に投票することにより、入力画像データに類似する登録画像の検索、当該登録画像に対する類似性の判定処理(類似あり/類似なしの判定)を行う。
図1は、文書照合処理部13の概略構成を示すブロック図である。この図に示すように、文書照合処理部13は、特徴点算出部31、特徴量算出部32、投票処理部33、類似度判定処理部34、登録処理部37を備えている。なお、文書照合処理部13の各部の動作は、カラー画像処理装置3に備えられる制御部7によって制御される。この制御部7は、デジタルカラー複合機1の各部の動作を制御するための主制御部に備えられていてもよく、主制御部とは別に備えられ、主制御部と協働して文書照合処理部13の動作を制御するものであってもよい。また、カラー画像処理装置3には文書照合処理部13の各部の処理に用いられる各種データ、処理結果等を記憶するためのメモリ8が備えられており、制御部7はメモリ8に記憶されているこれらの情報を適宜参照して処理を行うようになっている。
特徴点算出部31は、文字列や罫線の連結部分を抽出し、連結部分の重心を特徴点として算出する。
図3は、特徴点算出部31の概略構成を示すブロック図である。この図に示すように、特徴点算出部31は、信号変換処理部(無彩化処理部)41、解像度変換部42、MTF処理部43、2値化処理部44、重心算出部45を備えている。
信号変換処理部41は、シェーディング補正部12から入力された画像データ(RGB信号)がカラー画像であった場合にこの画像データを無彩化して、明度信号もしくは輝度信号に変換するものである。
例えば、信号変換処理部41は、下記式(1)によりRGB信号を輝度信号Yに変換する。
Yi=0.30Ri+0.59Gi+0.11Bi ・・・(1)
ここで、Yは各画素の輝度信号であり、R,G,Bは各画素のRGB信号における各色成分であり、添え字のiは画素毎に付与された値(iは1以上の整数)である。
あるいは、RGB信号をCIE1976L*a*b*信号(CIE:Commission International de l'Eclairage、L*:明度、a*,b*:色度)に変換してもよい。
解像度変換部42は、入力画像データを変倍処理する。例えば、解像度変換部42は、入力画像データがカラー画像入力装置2で光学的に変倍されている場合に、所定の解像度になるように入力画像データを再度変倍する。また、解像度変換部42が、後段の各処理部における処理量を軽減するために、カラー画像入力装置2で等倍時に読み込まれる解像度よりも解像度を落とすための解像度変換を行うようにしてもよい(例えば、600dpi(dot per inch)で読み込まれた画像データを300dpiに変換するなど)。
MTF(modulation transfer function)処理部43は、カラー画像入力装置2の空間周波数特性が機種ごとに異なることを吸収(調整)するために用いられる。CCDの出力する画像信号には、レンズやミラー等の光学部品、CCDの受光面のアパーチャ開口度、転送効率や残像、物理的な走査による積分効果及び走査むら等に起因しMTFの劣化が生じている。このMTFの劣化により、読み込まれた画像がぼやけたものとなっている。MTF処理部43は、適切なフィルタ処理(強調処理)を施すことにより、MTFの劣化により生じるぼやけを修復する処理を行う。また、後段の重心算出部45における特徴点抽出処理に不要な高周波成分を抑制するためにも用いる。すなわち、混合フィルタ(図示せず)を用いて強調および平滑化処理を行う。なお、図4は、この混合フィルタにおけるフィルタ係数の一例を示している。
2値化処理部44は、無彩化された画像データ(輝度値(輝度信号)または明度値(明度信号))と、予め設定された閾値とを比較することにより画像データを二値化する。
重心算出部45は、2値化処理部44で2値化された画像データ(例えば、「1」、「0」で表される)に基づいて、各画素に対してラベリング(ラベル付け処理)を行う。そして、同一ラベルが付された画素が連結した連結領域を特定し、特定した連結領域の重心を特徴点として抽出する。さらに、抽出した特徴点を特徴量算出部32へ出力する。図5は、入力画像データから抽出された連結領域およびこの連結領域の重心の一例を示す説明図であり、「A」という文字列に対応する連結領域および重心を示している。また、図6は、入力画像データに含まれる文字列から抽出された複数の連結領域の各重心(特徴点)の一例を示す説明図である。なお、上記特徴点は、二値画像における座標値(x座標、y座標)で表すことができる。
特徴量算出部32は、特徴点抽出部32a、不変量算出部32b、ハッシュ値算出部32cを備えており、特徴点算出部31で算出された特徴点を用いて、原稿画像の回転、平行移動、拡大、縮小、平行移動等の幾何学的変形に対して不変な量である特徴量(ハッシュ値および/または不変量)を算出する。
特徴点抽出部32aは、図7に示すように、1つの特徴点を注目特徴点とし、この注目特徴点の周辺の特徴点を、注目特徴点からの距離が近いものから順に所定数(ここでは4点)だけ周辺特徴点として抽出する。図7の例では、特徴点aを注目特徴点とした場合には特徴点b,c,d,eの4点が周辺特徴点として抽出され、特徴点bを注目特徴点とした場合には特徴点a,c,e,fの4点が周辺特徴点として抽出される。
また、特徴点抽出部32aは、上記のように抽出した周辺特徴点4点の中から選択しうる3点の組み合わせを抽出する。例えば、図8(a)〜図8(c)に示すように、図7に示した特徴点aを注目特徴点とした場合、周辺特徴点b,c,d,eのうちの3点の組み合わせ、すなわち、周辺特徴点b,c,d、周辺特徴点b,c,e、周辺特徴点b,d,eの各組み合わせが抽出される。
次に、不変量算出部32bは、抽出した各組み合わせについて、幾何学的変形に対する不変量(特徴量の1つ)H’ijを算出する。ここで、iは注目特徴点を示す数(iは1以上の整数)であり、jは周辺特徴点3点の組み合わせを示す数(jは1以上の整数)である。本実施形態では、周辺特徴点同士を結ぶ線分の長さのうちの2つの比を不変量Hijとする。なお、上記線分の長さは、各周辺特徴点の座標値に基づいて算出すればよい。例えば、図8(a)の例では、特徴点cと特徴点dとを結ぶ線分の長さをA11、特徴点cと特徴点bとを結ぶ線分の長さをB11とすると、不変量H11はH11=A11/B11である。また、図8(b)の例では、特徴点cと特徴点bとを結ぶ線分の長さをA12、特徴点bと特徴点eとを結ぶ線分の長さをB12とすると、不変量H12はH12=A12/B12である。また、図8(c)の例では、特徴点dと特徴点bとを結ぶ線分の長さをA13、特徴点bと特徴点eとを結ぶ線分の長さをB13とすると、不変量H13はH13=A13/B13である。このようにして、図8(a)〜図8(c)の例では、不変量H11,H12,H13が算出される。なお、上記の例では、水平方向左側に位置する周辺特徴点と水平方向中央に位置する周辺特徴点とを結ぶ線分をAij、水平方向中央に位置する周辺特徴点と水平方向右側に位置する周辺特徴点とを結ぶ線分をBijとしたが、これに限らず、不変量Hijの算出に用いる線分は任意の方法で選定すればよい。
次に、ハッシュ値算出部32cは、
(H’i1×102+H’i2×101+H’i3×100)/D ・・・(2)
の余りの値をハッシュ値(特徴量の1つ)Hiとして算出し、メモリ8に記憶させる。なお、上記Dは余りが取り得る値の範囲をどの程度に設定するかに応じて予め設定される定数である。
なお、不変量H’ijの算出方法は特に限定されるものではなく、例えば、注目特徴点の近傍5点の複比、近傍n点(nはn≧5の整数)から抽出した5点の複比、近傍n点から抽出したm点(mはm<nかるm≧5の整数)の配置およびm点から抽出した5点の複比に基づいて算出される値などを注目特徴点についての上記不変量H’ijとしてもよい。なお、複比とは、直線上の4点または平面上の5点から求められる値であり、幾何学的変換の一種である射影変形に対する不変量として知られている。
また、ハッシュ値Hiの算出するための式についても上記式(2)に限るものではなく、他のハッシュ関数(例えば特許文献3に記載されているハッシュ関数のうちのいずれか)を用いてもよい。
また、特徴量算出部32の各部は、1つの注目特徴点に対する周辺特徴点の抽出およびハッシュ値Hiの算出が終わると、注目特徴点を他の特徴点に変更して周辺特徴点の抽出およびハッシュ値の算出を行い、全ての特徴点についてのハッシュ値を算出する。
図7の例では、特徴点aを注目特徴点とした場合の周辺特徴点およびハッシュ値の抽出が終わると、次に特徴点bを注目特徴点とした場合の周辺特徴点およびハッシュ値の抽出を行う。図7の例では、特徴点bを注目特徴点とした場合、特徴点a,c,e,fの4点が周辺特徴点として抽出される。そして、図9(a)〜図9(c)に示すように、これら周辺特徴点a,c,e,fの中から選択される3点の組み合わせ(周辺特徴点a,e,f、周辺特徴点c,e,f、周辺特徴点a,c,f)を抽出し、各組み合わせについてハッシュ値Hiを算出し、メモリ8に記憶させる。そして、この処理を各特徴点について繰り返し、各特徴点を注目特徴点とした場合のハッシュ値をそれぞれ求めてメモリ8に記憶させる。
なお、特徴点aを注目特徴点としたときの不変量の算出方法は上記の方法に限るものではない。例えば、図28(a)〜図28(d)に示すように、図7に示した特徴点aを注目特徴点とした場合、周辺特徴点b,c,d,eのうちの3点の組み合わせ、すなわち、周辺特徴点b,c,d、周辺特徴点b,c,e、周辺特徴点b,d,e、周辺特徴点c,d,eの各組み合わせを抽出し、抽出した各組み合わせについて、幾何学的変形に対する不変量(特徴量の1つ)Hijを算出するようにしても良い。
また、図7に示した特徴点bを注目特徴点とした場合、図29(a)〜図29(d)に示すように、特徴点a,c,e,fの4点の周辺特徴点の中から、ある3点の組み合わせ(周辺特徴点a,e,f、周辺特徴点a,c,e、周辺特徴点a,f,c、周辺特徴点e,f,c)を抽出し、各組み合わせについて幾何学的変形に対する不変量Hijを算出するようにしてもよい。なお、この場合、(Hi1×103+Hi2×102+Hi3×101+Hi4×100)/Dの余りの値をハッシュ値として算出し、メモリ8に記憶させればよい。
また、上記の例では、注目特徴点に最も近い周辺特徴点と2番目に近い周辺特徴点とを結ぶ線分をAij、注目特徴点に最も近い周辺特徴点と3番目に近い周辺特徴点とを結ぶ線分をBijとしたが、これに限らず、周辺特徴点間を結ぶ線分の長さを基準にして選定する等、不変量Hijの算出に用いる線分は任意の方法で選定すればよい。
なお、特徴量算出部32は、入力画像データを登録画像として登録する登録処理を行う場合には、上記のように算出した入力画像データの各特徴点についてのハッシュ値(特徴量)を登録処理部37に送る。
登録処理部37は、特徴量算出部32が算出した各特徴点についてのハッシュ値と、原稿(入力画像データ)を表すインデックス(原稿ID)とをメモリ8に設けられたハッシュテーブルに順次登録していく(図10(a)参照)。ハッシュ値がすでに登録されている場合は、当該ハッシュ値に対応付けて原稿IDを登録する。原稿IDは重複することなく順次番号が割り当てられる。なお、ハッシュテーブルに登録されている原稿の数が所定値(例えば、登録可能な原稿の数の80%)より多くなった場合、古い原稿IDを検索して順次消去するようにしてもよい。また、消去された原稿IDは、新たな入力画像データの原稿IDとして再度使用できるようにしてもよい。また、算出されたハッシュ値が同値である場合(図10(b)の例ではH1=H5)、これらを1つにまとめてハッシュテーブルに登録してもよい。
また、特徴量算出部32は、入力画像データが既に登録されている登録画像の画像データであるかどうかの判定処理(類似性判定処理)を行う場合には、上記のように算出した入力画像データの各特徴点についてのハッシュ値を投票処理部33に送る。
投票処理部33は、入力画像データから算出した各特徴点のハッシュ値をハッシュテーブルに登録されているハッシュ値と比較し、同じハッシュ値を有する登録画像に投票する。言い換えれば、登録画像毎に、登録画像が有するハッシュ値と同じハッシュ値が入力画像データから算出された回数をカウントし、カウント値をメモリ8に記憶させる。図11は、登録画像ID1,ID2,ID3に対する投票数の一例を示すグラフである。
類似度判定処理部34は、メモリ8から投票処理部33の投票処理結果(各登録画像のインデックスおよび各登録画像に対する投票数;類似度)を読み出し、最大得票数および最大得票数を得た登録画像のインデックスを抽出する。そして、抽出された最大得票数を予め定められている閾値と比較して類似性(入力画像データが登録画像の画像データであるかどうか)を判定し、判定結果を示す判定信号を制御部7に送る。つまり、最大得票数が予め定められた閾値以上である場合には「類似性あり(入力画像データは登録画像の画像データである)」と判定し、閾値未満である場合には「類似性なし(入力画像データは登録画像の画像データではない)」と判定する。
あるいは、類似度判定処理部34が、各登録画像に対する得票数を投票総数(入力画像データから抽出された特徴点の総数)で除算して正規化することで類似度を算出し、この類似度と予め定められている閾値(例えば投票総数の80%)との比較を行うことによって類似度を判定してもよい。
また、類似度判定処理部34が、各登録画像に対する得票数を、ハッシュ値の登録数が最も多い登録画像についてのハッシュ値の登録数(最大登録数)で除算して正規化することで類似度を算出し、この類似度と予め定められている閾値(例えば投票総数の80%)との比較を行うことによって類似性を判定してもよい。つまり、算出した類似度が閾値以上である場合には「類似性あり」と判定し、閾値未満である場合には「類似性なし」と判定すればよい。なお、この場合、入力画像データから抽出されるハッシュ値の総数は上記最大登録数よりも大きくなる場合があるため(特に原稿および/または登録画像の少なくとも一部に手書き部分がある場合など)、類似度の算出値は100%を超える場合も有り得る。
また、類似性を判定する際の閾値は、各登録画像について一定であってもよく、あるいは各登録画像の重要度等に応じて登録画像毎に設定されてもよい。登録画像の重要度は、例えば、紙幣、有価証券、極秘書類、社外秘の書類等については重要度を最大にし、秘密書類については重要度を紙幣等よりも低くするといったように、登録画像に応じて段階的に設定してもよい。この場合、メモリ8に、登録画像の重要度に応じた重み付け係数を当該登録画像のインデックスと関連付けて記憶させておき、類似度判定処理部34が、最大得票数を得た登録画像に対応する閾値を用いて類似性を判定するようにすればよい。
また、類似性を判定する際、閾値は一定にする一方、各登録画像に対する投票数(各登録画像の得票数)に各登録画像の重み係数を掛けて類似性を判定するようにしてもよい。この場合、メモリ8に、各登録画像の重要度に応じた重み付け係数を各登録画像のインデックスと関連付けて記憶させておき、類似度判定処理部34が、各登録画像の得票数に当該登録画像の重み付け係数を掛けた補正得票数を算出し、この補正得票数に基づいて類似性を判定するようにすればよい。例えば、最大補正得票数と閾値とを比較してもよく、最大補正得票数を投票総数で正規化したものを閾値と比較してもよく、最大補正得票数を最大登録数で正規化したものを閾値と比較してもよい。また、この場合、重み係数は、例えば、1より大きい値であって、かつ登録画像の重要度が高くなるにつれて大きい値になるように設定すればよい。
また、本実施形態では、1つの特徴点(注目特徴点)に対して1つのハッシュ値を算出するものとしているが、これに限らず、1つの特徴点(注目特徴点)に対して複数のハッシュ値を算出するようにしてもよい。例えば、注目特徴点の周辺特徴点として6点を抽出し、この6点から5点を抽出した6通りの組み合わせそれぞれについて、5点から3点を抽出して不変量を求めてハッシュ値を算出する方法を用いてもよい。この場合には、1つの特徴点に対して6個のハッシュ値が算出されることになる。
制御部7は、入力画像データの付帯情報(例えば、入力画像データあるいは入力画像データに対する処理要求を入力したユーザのユーザID、入力画像データあるいは処理要求が入力された日付,曜日,時刻、入力画像データのページ数(枚数)あるいはデータ量、
処理要求の内容(例えば処理モード(複写、印刷、送信、編集など)、処理枚数(複写枚数、印刷枚数)、入力画像データの送信先など)、入力画像データ中に所定の色相の画像が含まれているか否か、あるいはこれらの組み合わせなど)に基づいて、入力画像データが登録画像の画像データであるかどうかを判定する判定処理を行うことの要否を判断する。つまり、制御部7は、入力画像データの付帯情報に基づいて、入力画像データが監視対象画像であるか否かを判断し、監視対象画像であると判断した場合に上記判定処理を行う一方、監視対象画像ではないと判断した場合には上記判定処理を行わない。
なお、本実施形態では、入力画像データが登録画像の画像データであるかどうかを判定する必要がある場合の付帯情報の組み合わせ、および/または判定する必要がない場合の付帯情報の組み合わせに関する情報が、メモリ8の管理者フォルダ(管理者(例えば企業や店舗等におけるセキュリティ管理担当者等の特定のユーザ)のみが閲覧および書き込み可能なフォルダ)に予め格納されており、制御部7は、この情報と入力画像データの付帯情報とを比較することで入力画像データに対する判定処理の要否を判断する。
なお、入力画像データの付帯情報は、例えば、入力画像データに付加された状態(例えばヘッダ情報として付加された状態)でカラー画像処理装置3(あるいはデジタルカラー複合機1)に入力されてもよく、入力画像データとは別にカラー画像処理装置3(あるいはデジタルカラー複合機1)に入力されてもよい。例えば、操作パネル6を介して入力されてもよく、カードリーダー等の読み取り手段に挿入されたパーソナルカード等の記録媒体を読み取ることにより入力されてもよく、通信によって外部の装置から入力されてもよい。また、入力画像データに基づいて、入力画像データが入力された時の条件,タイミング等に基づいて制御部7あるいは主制御部が算出してもよい。
また、入力画像データに基づいて、この入力画像データに特定の色相を含む画像が含まれているか否かを判定し、その判定結果を付帯情報としてもよい。なお、入力画像データに特定の色相を含む画像が含まれているか否かを判定する方法としては、例えば特許文献6に記載されている方法を用いることができる。
この方法では、まず、RGB信号の基準濃度(Base_Intensity)を下記式に基づいて算出する。なお、下記式におけるR、G、Bは、RGB信号のR値、G値、B値を表している。
Base_Intensity=(R+G+B)/3
次に、上記式で求められた基準濃度の値と、画像データの各色成分(R、G、B)の値とを比較し、各成分(R、G、B)の値と基準濃度の値との大小関係を判定し、下記式に基づいて各色成分(R、G、B)の値を二値化する。つまり、下記式に基づいて、各色成分(R、G、B)の値を(HR、HG、HB)の値に変換する。
HR ={1(R>Base_Intensity)、0(R≦Base_Intensity)}
HG ={1(G>Base_Intensity)、0(G≦Base_Intensity)}
HB ={1(B>Base_Intensity)、0(B≦Base_Intensity)}
そして、変換された(HR、HG、HB)の値を色相と対応付ける処理を行う。すなわち、(HR、HG、HB)=(1、0、0)であればRGB信号の色相を赤、(HR、HG、HB)=(0、1、0)であればRGB信号の色相を緑、(HR、HG、HB)=(0、0、1)であればRGB信号の色相を青と判定する。なお、マゼンタ系の色も含めて赤と判定する場合、(HR、HG、HB)=(1、0、0)または(HR、HG、HB)=(1、0、1)の場合に赤と判定するようにしてもよい。
そして、上記判定処理によって所定の色相(例えば赤)の色相に含まれる画素を抽出し、所定の色相の画素数が所定の範囲(例えば、7000画素以上10万画素以下の範囲)にある場合、所定の色相の画像データが含まれていると判定する。
また、制御部7は、カラー画像処理装置3の内部に設けられていてもよく、カラー画像処理装置3の外部に設けられていてもよい。また、制御部7は、デジタルカラー複合機1の主制御部に設けられていてもよい。
(1−3.デジタルカラー複合機1における処理)
次に、デジタルカラー複合機1における処理について、図12に示すフロー図を参照しながら説明する。
まず、制御部7は、操作パネル6あるいは通信装置5を介してユーザからの指示入力(処理要求)を受け付けると、メモリ8に記憶させているスコア値SCRおよびカウンタ値CNTを初期化(SCR=0、CNT=0)する(S1)。なお、カウンタ値CNTは原稿枚数(入力画像データのページ数)示す数値であり、スコア値SCRは類似性ありと判定された原稿枚数を示す数値である。
次に、制御部7は、入力画像データを取得する(S2)。例えば、カラー画像入力装置2で原稿画像を読み取ることによって入力画像データを取得してもよく、通信装置5によって外部の装置から入力画像データを取得してもよく、デジタルカラー複合機1に備えられるカードリーダー(図示せず)等を介して各種記録媒体から入力画像データを読み出して取得してもよい。
次に、制御部7は、監視対象画像であるか、すなわち入力画像データが登録画像の画像データであるかどうかを判定する判定処理を行うことの要否を判断する(S3)。具体的には、入力画像データと登録画像との類似性の判定結果によらず入力画像データに対して一定の処理を行う場合の条件(入力画像データの付帯情報、入力画像データ中に所定の色相の画像が含まれているか否か、あるいはこれらの組み合わせなど)と、判定結果に応じて入力画像データに対する処理を変更する場合の条件とをメモリ(条件記憶部)8に予め記憶させておき、制御部7は入力画像データあるいはその付帯情報から抽出される条件とメモリ8に記憶されている条件とを比較することで判定処理を行うことの要否を判断する。
S3において制限処理を行う必要がないと判断した場合、制御部7は、S10の処理に進む。一方、S3において制限処理を行う必要があると判断した場合、制御部7は、文書照合処理部13の各部を制御して特徴点算出処理(S4)、特徴量算出処理(S5)、投票処理(S6)、類似性判定処理(S7)を行わせる。
そして、類似性判定処理の結果、類似性ありと判定された場合にはスコア値SCRおよびカウンタ値をそれぞれ加算(SCR=SCR+1、CNT=CNT+1)し(S8)、S11の処理へ進む。
一方、類似性判定処理の結果、類似性なしと判定された場合にはスコア値SCRは加算せずにカウンタ値を加算(CNT=CNT+1)し(S9)、S10の処理へ進む。
次に、制御部7は、全ての原稿(入力画像データ)をS2〜S9の処理を行ったかどうかを判断する(S10)。そして、未処理の原稿が残っている場合、制御部7は、次の原稿に対してS2以降の処理を行う。
一方、全ての原稿を取得したと判断した場合、制御部7は、カウンタ値CNTに対するスコア値SCRの割合、すなわち原稿枚数に対するスコア値の平均値(SCR/CNT)を算出する(S11)。そして、このSCR/CNTの値が予め設定された閾値TH1より大きいかどうか(SCR/CNT>TH1であるかどうか)を判断する(S12)。
このように、原稿枚数に対するスコア値の平均値を用いることにより、すなわち複数枚の原稿の類似度を累積して評価することにより、原稿の読み取り条件や読み取り精度等に起因する類似度算出結果の変動要因を吸収できる。例えば、同じ原稿の入力画像データについて類似度を算出しても、原稿が読み取られる条件等により類似度は変動するが、類似度を累積して評価することによりこれらの変動要因を吸収して類似度を精度よく評価することができる。また、同じ原稿画像ではなく、異なる原稿画像が連続して処理された場合でも類似度の評価を適切に行うことができる。
S12においてSCR/CNT≦TH1であると判断した場合、制御部7は、入力画像データは登録画像に関するものではないと判断し、入力画像データに対する処理(指示入力で指示された処理モードに応じた処理)を許可し(処理を許可する信号を主制御部に送り)、処理を終了する(S13)。
一方、SCR/CNT>TH1であると判断した場合、制御部7は、入力画像データは登録画像に関するものであると判断し、入力画像データに対する処理を禁止あるいは制限する(処理を禁止あるいは制限する信号を主制御部に送る)とともに(S14)、登録画像に対する処理が要求された旨を示す通知信号を類似度判定処理部34から通信装置5に出力させ(S15)、処理を終了する。
なお、上記の説明では、全ての原稿についての処理が終了した後に、原稿枚数に対するスコア値の平均値(SCR/CNT)を算出し、閾値TH1との比較を行っているが、これに限らず、所定の枚数毎(例えば、5枚ごと、あるいは10枚ごと。)にスコア値の平均値を算出して閾値TH1と比較するようにしてもよい。あるいは、処理枚数に応じて上記スコア値を算出して判定を行うタイミングを設定してもよい(例えば、処理枚数の1/2の枚数の処理が終了した時と全ての原稿について処理を終了した時とに上記判定を行うなど)。
また、S15において、通信装置5は、登録画像に対する処理が要求された旨を予め設定された送信先(例えばサーバー装置)に通知する。この際、通信装置5が、登録画像に対する処理が要求された旨を示す情報とともに、類似していると判定されたときのログ(操作記録情報;例えば、入力画像の原稿ID、処理要求を入力したユーザのユーザID、処理要求が入力された日付、曜日あるいは時刻、処理要求の内容などを含む)、入力画像データ(あるいは入力画像データを圧縮した圧縮画像データや低解像度化した画像データ)、登録画像のインデックス等をサーバー装置(ジョブログシステム)に通知し、サーバー装置がこれらの情報を必要に応じて記憶するようにしてもよい。
なお、入力画像データ(あるいは入力画像データを圧縮した圧縮画像データや低解像度化した画像データ)に代えて、入力画像に対応する登録画像(あるいはこの登録画像を圧縮した圧縮画像データや低解像度化した画像データ)を通知するようにしてもよい。また、この場合、入力画像の原稿IDと登録画像(あるいはこの登録画像を圧縮した圧縮画像データや低解像度化した画像データ)とを通知してもよく、登録画像(あるいはこの登録画像を圧縮した圧縮画像データや低解像度化した画像データ)のみを通知するようにしてもよい。このように、入力画像データに代えて登録画像のデータを通知することにより、例えば入力画像データにユーザの個人情報が含まれている場合であっても、この個人情報が不正に利用されることを防止できる。
また、上記送信先への通知は、デジタルカラー複合機1に備えられる通信装置5から送信先に直接行ってもよく、あるいはデジタルカラー複合機1にネットワークを介して接続された他の装置(図示せず)を介して行ってもよい。
また、S15において、制御部7が、上記各種情報をメモリ8あるいはネットワークを介して接続される装置に備えられる記憶部の管理者フォルダに格納し、管理者が必要に応じて管理者フォルダにアクセスすることでこれら情報を取り出すようにしてもよい。また、管理者フォルダにこれらの情報を格納した後、一定期間が経過した場合や管理者フォルダの容量が一杯になった場合などに、管理者フォルダに格納されたデータを古いデータから順に削除するようにしてもよい。
また、本実施形態では、S12においてSCR/CNT>TH1であると判断した場合にのみ入力画像データに対する処理を禁止あるいは制限するものとしたが、これに限らず、例えば、SCR/CNT>TH1であると判断した場合に加えて、原稿枚数が所定枚数(例えば50枚)を超えたとき(あるいは入力画像データのページ数あるいはデータ量が所定量を超えたとき)にも、処理を禁止あるいは制限するようにしてもよい。これにより、例えば個人情報の大量流出などを防止できる。
以上のように、本実施形態にかかるデジタルカラー複合機1では、入力画像データが登録画像のものであるかどうかの判定処理を行うことの要否を判断するための情報(入力画像データが登録画像の画像データであるかどうかを判定する必要がある場合の付帯情報の組み合わせ、あるいは判定する必要がない場合の付帯情報の組み合わせに関する情報)が、メモリ8の管理者フォルダに予め格納されており、制御部7は、この情報と入力画像データの付帯情報とに基づいて入力画像データに対する判定処理の要否を判断する。
これにより、入力画像データの付帯情報に応じて判定処理の要否を判断し、必要な場合にのみ判定処理を行うことができる。したがって、例えば、入力画像データが登録画像のものであったとしても、処理内容を制限したり禁止したり所定の通知先に通知したりする必要がない場合には、判定処理を行わずに入力画像に対する処理を許可し、入力画像データが登録画像のものであった場合に処理内容を制限したり禁止したり所定の通知先に通知したりする必要がある場合には判定処理を行い、判定結果に応じて入力画像データに対する処理を制限したり禁止したりできる。
なお、本実施形態では、制御部7が類似性の判定処理の要否を判断し、必要であると判断した場合にのみ判定処理を行うものとしたが、これに限るものではない。例えば、全ての入力画像データに対して類似性の判定処理を行い、類似度判定処理部34が入力画像は登録画像の画像データであると判定した場合に、入力画像データの付帯情報と、入力画像データが登録画像の画像データであるかどうかを判定する必要がある場合の付帯情報の組み合わせ、あるいは判定する必要がない場合の付帯情報の組み合わせに関する情報とに基づいて、入力画像データに対する処理の制限あるいは禁止の要否および/または所定の通知先への通知の要否を判断するようにしてもよい。
〔実施形態2〕
本発明の他の実施形態について説明する。なお、説明の便宜上、実施形態1と同様の機能を有する部材については同じ符号を付し、その説明を省略する。
(2−1. 文書照合処理部の構成)
図13は、本実施形態にかかるデジタルカラー複合機1の概略構成を示すブロック図である。この図に示すように、文書照合処理部13は、特徴点算出部31、特徴量算出部32、投票処理部33、スコア算出部35、累積スコア比較部36、登録処理部37を備えている。特徴点算出部31、特徴量算出部32、投票処理部33、登録処理部37については実施形態1と同様のものを用いることができる。
スコア算出部35は、投票処理部33から受け取った投票結果に基づいて類似度MCH(i)およびスコア値(補正類似度)SCR(i)を算出して累積スコア比較部36に送る。具体的には、スコア算出部35は、入力画像データにおけるi(iは1以上の整数)番目のページ(あるいはブロック)についての、最大得票数を得た登録画像の得票数を投票総数(入力画像データから抽出された特徴点の総数)で除算して正規化した値を類似度MCH(i)とする。なお、入力画像データにおけるi番目のページ(あるいはブロック)についての、最大得票数を得た登録画像の得票数をハッシュ値の登録数が最も多い登録画像の上記登録数(最大登録数)で除算して正規化した値をMCH(i)としてもよい。
また、スコア算出部35は、下記の式(3)から入力画像データにおけるi番目のページ(あるいはブロック)についてのスコア値SCR(i)を算出する。
SCR(i)=MCH(i)×(α(m)+β(n)+γ(p)+δ(q))/4 ・・・(3)
ここで、α(m)はユーザ毎に予め設定された係数であり、β(n)は時間帯毎に予め設定された係数であり、γ(p)は処理モード毎に予め設定された係数であり、δ(q)は特定の色相の画像が含まれているか否かを示す係数である。m,n,pは、それぞれユーザ,時間帯,処理モード毎に付された値であり、1以上の整数である。また、qは、特定の色相の画像が含まれているか否かに応じて付される値である。なお、qは、特定の色相の画像が含まれているか否かを示す2値の値であってもよく、特定の色相を有する画素の画素数に応じて設定された値(例えば画素数が多くなるほど大きくなるように設定された値)であってもよい。これらの係数は、メモリ8あるいはネットワークを介して通信可能に接続される装置の管理者フォルダに予め登録されており、スコア算出部35は管理者フォルダに記憶されているこれらの係数を参照してスコア値SCR(i)を算出する。図14は、メモリ8に記憶されているこれらの係数の一例を示している。
累積スコア比較部36は、スコア算出部35が入力画像データの各ページ(あるいは各ブロック)について算出したスコア値(補正類似度)SCR(i)を順次加算(累積)して累積スコア(加算類似度)ASCR(i)を算出する。また、累積スコア比較部36は、累積スコアASCR(i)と管理者フォルダに格納されている閾値TH2との大小を比較する累積スコア比較処理を行い、比較結果を示す判定信号を制御部7に送る。なお、スコア値をページ毎に算出する場合とブロック毎に算出する場合とで上記閾値TH2の値を変更してもよい。つまり、スコア値をページ毎に算出する場合には第1の閾値を用い、スコア値をブロック毎に算出する場合には第1の閾値とはことなる第2の閾値を用いるようにしてもよい。
制御部7は、累積スコア比較部36からの判定信号に基づいて、入力画像データが登録画像に関するものであるかどうかを判断する。具体的には、制御部7は、ASCR(i)>TH2の場合に入力画像データが登録画像に関するものである(類似性あり)と判断し、ASCR(i)≦TH2の場合には入力画像データは登録画像に関するものではない(類似性なし)と判断する。また、制御部7は、類似性ありと判断した場合には、入力画像データに対する処理を制限あるいは禁止するとともに、登録画像に対する処理を要求された旨を所定の通知先に通知する。また、制御部7は、類似性なしと判断した場合には、入力画像データに対する処理を許可する。
なお、制御部7は、カラー画像処理装置3の内部に設けられていてもよく、カラー画像処理装置3の外部に設けられていてもよい。また、制御部7は、デジタルカラー複合機1の主制御部に設けられていてもよい。
(2−2.デジタルカラー複合機1における処理)
次に、本実施形態にかかるデジタルカラー複合機1における類似性判定処理について、図15に示すフロー図を参照しながら説明する。
まず、制御部7は、操作パネル6あるいは通信装置5を介してユーザからの指示入力を受け付けると、メモリ8に記憶させているスコア値SCRを初期化(SCR(1)=0)する(S21)。
次に、制御部7は、入力画像データを取得する(S22)。例えば、カラー画像入力装置2で原稿画像を読み取ることによって入力画像データを取得してもよく、通信装置5によって外部の装置から入力画像データを取得してもよく、デジタルカラー複合機1に備えられるカードリーダー(図示せず)等を介して各種記録媒体から入力画像データを読み出して取得してもよい。
次に、制御部7は、文書照合処理部13の各部を制御して特徴点算出処理(S23)、特徴量算出処理(S24)、投票処理(S25)、スコア算出処理(S26)、累積スコア算出処理(S27)を行わせる。
次に、制御部7は、累積スコアASCRが閾値TH2を超えたかどうか、すなわちASCR(i)>TH2であるかどうかを判断する(S28)。
そして、ASCR(i)>TH2であると判断した場合、制御部7は、入力画像データは登録画像に関するものであると判断し、入力画像データに対するそれ以降の処理(処理モードに応じた処理)を禁止あるいは制限する信号をデジタルカラー複合機1の主制御部に送るとともに(S29)、登録画像に対する処理が要求された旨を示す通知信号を累積スコア比較部36から通信装置5に出力させる(S31)。通信装置5は、登録画像に対する処理が要求された旨を予め設定された通知先(例えば管理者)に通知する。この際、登録画像に対する処理が要求された旨を示す情報とともに、デジタルカラー複合機1のID、デジタルカラー複合機1の設置場所や所属部署、登録画像のインデックス、入力画像データの原稿ID、処理要求が入力された時刻,日付,曜日、処理要求を入力したユーザのユーザID、処理要求の内容(処理モード、処理枚数など)、累積スコアASCR(i)が閾値TH2を超えるまでに処理された原稿の原稿ID等の各種情報を通知するようにしてもよい。図16は、登録画像に対する処理が要求された旨を示す情報とともに、管理者に通知される情報の一例を示している。
なお、上記通知先への通知は、デジタルカラー複合機1に備えられる通信装置5から送信先に直接行ってもよく、あるいはデジタルカラー複合機1にネットワークを介して接続されたサーバー(図示せず)を介して行ってもよい。
また、送信先に通知する構成に限らず、例えば、制御部7が、上記各種情報をメモリ8あるいはネットワークを介してデジタルカラー複合機1に通信可能に接続される他の装置の管理者フォルダに格納し、管理者が必要に応じて管理者フォルダにアクセスすることでこれらの情報を取り出すようにしてもよい。
一方、S28においてASCR(i)≦TH2であると判断した場合、制御部7は、入力画像データは登録画像に関するものではないと判断し、入力画像データにおけるi番目のページ(あるいはブロック)に対する処理を許可する信号をデジタルカラー複合機1の主制御部に送る(S32)。デジタルカラー複合機1の主制御部は、この信号を受け取ると、入力画像データにおけるi番目のページ(あるいはブロック)に対して、上記指示入力で指示された処理内容に応じた処理を実行させる。なお、ASCR(i)>TH2であると判断した場合に、制御部7がその旨を示す信号を主制御部に送り、ASCR(i)≦TH2であると判断した場合には主制御部に信号を送らないようにしてもよい。
図17は、原稿枚数(入力画像データのページ数)および累積スコアの一例を示すグラフである。入力画像データAの場合、4枚目までの原稿については処理が許可され、5枚目の原稿については処理が禁止される。また、入力画像データBの場合、5枚目までの原稿について処理が許可される。
S31の処理の後、制御部7は、入力画像データにおける全てのページ(あるいはブロック)の処理を行ったかどうかを判断する(S32)。そして、未処理のページ(あるいはブロック)が残っている場合、制御部7は、次のi+1番目のページ(あるいはブロック)についてS3以降の処理を行う(S33)。一方、S32において全てのページ(あるいはブロック)の処理を行ったと判断した場合には、処理を終了する。
以上のように、本実施形態にかかるデジタルカラー複合機1は、ユーザ毎に設定された係数α(m)、時間帯毎に設定された係数β(n)、処理モード毎に設定された係数γ(p)、特定の色相の画像が含まれているか否かに応じて設定された係数δ(q)をメモリ8に予め記憶している。そして、スコア算出部35が、投票処理部33での投票処理において最大得票数を得た登録画像の類似度MCH(i)と、上記係数α(m),β(n),γ(p),δ(q)とに基づいてスコア値SCR(i)を算出する。そして、このスコア値SCR(i)に基づいて、入力画像データと登録画像との類似性を判定する。
これにより、ユーザ毎、時間帯毎、および処理モード毎、および特定の色相の画像が含まれているか否かに応じてセキュリティレベル(係数)を設定しておき、入力画像データに対する処理が指示されたときに、ユーザ、時間帯、処理モード、特定の色相の画像が含まれているか否かに応じて類似性を判定できる。したがって、ユーザ毎、時間帯毎、処理モード毎、および特定の色相の画像が含まれているか否かに応じてセキュリティ性と作業性のどちらを重視するかを設定して判定処理を行うことができる。
また、本実施形態では、入力画像データの各ページ(あるいは各ブロック)についてのスコア値を順次累積した累積スコアASCR(i)と閾値TH2とを比較することで処理内容の制限の要否を判断する。
このように、累積スコアを用いて処理内容の制限の要否を判断することにより、原稿の読み取り条件や読み取り精度等に起因する類似度算出結果の変動要因を吸収できる。例えば、同じ原稿の入力画像データについて類似度を算出しても、原稿が読み取られる条件等により類似度は変動するが、類似度を累積して評価することによりこれらの変動要因を吸収して類似度を精度よく評価することができる。また、同じ原稿画像ではなく、異なる原稿画像が連続して処理された場合でも類似度の評価を適切に行うことができる。
なお、累積スコアASCR(i)と閾値TH2とを比較する構成に限らず、入力画像データの各ページ(あるいは各ブロック)についてのスコア値SCR(i)と予めメモリ8に記憶される閾値TH3とを比較することで、入力画像データの各ページ(あるいは各ブロック)について判定処理を行うようにしてもよい。
また、本実施形態では、累積スコアASCR(i)が閾値TH2を超えたときに入力画像データに対する処理を制限するとともに、通知信号を出力するようにしているが、これに限るものではない。
例えば、累積スコアASCRが閾値TH2を超えたときに通知信号を出すのではなく、累積スコアASCRが閾値TH2を超えたか否かを示すフラグF(TH2を超えたとき「1」、TH2以下のとき「0」)をメモリ8に記憶させておき、全ての入力画像データについての処理が終了したときに、フラグが「F=1」であるか否かを判断し、この判断結果に応じて入力画像データに対する処理の禁止あるいは制限の要否、および/または管理者への通知の要否を判断するようにしてもよい。図18は、この場合の処理の流れを示すフロー図である。
まず、制御部7は、操作パネル6あるいは通信装置5を介してユーザからの指示入力を受け付けると、メモリ8に記憶させているスコア値SCRおよびフラグFを初期化(SCR(1)=0、F=0)する(S41)。
次に、制御部7は、入力画像データを取得し(S42)、文書照合処理部13の各部を制御して特徴点算出処理(S43)、特徴量算出処理(S44)、投票処理(S45)、スコア算出処理(S46)、累積スコア算出処理(S47)を行わせる。また、制御部7は、累積スコアASCRが閾値TH2を超えたかどうか、すなわちASCR(i)>TH2であるかどうかを判断する(S48)。
そして、ASCR(i)>TH2であると判断した場合、制御部7は、フラグFをF=1としてメモリ8に記憶させ(S49)、S50の処理に進む。
一方、ASCR(i)≦TH2であると判断した場合、制御部7は、フラグFを変更することなく(F=0)、S50の処理に進む。
なお、本実施形態では、入力画像データにおける全てのページについての判定処理が終わるまで入力画像データに対する処理(処理モードに応じた処理)を許可するか禁止あるいは制限するかの判断を保留するものとする。ただし、これに限らず、S48の処理の後、入力画像データにおけるi番目のページ(あるいはブロック)に対する処理(処理モードに応じた処理)を許可するようにしてもよい。
次に、制御部7は、入力画像データにおける全てのページ(あるいはブロック)に対してS42〜S49の処理を行ったかどうかを判断する(S50)。そして、未処理のページ(あるいはブロック)が残っている場合、制御部7は、次のi+1番目のページ(あるいはブロック)についてS42以降の処理を行う(S51)。
一方、S50において全てのページ(あるいはブロック)の処理を行ったと判断した場合、制御部7は、メモリ8に格納しているフラグFがF=1であるかどうかを判断する(S52)。そして、フラグF=1ではない場合(F=0の場合)、制御部7は、入力画像データに対する処理(処理モードに応じた処理)を許可する信号を主制御部に送り(S53)、処理を終了する。
一方、フラグF=1である場合、制御部7は、入力画像データに対する処理(処理モードに応じた処理)を禁止あるいは制限する信号を主制御部に送るとともに(S54)、登録画像に対する処理が要求された旨を示す通知信号を累積スコア比較部36から通信装置5に出力させ(S55)、処理を終了する。
通信装置5は、登録画像に対する処理が要求された旨を予め設定された通知先(例えば管理者)に通知する。この際、登録画像に対する処理が要求された旨を示す情報とともに、デジタルカラー複合機1のID、デジタルカラー複合機1の設置場所や所属部署、登録画像のID、原稿ID、入力画像データ、処理要求を入力したユーザのユーザID、処理要求が入力された日付,曜日,時刻、処理要求の内容(処理枚数、処理モード等)、累積スコアASCR(i)が閾値TH2を超えるまでに処理された原稿の原稿ID等の各種情報を通知するようにしてもよい。なお、入力画像の原稿IDと入力画像データとを通知することに代えて、入力画像の原稿IDと入力画像に対応する登録画像を通知してもよく、入力画像に対応する登録画像のみを通知するようにしてもよい。また、上記通知先への通知は、デジタルカラー複合機1に備えられる通信装置5から通知先に直接行ってもよく、あるいはデジタルカラー複合機1にネットワークを介して接続されたサーバー(図示せず)を介して行ってもよい。
また、通知先に通知する構成に限らず、例えば、制御部7が、上記各種情報をメモリ8あるいはデジタルカラー複合機1にネットワークを介して通信可能に接続された装置の管理者フォルダに格納し、管理者が必要に応じて管理者フォルダにアクセスすることでこれら情報を取り出すようにしてもよい。
また、原稿枚数が所定枚数(例えば、50枚)を超えたとき(入力画像データのページ数あるいはデータ量が所定量を超えたとき)にも、処理を停止するようにしてもよい。
また、メモリ8の管理者フォルダに記憶させておく係数α(m),β(n),γ(p),δ(q)の値は、管理者が管理者フォルダにアクセスすることによって任意に追加あるいは変更できるようにしてもよい。
また、例えば、累積スコアASCR(i)が閾値TH2を超えたときに、制御部7が、デジタルカラー複合機1のID、デジタルカラー複合機1の設置場所や所属部署、登録画像のID、原稿ID、入力画像データ、処理要求を入力したユーザのユーザID、処理要求が入力された日付,曜日,時刻、処理要求の内容(処理枚数、処理モード等)、累積スコアASCR(i)が閾値TH2を超えるまでに処理された原稿の原稿等の各種情報をメモリ8の管理者フォルダに格納する構成としてもよい。
これにより、累積スコアASCR(i)が閾値TH2を超えた結果、登録画像に関するデータであると判断された入力画像データについて、管理者がこの判断の適否を確認することができる。そして、この判断が誤りであった場合には、上記係数α(m),β(n),γ(p),δ(q)あるいは閾値TH2を変更するなどの対処を行うことができる。
なお、管理者が上記判断は誤りであると判断した場合に、制御部7がメモリ8の管理者フォルダに記憶されている係数α(m),β(n),γ(p),δ(q)を変更するようにしてもよい。例えば、管理者が管理者フォルダに格納している上記各種情報にアクセスした際、制御部7が、管理者が上記アクセスに使用している装置の表示部に誤りである旨を指示入力するボタンを表示させる。そして、このボタンが選択されたときに制御部7が上記判断は誤りであったと判断し、係数α(m),β(n),γ(p),δ(q)のいずれか1つ以上を変更する(例えば1%下げる)ようにしてもよい。この際、管理者から指示された係数のみを変更するようにしてもよい。
また、管理者が上記判断は誤りであると判断したときの上記係数の組み合わせを記憶しておき、誤りであると判断された回数に応じて係数の変更率を設定するようにしてもよい。例えば、s(sは1以上の整数)を誤りであると判断された回数、Kを定数(例えば2)としたときに、上記変更率をKn%とすればよい。つまり、係数α(m),β(n),γ(p),δ(q)のいずれか1つ以上に、Kn/100を掛け合わせればよい。
また、本実施形態では、入力画像データの付帯情報のうち、ユーザ、時間帯、処理モードに応じた係数α、β、γ,δを用いてスコア値SCRを算出する場合について説明したが、これに限るものではない。例えば、これらの係数の一部または全部に代えて、あるいはこれらの係数に加えて、入力画像データのページ数あるいはデータ量、入力画像データの送信先、あるいはこれらの組み合わせについての係数を用いてスコア値SCRを算出するようにしてもよい。
また、上記各実施形態では、文書照合処理部13が、入力画像データにおける各画素の連結部分の重心を特徴点として算出し、特徴点同士の位置関係に基づいて類似度を判定する構成である場合について説明したが、類似度の判定方法はこれに限るものではない。
例えば、上記特許文献1に記載されている方法を用いて類似度を判定してもよい。この方法では、まず、輪郭抽出処理で罫線画像をラスタスキャンしてその追跡開始点を検出した後、その追跡開始点から時計周りあるいは反時計周りに図形境界がつくる閉曲線を追跡することによって行なわれる。このような閉曲線追跡により抽出された輪郭の情報は座標点列として保存される。その後、抽出された輪郭線データをもとに、画像の交差部や角点などの特徴点を検出し、点列の組み合わせから枠を抽出する。そして、入力枠情報の外接図形を算出する。
次に、各々の枠データの中心座標データを算出する。これは、例えば枠座標を左下隅から(x0,y0),(x1,y1),(x2,y2),(x3,y3)とした場合に、対角線の交差点を(cx,cy)とする。次に、登録定型フォーマット上の左上の座標と、入力画像上の左上の座標の位置の差分をdx,dyとし、登録定型フォーマットの枠または罫線画像の枠の中心位置を補正する。次に、枠データをそれぞれ対応づける。これは例えば、登録定型フォーマット上の枠データの中心座標を、tcx,tcyとし、罫線画像上の枠データをicx,icyとした場合の距離DをD=(icx−tcx)2+(icy−tcy)2とする。また、類似度は登録フォーマット上の枠に対応する枠がある(D<dth,dthは距離の閾値)場合に投票し、登録フォーマット上で枠全てに投票が終わったら枠数nでわる。すなわち、類似度=対応する枠の数/登録帳票上の枠数で類似度を求める。
また、上記特許文献2に記載されている色味分布を用いた照合方法を用いて類似度を判定してもよい。この方法では、登録画像についてのRGB空間における画像データを判定ROMに格納しておき、入力画像データにおける登録画像と一致すると認識された領域の画素数をカウントするとともに、登録画像と一致した入力画像データのRGB空間での体積Tjdを算出する。そして、登録画像として認識された領域の画素数が定数k以上のとき、登録原稿(例えば紙幣原稿)である可能性があるとして、下記式(4)により類似度Rの算出を行う。なお、Torgは登録画像データの体積である。
R=Tjd/Torg ・・・(4)
そして、類似度Rが色空間における色味マッチング率βm以上のとき、登録画像を含むと判断する。この処理を各登録特定画像について繰り返し行うことで、各登録画像に対する類似性を判定する処理を行う。
また、入力画像データからOCRなどでキーワードを抽出し、登録画像に含まれるキーワードとマッチングを行うことにより、入力画像データの登録画像に対する類似性を判定するようにしてもよい。また、入力画像データから上記した各方法以外の特徴量を検出し、登録画像の特徴量と比較することで類似度を算出し、算出した類似度と予め定めた閾値とを比較することで類似性の有無を判断してもよい。
また、上記各実施形態では、本発明をデジタルカラー複合機1に適用する場合について説明したが、本発明の適用対象はこれに限るものではない。例えば、モノクロの複合機に適用してもよい。また、複合機に限らず、例えば単体のファクシミリ通信装置、複写機、画像読取装置などに適用してもよい。
図19は、本発明をフラットベッドスキャナ(画像読取装置、画像処理装置)1’に適用した場合の構成例を示すブロック図である
この図に示すように、カラー画像処理装置3’は、A/D変換部11、シェーディング補正部12、文書照合処理部13、制御部7(図19では図示せず)、メモリ8(図19では図示せず)から構成されており、これに、カラー画像入力装置2が接続され、全体として画像読取装置1’を構成している。なお、カラー画像入力装置(画像読取手段)2におけるA/D変換部11、シェーディング補正部12、文書照合処理部13、制御部7、メモリ8の機能は、上述したデジタルカラー複合機1と略同様であるのでここでは説明を省略する。
〔実施形態3〕
本発明のさらに他の実施形態について説明する。なお、説明の便宜上、上記した実施形態と同じ機能を有する部材については同じ符号を付し、その説明を省略する。
図30は、本実施形態にかかるデジタルカラー複合機1に備えられる文書照合処理部13の概略構成を示すブロック図である。この文書照合処理部13は、実施形態1あるいは2における文書照合処理部13に代えてデジタルカラー複合機1に備えられる。
図30に示すように、文書照合処理部13は、特徴点算出部31、特徴量算出部32、投票処理部33、類似度判定処理部34、スコア算出部35c、スコア比較部36c、および登録処理部37を備えている。特徴点算出部31、特徴量算出部32、投票処理部33、類似度判定処理部34、および登録処理部37については実施形態1,2と同様のものを用いることができる。
スコア算出部35は、入力画像データの付帯情報の各項目(例えば、入力画像データに対する処理要求を入力したユーザのユーザID、入力画像データあるいは処理要求が入力された日付,曜日,時刻、入力画像データのページ数(枚数)あるいはデータ量、処理要求の内容(例えば処理モード(複写、印刷、送信、編集など)、処理枚数(複写枚数、印刷枚数)、入力画像データの送信先、入力画像データ中に含まれる所定の色相など)の内容に応じてこれら各項目毎の評価値を算出する。
具体的には、メモリ(評価値記憶部)8には、入力画像データの付帯情報の各項目について、その内容毎に設定された評価値x(i)と、項目毎に設定された基準評価値xref(i)とが記憶されている。そして、スコア算出部35は、入力画像データの付帯情報を抽出し、抽出した付帯情報の各項目の内容とメモリ8に記憶している上記の対応関係に基づいて各項目についての評価値を算出する。
図31は、メモリ8に記憶されている入力画像データの付帯情報、評価値、および基準評価値の一例を示す説明図である。この図に示す例では、入力画像データの付帯情報として、ユーザ、時間帯、および処理モードの各項目が設定されており、これら各項目についてその内容に応じた評価値x(i)が予め設定されている。例えば、ユーザをグループA〜Dに分類し、各部ループごとに評価値a1〜a4を設定している。評価値a1〜a4の値は、例えば1〜10の範囲で設定される。また、各項目について、基準評価値xref(i)が設定されている。なお、基準評価値については、メモリ8あるいはデジタルカラー複合機1にネットワークを介して通信可能に接続される外部装置に設けられた管理者フォルダ(予めアクセス権限を付与された者のみがアクセス可能なフォルダ)に記憶させるようにしてもよい。
なお、各項目についての基準評価値は、例えばデジタルカラー複合機1を用いるユーザ群(例えばユーザの所属部署、あるいはデジタルカラー複合機1の設置場所などに応じたユーザ群)毎に設定されていてもよい。また、本実施形態では、後述するように、過去の処理実績(例えばユーザ群毎の上記各項目についての評価値の統計的平均値)に応じて基準評価値の値を補正するようになっている。このため、初期状態では基準評価値はデフォルト値に設定されるが、このデフォルト値についてもユーザ群毎に設定するようにしてもよい。
そして、スコア算出部35は、入力画像データの付帯情報の各項目について算出した評価値と、これら各項目についての基準評価値とを比較し、比較結果に応じてスコア値SCRstを算出する。本実施形態では、下記式(5)に基づいてスコア値SCRstを算出する。
なお、スコア値SCRstの算出方法はこれに限るものではなく、例えば、評価値x(i
)と基準評価値xref(i)との差の絶対値の総和をスコア値SCRstとしてもよい。
図32(a)は入力画像データの付帯情報に基づいて算出された各項目の評価値の一例を示しており、図32(b)は各項目について設定された基準評価値の一例を示している。
スコア比較部36cは、スコア算出部35の算出したスコア値SCRstと、メモリ8あるいは上記管理者フォルダに予め記憶されている閾値(第3の閾値)TH3とを比較し、比較結果を制御部7に伝達する。
制御部7は、類似度判定処理部34によって「類似性あり」と判定されたときに、スコア算出部35cおよびスコア比較部36cに上記の処理を実行させる。そして、SCRst≦TH3の場合には入力画像データは登録画像に関するものではない(類似性なし)と判断し、この入力画像データに対する処理の実行を許可する。
一方、制御部7は、スコア比較部36cの比較結果に基づいて、SCRst>TH3の場合には入力画像データが登録画像に関するものである(類似性あり)と判断し、この入力画像データに対する処理(処理モードに応じた処理)の実行を禁止または制限させるための信号を主制御部に送るとともに、通信装置5を制御して登録画像に対する処理が要求されたことを示す通知信号を所定の送信先(例えば管理者)に送信させる。
なお、本実施形態では、登録画像に対する処理が要求された旨を示す通知信号とともに、デジタルカラー複合機1のID、デジタルカラー複合機1の設置場所や所属部署、登録画像のインデックス(または登録画像)、入力画像データの原稿ID、処理要求が入力された時刻,日付,曜日、処理要求を入力したユーザのユーザID、処理要求の内容(処理モード、処理枚数など)等の各種情報を通知する。あるいは、上記各種情報をメモリやネットワークを介してデジタルカラー複合機1に通信可能に接続される他の装置の管理者フォルダに格納し、管理者が必要に応じて管理者フォルダにアクセスすることでこれらの情報を取り出すようにしてもよい。
これにより、管理者は、デジタルカラー複合機1から送信されてきた上記各種情報に基づいて、デジタルカラー複合機1における上記の判定結果が誤っていないか判断し、誤りである場合には誤判定の要因となったと考えられる項目についての上記の基準評価値を変更(アップデート)することができる。
なお、基準評価値の変更方法は特に限定されるものではないが、本実施形態では下記式(6)に基づいて修正する。
xref’(i)=(M×xref(i)+x(i))/(M+1) ・・・(6)
ここで、xref(i)は設定されている基準評価値(変更前の基準評価値)であり、x(i)は入力画像データから算出した評価値であり、xref’(i)は変更後の基準評価値である。また、Mは定数であり、例えば100に設定される。
このように、スコアの比較結果が誤りである場合に、基準評価値を変更することにより、過去の処理実績(例えばユーザ群毎の統計データ)に基づいて基準評価値を設定することができ、入力画像データに対する処理の実行を許可するか否かをより適切に判定できる。
次に、本実施形態にかかるデジタルカラー複合機1における類似性判定処理について、図33に示すフロー図を参照しながら説明する。
まず、制御部7は、操作パネル6あるいは通信装置5を介してユーザからの指示入力を受け付けると、メモリ8に記憶させているスコア値SCRstを初期化(SCRst=0)する(S141)。
次に、制御部7は、原稿画像を読み取った入力画像データを取得(S142)し、文書照合処理部13の各部を制御して特徴点算出処理(S143)、特徴量算出処理(S144)、投票処理(S145)を行わせる。そして、全ての原稿画像についてS142〜S145の処理を完了したか否かを判断し、完了していない場合には残りの原稿画像についてS142〜S145の処理を繰り返す。
一方、全ての原稿画像についてS142〜S145の処理を完了した場合、類似度判定処理部34に投票処理結果に基づいて類似性判定処理を行わせる。そして、類似性なしと判断された場合、入力画像データに対する処理を許可し(S148)、処理を終了する。
一方、類似性ありと判断された場合、制御部7は、スコア算出部35cにスコア値SCRstを算出させ(S149)、スコア比較部36cにスコア値SCRstと閾値TH3との比較処理を行わせる(S150)。
そして、SCRst≦TH3であった場合、入力画像データに対する処理(処理モードに応じた処理)の実行を許可し(S148)、処理を終了する。
一方、SCRst>TH3であった場合、この入力画像データに対する処理(処理モードに応じた処理)の実行を禁止または制限させるとともに(S151)、登録画像に対する処理が要求されたことを示す通知信号、およびデジタルカラー複合機1のID、デジタルカラー複合機1の設置場所や所属部署、登録画像のインデックス(または登録画像)、入力画像データの原稿ID、処理要求が入力された時刻,日付,曜日、処理要求を入力したユーザのユーザID、処理要求の内容(処理モード、処理枚数など)等の各種情報を所定の送信先(例えば管理者)に送信させて(S152)処理を終了する。
なお、管理者は、上記の通知信号を受信すると(S161)、上記の各種情報に基づいて入力画像データを確認し(S162)、この入力画像データが実際に処理の実行を禁止または制限すべき登録画像に関するものであったか否か、この入力画像データに対する処理の実行を禁止または制限した処置が適切であったか否かを検証する(S163)。そして、適切であったと判断した場合にはそのまま処理を終了する。
一方、適切でなかったと判断した場合、すなわち誤判別であったと判断した場合には、誤判別の要因になったと考えられる項目についての基準評価値を適宜変更し(S164)、処理を終了する。具体的には、管理者は、誤判別であったと判断した場合、誤判定の要因になったと考えられる項目をデジタルカラー複合機1に通知する。制御部7は、通信装置(適否入力部)5あるいは操作パネル(適否入力部)6を介してこの通知を受信すると、通知された項目の基準評価値を例えば上記式(6)に基づいて変更する。
〔実施形態4〕
本発明のさらに他の実施形態について説明する。なお、説明の便宜上、上記した実施形態と同様の機能を有する部材については同じ符号を付し、その説明を省略する。
図20は、本実施形態にかかる画像処理システム100の概略構成を示す説明図である。この図に示すように、画像処理システム100は、サーバー装置50と、複合機(MFP)A,B,・・・、プリンタA,B,・・・、ファクシミリA,B,・・・、コンピュータA,B,・・・、デジタルカメラA,B,・・・、スキャナA,B,・・・などがネットワークを介して接続された構成である。
サーバー装置50は、実施形態1〜3における制御部7および文書照合処理部13が有
する機能の一部または全部を実行するものである。つまり、サーバー装置50は、ネットワークを介して接続された他の装置(例えば、複合機、プリンタ、ファクシミリ、コンピュータ、デジタルカメラ、スキャナ等)から入力画像データあるいは入力画像データの特徴量を受信し、受信した情報に基づいて類似性判定処理を行う。
ここで、画像処理システム100における処理の一例について説明する。ここでは、図20に示すように、画像処理システム100に備えられるデジタルカラー複合機1(カラー画像処理装置3)とサーバー装置50とが協同して処理を行う場合の例について説明する。
図21に示すように、デジタルカラー複合機1のカラー画像処理装置3は、特徴点算出部31および特徴量算出部32を備えた文書照合処理部13aと、文書照合処理部13aの動作を制御する制御部7aと、文書照合処理部13aの処理に必要な情報を記憶するメモリ8aと、外部の装置との通信を行う通信装置5とを備えている。また、サーバー装置50は、外部の装置との通信を行う通信装置51と、投票処理部33、スコア算出部35、累積スコア比較部36、および登録処理部37を備えた文書照合処理部13bと、文書照合処理部13bを制御する制御部7bと、文書照合処理部13bの処理に必要な情報を記憶するメモリ8bとを備えている。
図22は、画像処理システム100における処理の流れを示すフロー図である。
デジタルカラー複合機1の制御部7aは、入力画像データを取得すると(S61)、特徴点算出部31および特徴量算出部32を制御して特徴点算出処理(S62)および特徴量算出処理(S63)を行わせる。
次に、制御部7aは、特徴量算出部32が算出した特徴量(ハッシュ値)を、通信装置5を介してサーバー装置50に送信させる(S64)。この際、必要に応じて、原稿ID、入力画像データなどを特徴量とともに送信するようにしてもよい。
サーバー装置50では、通信装置51が特徴量を受信すると(S71)、制御部7bが投票処理部33を制御し、通信装置51が受信した特徴量(ハッシュ値)とメモリ8bに記憶されているハッシュテーブルとに基づいて投票処理を行わせる(S72)。また、制御部7bは、スコア算出部35、累積スコア比較部36を制御し、類似性判定処理(S73)を行わせる。なお、ここでは、実施形態2と同様の類似性判定処理を行うものとするが、これに限らず、例えば実施形態1あるいは実施形態3に示した方法によって類似性判定処理を行ってもよい。
そして、制御部7bは、類似性判定処理の判定結果(類似あり/類似なし)を示す判定信号を、通信装置51を介してデジタルカラー複合機1に送信させる(S74)。
デジタルカラー複合機1の制御部7aは、通信装置5が上記判定信号を受信すると(S65)、類似性の有無を判断する(S66)。
そして、S66において類似なしと判断した場合、制御部7aは、全ての入力画像データについての処理が終了したかどうかを判断し(S67)、未処理の入力画像データが残っている場合には当該データに対してS61からの処理を行い、全ての入力画像データについて処理が終了している場合には動作を終了する。
一方、S66において、類似ありと判断した場合、制御部7aは、ログ(操作記録情報;例えば、入力画像の原稿ID、処理要求を入力したユーザのユーザID、処理要求が入力された日付,曜日,時刻、処理要求の内容などを含む)を生成し、入力画像データとログとを通信装置5からサーバー装置50に送信させる(S68)とともに、入力画像データに対する処理(例えば、コピー,プリント,送信,編集,加工,保存等)を禁止し(S69)、動作を終了する。
サーバー装置50の制御部7bは、通信装置51がデジタルカラー複合機1から入力画像データおよびログを受信すると、これらの情報をメモリ8bに記憶させ(S75)、処理を終了する。
なお、上記の説明では、S66において類似ありと判断した場合に、通信装置5からサーバー装置50にログを送信するものとしているが、これに限らず、例えばデジタルカラー複合機1からサーバー装置50に特徴量を送信する際に、特徴量とともにログを送信するようにしてもよい。また、ログとともに、入力画像の原稿ID、入力画像データ(あるいは入力画像データを圧縮した圧縮画像データや低解像度化した画像データ)、登録画像のインデックス等を送信するようにしてもよい。また、入力画像データ(あるいは入力画像データを圧縮した圧縮画像データや低解像度化した画像データ)に代えて、入力画像に対応する登録画像(あるいはこの登録画像を圧縮した圧縮画像データや低解像度化した画像データ)を通知するようにしてもよい。また、この場合、入力画像の原稿IDと登録画像(あるいはこの登録画像を圧縮した圧縮画像データや低解像度化した画像データ)とを通知してもよく、登録画像(あるいはこの登録画像を圧縮した圧縮画像データや低解像度化した画像データ)のみを通知するようにしてもよい。
図23は、この場合の処理の流れを示すフロー図である。デジタルカラー複合機1の制御部7aは、入力画像データを取得すると(S81)、特徴点算出部31および特徴量算出部32を制御して特徴点算出処理(S82)および特徴量算出処理(S83)を行わせる。
次に、制御部7aは、例えば、入力画像の原稿ID、処理要求を入力したユーザのユーザID、処理要求が入力された日付,曜日,時刻、処理要求の内容などに基づいてログ(操作記録情報)を生成し、生成したログと特徴量算出部32が算出した特徴量(ハッシュ値)とを通信装置5を介してサーバー装置50に送信させる(S64)。なお、ログは操作記録に関する情報であれば特に限定されるものではなく、例えば原稿ID、ユーザID、処理モード、処理枚数、時刻のうちのいずれか1つ以上を含んだものを用いることができる。
サーバー装置50では、通信装置51が特徴量およびログを受信すると(S91)、制御部7bが投票処理部33を制御し、通信装置51が受信した特徴量(ハッシュ値)とメモリ8bに記憶されているハッシュテーブルとに基づいて投票処理を行わせる(S92)。また、制御部7bは、スコア算出部35、累積スコア比較部36を制御し、類似性判定処理(S93)を行わせる。
そして、制御部7bは、類似性判定処理の判定結果(類似あり/類似なし)を示す判定信号を、通信装置51を介してデジタルカラー複合機1に送信させる(S74)。
また、制御部7bは、類似性判定処理の結果が類似ありであったか否かを判断し(S95)、類似ありの場合にはログをメモリ8bに格納し(S96)、処理を終了する。一方、類似なしの場合にはログを記録せずに処理を終了する。
一方、デジタルカラー複合機1の制御部7aは、通信装置5が上記判定信号を受信すると(S85)、判定信号に基づいて類似性の有無を判断する(S86)。そして、類似なしと判断した場合、制御部7aは、全ての入力画像データについての処理が終了したかどうかを判断し(S87)、未処理の入力画像データが残っている場合には当該データに対してS81からの処理を行い、全ての入力画像データについて処理が終了している場合には動作を終了する。
一方、S86において、類似ありと判断した場合、制御部7aは、入力画像データに対する処理(例えば、コピー,プリント,送信,編集,加工,保存等)を禁止し(S88)、動作を終了する。なお、S86において類似ありと判断した場合、制御部7aが、入力画像データをサーバー装置50に送信し、サーバー装置50が、ログとともに入力画像データをメモリ8bに格納するようにしてもよい。また、図23に示した処理例において、S94、S85、S86、S88の処理を省略し、サーバー装置50からデジタルカラー複合機1に類似性の判定結果を送信しない構成としてもよい。
また、図21の例では、特徴量算出部32の全部(特徴点抽出部32a、不変量算出部32b、ハッシュ値算出部32c)がデジタルカラー複合機1に備えられており、デジタルカラー複合機1からサーバー装置50にハッシュ値を送信するものとしたが、これに限るものではない。
例えば、図24に示すように、特徴点抽出部32aおよび不変量算出部32bをデジタルカラー複合機1に備える一方、ハッシュ値算出部32cをサーバー装置50に備えた構成としてもよい。
図25は、この場合の類似性判定処理の流れを示すフロー図である。デジタルカラー複合機1の制御部7aは、入力画像データを取得すると(S101)、特徴点算出部31を制御して特徴点算出処理を行わせ(S102)、特徴点抽出部32aおよび不変量算出部32bを制御して不変量H’ijを算出させる(S103)。
次に、制御部7aは、例えば、入力画像の原稿ID、処理要求を入力したユーザのユーザID、処理要求が入力された日付,曜日,時刻、処理要求の内容などに基づいてログ(操作記録情報)を生成し、生成したログと不変量算出部32bが算出した不変量(特徴量)とを通信装置5を介してサーバー装置50に送信させる(S104)。
サーバー装置50では、通信装置51が特徴量およびログを受信すると(S110)、制御部7bがハッシュ値算出部32cを制御してハッシュ値を算出させる(S111)。
次に、制御部7bは、投票処理部33を制御し、ハッシュ値算出部32cの算出したハッシュ値とメモリ8bに記憶されているハッシュテーブルとに基づいて投票処理を行わせる(S112)。また、制御部7bは、スコア算出部35、累積スコア比較部36を制御し、類似性判定処理(S113)を行わせる。
そして、制御部7bは、類似性判定処理の判定結果(類似あり/類似なし)を示す判定信号を、通信装置51を介してデジタルカラー複合機1に送信させる(S114)。
また、制御部7bは、類似性判定処理の結果が類似ありであったか否かを判断し(S115)、類似ありの場合にはログをメモリ8bに格納し(S116)、処理を終了する。一方、類似なしの場合にはログを記録せずに処理を終了する。
一方、デジタルカラー複合機1の制御部7aは、通信装置5が上記判定信号を受信すると(S105)、判定信号に基づいて類似性の有無を判断する(S106)。そして、類似なしと判断した場合、制御部7aは、全ての入力画像データについての処理が終了したかどうかを判断し(S107)、未処理の入力画像データが残っている場合には当該データに対してS101からの処理を行い、全ての入力画像データについて処理が終了している場合には動作を終了する。
一方、S106において、類似ありと判断した場合、制御部7aは、入力画像データに対する処理(例えば、コピー,プリント,送信,編集,加工,保存等)を禁止し(S108)、動作を終了する。なお、S106において類似ありと判断した場合、制御部7aが、入力画像データをサーバー装置50に送信し、サーバー装置50が、ログとともに入力画像データをメモリ8bに格納するようにしてもよい。なお、不変量よりもハッシュ値の方がデータ容量は小さいので、通信処理の効率を向上させたい場合には、デジタルカラー複合機1からサーバー装置にハッシュ値を送信する構成とすることが好ましい。一方、デジタルカラー複合機1の構成を簡略化するためには、ハッシュ値算出部32cをサーバー装置50に設けることが好ましい。
また、特徴量算出部32の各部をサーバー装置50に備えておき、特徴点算出部31の算出した特徴点に関するデータをデジタルカラー複合機1からサーバー装置50に送信し、サーバー装置50に備えられる特徴量算出部32がメモリ8bに格納されているハッシュテーブルと受信した特徴点のデータとに基づいてハッシュ値を算出するようにしてもよい。また、特徴点算出部31および特徴量算出部32の各部をサーバー装置50に備えておき、デジタルカラー複合機1からサーバー装置50に入力画像データを送信し、サーバー装置50に備えられる特徴点算出部31および特徴量算出部32がサーバー装置50から受信した入力画像データとメモリ8bに格納されているハッシュテーブルとに基づいてハッシュ値を算出するようにしてもよい。
また、上記の説明では、類似性の判定処理を行う場合の例について説明したが、登録処理を行う場合には、サーバー装置50に備えられる登録処理部37が、デジタルカラー複合機1から受信した原稿IDとハッシュ値(あるいはサーバー装置50に備えられるハッシュ値算出部32cが算出したハッシュ値)とをメモリ8bに設けられたハッシュテーブルに登録すればよい。なお、類似性判定処理を行うか登録処理を行うかは、デジタルカラー複合機1のユーザが操作パネル6を介して指定し、何れの処理を行うのかを示す信号をサーバー装置50に送信するようにしてもよく、サーバー装置50が類似性判定処理の結果、類似なしと判定した入力画像について登録処理を行うようにしてもよい。
なお、ハッシュ値算出部32cをサーバー装置50に備える場合、ハッシュテーブルに格納されているハッシュ値の算出方法とは異なる方法で(別のハッシュ関数を用いて)ハッシュ値を算出し、算出したハッシュ値を採用してハッシュテーブルを更新してもよい。これにより、例えば原稿画像の種類等に応じて特徴量(不変量)を参照した適切なハッシュ値をハッシュテーブルに登録(更新)することができ、それを用いて投票処理を行えるので、照合精度(類似性の判定精度)を向上させることができる。
また、特徴量(ハッシュ値あるいは不変量)に加えて、例えば入力画像データから抽出した文字情報や、入力画像データを圧縮した圧縮画像データなどをサーバー装置50に送信するようにしてもよい。図26は、この場合の画像処理システム100の構成例を示すブロック図である。
この図に示す画像処理システム100では、デジタルカラー複合機1が、上記した図21の構成に加えて、OCR処理部61および画像圧縮部62を備えている。
OCR(Optical Character Recognition)処理部61は、入力画像データから文字情
報(テキストデータ)を抽出するものである。OCR処理部61としては、従来から公知の種々のOCR装置と同様のものを用いることができる。
画像圧縮部62は、入力画像データを圧縮処理して圧縮画像データを生成するものである。圧縮方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。例えば、高圧縮PDF等の高圧縮フォーマットのデータ、あるいはTIFF、JPEG等の圧縮フォーマットのデータなどを生成するようにしてもよい。
また、入力画像データを、文字および/または線画を含む文字領域と、文字領域以外の領域とに分離する領域分離部を備え、画像圧縮部62が、文字の判読性を向上させるために、文字領域の入力画像データと、文字領域以外の領域の入力画像データとを互いに異なる方法で圧縮するようにしてもよい。例えば、特許第2611012号に記載されている方法を用いて圧縮画像データを作成してもよい。つまり、入力画像データに対して領域分離処理を施して文字領域(文字、線画)とカラー画像領域(フルカラー、中間調などの画像)とに分離し、文字領域についてはカラー画像領域を切り出した部分を白情報で穴埋めして全体をMMR等で符号化し、カラー画像領域については文字のあった部分をその周りの平均的な画像データで穴埋めして大きな濃度変化が起こらないようにしてADCT符号化(適応離散コサイン変換符号化)等により符号化を行うようにしてもよい。なお、高圧縮PDF等の高圧縮フォーマットのデータを用いることにより、転送する画像データの容量を低減することができ、また、文字の判読性の良い画像データをサーバー装置50に送信できる。したがって、サーバー装置50において、文字の判読性の良い画像データを画像ログとして保存することができる。
図27は、図26に示した画像処理システム100における類似性判定処理の流れを示すフロー図である。デジタルカラー複合機1の制御部7aは、入力画像データを取得すると(S121)、特徴点算出部31を制御して特徴点算出処理を行わせ(S122)、特徴量算出部32を制御して特徴量(ハッシュ値)を算出させる(S123)。また、制御部7aは、OCR処理部61を制御し、入力画像データから文字情報を抽出させる(S124)。また、制御部7bは、画像圧縮部62を制御し、入力画像データを圧縮して圧縮画像データを生成させる(S125)。さらに、制御部7bは、例えば入力画像の原稿ID、処理要求を入力したユーザのユーザID、処理要求が入力された日付,曜日,時刻、処理要求の内容などに基づいてログ(操作記録情報)を生成する(S126)。なお、特徴量の算出処理、文字情報の抽出処理、圧縮画像データの生成処置を並行して行ってもよい。
次に、制御部7bは、特徴量、文字情報、圧縮画像データ、およびログを通信装置5からサーバー装置50に送信させる(S127)。そして、制御部7aは、全ての入力画像データについての処理が終了したかどうかを判断し(S128)、未処理の入力画像データが残っている場合には当該データに対してS121からの処理を行い、全ての入力画像データについて処理が終了している場合には動作を終了する。
サーバー装置50では、通信装置51が、特徴量、文字情報、圧縮画像データ、およびログを受信すると(S131)、制御部7bが、投票処理部33を制御し、受信した特徴量とメモリ8bに記憶されているハッシュテーブルとに基づいて投票処理を行わせる(S132)。また、制御部7bは、スコア算出部35、累積スコア比較部36を制御し、類似性判定処理(S133)を行わせる。
そして、制御部7bは、類似性判定処理の結果が類似ありであったか否かを判断し(S134)、類似ありの場合にはログ、文字情報、および圧縮画像データをメモリ8bに格納し(S116)、処理を終了する。一方、類似なしの場合にはログ等を記録せずに処理を終了する。
このように、入力画像データから抽出した文字情報および入力画像データを圧縮した圧縮画像データを生成し、類似ありと判定されたときに文字情報および圧縮画像データをメモリ8bに記憶させておくことにより、例えば、類似度の高い複数の原稿画像が抽出されたときに、管理者が文字情報を用いて検索等を行ったり、文字情報や圧縮画像データを参照して判定の適否を判断したりできる。
なお、図26の例では、OCR処理部61と画像圧縮部62とを備えている構成について説明したが、これに限らず、いずれか一方のみを備えた構成としてもよい。
また、本実施形態では、画像処理システム100がデジタルカラー複合機1とサーバー装置50とからなる場合について説明したが、画像処理システム100の構成はこれに限るものではなく、例えば、サーバー装置50と、複合機、プリンタ(画像形成装置)、ファクシミリ、コンピュータ、デジタルカメラ(画像読取装置)、スキャナ(画像読取装置)のうちのいずれか1つ以上とからなるものであってもよい。つまり、複合機、プリンタ、ファクシミリ、コンピュータ、デジタルカメラ、スキャナ等からサーバー装置50に入力画像データ、入力画像データに基づいて算出したハッシュ値、不変量等を送信し、サーバー装置50が類似性判定処理を行い、判定結果に応じた信号を返信するようにしてもよい。
上記スキャナは、原稿台、光走査部、CCD(charge coupled device)等を備えており、原稿台に載置された原稿画像を光走査部によって走査することで原稿画像を読み込んで画像データを生成する。また、上記デジタルカメラは、撮像レンズ、CCD等を備えており、原稿画像、人物や風景等を撮影して画像データを生成する。なお、上記スキャナおよびデジタルカメラは、画像を適切に再現するために所定の画像処理(例えば各種補正処理等)を施す機能を有していてもよい。
上記プリンタは、コンピュータ、スキャナ、デジタルカメラによって生成された画像データに基づく画像をシート(記録用紙)に印刷する。また、上記ファクシミリは、画像入力装置より読み込まれた画像データに対して、2値化処理、解像度変換処理、回転等の処理を行って所定の形式に圧縮した画像データを相手先に送信したり、相手先から送信されてきた画像データを伸張して画像出力装置の性能に応じて回転処理や解像度変換処理、中間調処理を施し、ページ単位の画像として出力したりする。
また、上記複合機は、スキャナ機能、ファクシミリ送信機能、印刷機能(複写機能、プリンタ機能)のうちの少なくとも2つ以上を有するものである。
また、上記コンピュータは、スキャナやデジタルカメラにより読み込まれた画像データに対して編集を行ったり、アプリケーションソフトウェアを用いて文書の作成を行ったりする。
また、上記各実施形態では、登録画像のインデックスおよび特徴量をメモリ8に登録しておくものとしているが、これに限らず、登録画像の画像データを記憶させておいてもよい。この場合、類似性の判定処理を行う際、特徴点算出部31および特徴量算出部32で登録画像データの特徴量を算出し、算出した特徴量に基づいて類似性の判定をすればよい。
また、上記各実施形態において、デジタルカラー複合機1および/またはサーバー装置50に備えられる文書照合処理部および制御部を構成する各部(各ブロック)は、CPU等のプロセッサを用いてソフトウェアによって実現される。すなわち、デジタルカラー複合機1および/またはサーバー装置50は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログ
ラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるデジタルカラー複合機1および/またはサーバー装置50の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、デジタルカラー複合機1および/またはサーバー装置50に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、デジタルカラー複合機1および/またはサーバー装置50を通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である
。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
また、デジタルカラー複合機1および/またはサーバー装置50の各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよく、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。
本発明のコンピュータシステムは、フラットベッドスキャナ・フィルムスキャナ・デジタルカメラなどの画像入力装置、所定のプログラムがロードされることにより上記類似度算出処理や類似性判定処理など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するCRTディスプレイ・液晶ディスプレイなどの画像表示装置、およびコンピュータの処理結果を紙などに出力するプリンタ等の画像形成装置により構成されてもよい。さらには、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどが備えられていてもよい。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。