JP2004287829A - Image data classifying device and program - Google Patents
Image data classifying device and program Download PDFInfo
- Publication number
- JP2004287829A JP2004287829A JP2003078823A JP2003078823A JP2004287829A JP 2004287829 A JP2004287829 A JP 2004287829A JP 2003078823 A JP2003078823 A JP 2003078823A JP 2003078823 A JP2003078823 A JP 2003078823A JP 2004287829 A JP2004287829 A JP 2004287829A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- feature amount
- group
- storage device
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、画像データを分類するための技術に関する。
【0002】
【従来の技術】
近年、紙に書かれた文書をスキャナに読み込ませて電子化し画像データとしてコンピュータ装置で管理したり、デジタルカメラで撮影された画像を表す画像データをコンピュータ装置に保存して管理したりすることが行われている。画像データを管理する方法としては、紙に書かれた文書を管理する方法と同様に、種類毎に分類して管理するという方法がある。画像データを種類毎に分類する方法は、例えば、以下の通りである。ユーザが、例えば風景、人物、文書といった画像データによって表される画像の種類を予め把握しておき、その種類に対応するフォルダに画像データを格納する。ユーザがこのような分類作業を画像データ1つ1つに対して行うことにより、複数の画像データが種類毎に分類される。
しかし、分類すべき画像データが大量にある場合、画像データ1つ1つに対してこのような分類作業を行うことは、ユーザにとってはかなり面倒である。また、ユーザが分類を間違える可能性も高い。
このような問題を解決可能な技術が特許文献1及び特許文献2に記載されている。特許文献1及び特許文献2には、画像データを自動的に分類して保存する装置が記載されている。特許文献1に示される装置では、画像データのレイアウトを解析し、この解析結果に基づいて、画像データを分類する。レイアウトの解析結果としては、画像データのBlock数、Text属性数、他属性のBlockとの重なり具合度数、Table属性数とその大きさ、Picture数とその大きさなどの情報が挙げられる。特許文献2に示される装置では、画像データが入力されると、当該画像データによって表される画像の特徴を表す特徴量を算出し、この特徴量を用いて、当該画像データと当該装置に既に記憶されている画像データとの関連性をクラスタリング手法により評価し、関連性の高い画像データのグループ毎に分類して記憶する。画像の特徴としては、例えば、画像全体の色調、縦横比、輝度や色の分布状態などの特徴が挙げられる。
【0003】
【特許文献1】
特開2001―101213号公報
【特許文献2】
特開2001―256244号公報
【0004】
【発明が解決しようとする課題】
しかし、いずれの装置においても、画像データが自動的に分類されるため、その分類結果は必ずしもユーザの意図と合致するとは限らない。従って、ユーザは、どのように分類されたのかを確かめなければならない。そのため、ユーザは、例えばコンピュータ装置に画像データの分類先を表示させ、その表示を見て分類結果を確認する必要がある。また、その分類先がユーザの意図に反するものであった場合には、結局、ユーザ自身が分類作業を行わなければならない。
【0005】
本発明は、以上説明した事情に鑑みてなされたものであり、ユーザの負荷を軽減し、より効率的に、画像データを分類する技術を提供することを目的とする。
【0006】
【課題を解決するための手段】
本発明は、画像データと画像データの特徴量を記憶する蓄積装置と、操作入力部と、出力部と、前記蓄積装置に記憶された画像データをあるグループに含めるべき旨の指示が前記操作入力部を介して与えられた場合、当該画像データの特徴量と、当該グループに対応付けられた特徴量とを比較することにより、当該画像データを当該グループに含めることが妥当か否かを判断し、妥当である場合には当該画像データを当該グループに含めて前記蓄積装置に格納し、妥当でない場合には妥当でない旨のメッセージを前記出力部により出力する分類登録部とを有することを特徴とする画像データ分類装置を提供する。
【0007】
本発明によれば、前記蓄積装置に記憶された画像データをあるグループに含めるべき旨の指示が前記操作入力部を介して与えられた場合、当該画像データの特徴量と、当該グループに対応付けられた特徴量とが比較されることにより、当該画像データを当該グループに含めることが妥当か否かが判断され、妥当である場合には当該画像データが当該グループに含めて前記蓄積装置に格納され、妥当でない場合には妥当でない旨のメッセージが前記出力部により出力される。
【0008】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、実施の形態を説明するための全図において、同一機能を有するものは同一符号を付け、その繰り返しの説明は省略する。
(1.構成)
<全体構成>
図1は、本発明に係る画像データ分類装置1のハードウェア構成を示すブロック図である。
ユーザインターフェース14は、操作入力部14aと表示部14bとから構成される。操作入力部14aは、数字、文字、コマンドなどを入力するための複数のキーを備え、これらのキーの操作に応じた操作信号を出力する。表示部14bは、図示しない表示パネルと、この表示パネルを駆動する駆動回路とを有する。なお、表示部14bの代わりに、情報を音声にて出力する音声出力部を備えても良い。
【0009】
ネットワークインターフェース15は、ネットワークを介して制御部10を他の装置に接続し、両者の間のデータの授受を制御する。
画像入力装置12は、原稿から画像を読み取り、アナログ画像信号を出力するスキャナと、スキャナから出力されるアナログ画像信号をディジタル画像信号に変換して出力するA/D変換回路とを有する。また、好ましい態様において、画像入力装置12は、原稿受けにセットされた原稿の束から原稿を1枚ずつ取り出してスキャナに出力するADF(Automatic Document Feeder;自動文書送り機構)を有する。
【0010】
蓄積装置11は、ハードディスクドライブやDVD−RAM(Digital Video Disc−Random Access Memory)ドライブ等の大容量記憶装置から構成される。制御部10は、以上説明した装置各部とバス16を介して接続されている。この制御部10は、画像データ分類装置1全体を制御する手段であり、CPU(Central Processing Unit)と、RAM(Randam Accsess Memory)と、ROM(Read Only Memory)とを備える(いずれも図示略)。ここで、CPUは、ROMに格納されたプログラムを実行することにより、画像データ分類装置1の各部の制御を行う。
【0011】
図2は、制御部10に係る機能的構成を示すブロック図である。制御部10は、特徴量抽出部10bと、類似度評価部10cと、分類登録部10aとを有する。これらの実体は、制御部10のCPUによって実行されるソフトウェアモジュールである。
特徴量抽出部10bは、画像データに対して特徴量抽出処理を行い、画像データによって表される画像の特徴量を算出する。画像の特徴とは、例えば、画像の濃度、縦横比、輝度や色の分布状態、エッジの分布状態、平坦なエリアの分布状態などである。
このような特徴量を算出する手順は例えば以下の通りである。まず、特徴量抽出部10bは、画像データで表される画像の領域を縦方向にX分割、横方向にY分割する。すなわち、一の画像データで表される画像をX*Y個の領域に分割する。次に、各々の領域についてそれぞれ、所定の算出方法で特徴量を算出する。この特徴量については、各種のものが考えられるが、本実施形態では、その領域の色のR(赤色)、G(緑色)、B(青色)の各成分を求める。そして、R、G、Bの各成分をL*a*b空間(特徴色空間)での色成分を表す3個の量に変換する。これら3個の量を1つの領域に対応した特徴量とする。以上の結果、画像データから、(X*Y*3)個の特徴量が算出される。図5においては、一例としてX=6、Y=4の場合が示されており、この画像データからは計72個の特徴量が算出されていることが示されている。この72個の特徴量は、画像データによって表される画像の特徴を表す72次元ベクトルを構成する。
【0012】
類似度評価部10cは、ある画像データの特徴量と別の画像データまたは画像データ群から得られた特徴量の比較を行い、両者に対応した各画像が同一種類の画像と認められる程度に類似しているか否かの判断をするモジュールである。対比の対象となる特徴量は、制御部10によって類似度評価部10cに与えられる。
類似度評価部10cによって行われる判断は次の通りである。まず、各画像データから得られたn個の特徴量は、ある画像の特徴を表すn次元のベクトルを構成する。そこで、類似度評価部10cは、対比すべき2つの画像データに対応した各n個の特徴量が与えられた場合、一方のn個の特徴量を成分とするn次元ベクトルと他方のn個の特徴量を成分とするn次元ベクトルとのn次元空間での距離を求める。そして、この距離に基づいて、2つの画像データによって表される各画像が同一種類に属すると認められる程度に類似しているかの判断を行うのである。図6および図7は、この類似度評価部10cによる処理を説明する図である。これらの図には、2つの画像データに対応した各特徴量を各々成分とする2つのベクトルとして、便宜上、3次元ベクトルαおよびβが示されている。そして、図6には、ベクトルαとベクトルβとの間のユークリッド距離が短い状態が示され、図7には、ベクトルαとベクトルβとの間のユークリッド距離が長い状態が示されている。類似度評価部10cは、これらの2つのベクトルαおよびβのユークリッド距離を、対比される2つの画像の類似度とみなし、類似度が所定値以上である(ユークリッド距離が所定長以下である)場合には、2つの画像が同一種類に属すると判断し、図7に示すように類似度が所定値未満である(ユークリッド距離が所定長よりも長い)場合には、2つの画像が同一種類に属しないと判断するのである。
なお、算出する距離はユークリッド距離に限らず、例えば、マハラノビス距離などの他の算出方式による距離であっても構わない。
【0013】
分類登録部10cは、以上説明した特徴量抽出部10bおよび類似度評価部10cを利用して、蓄積装置11に蓄積された画像データをユーザが適切なフォルダに分類する作業を補助するための処理を行う。なお、この処理については、説明の重複を避けるため、本実施形態の動作の説明において明らかにする。
【0014】
(2.動作)
図8は、ユーザが蓄積装置11に蓄積された画像データを分類する際の画像データ分類装置1の動作を示すフローチャートである。
以下説明する動作は、次のような状況において行われるものである。
まず、画像入力装置12を介して入力された画像データあるいはネットワークインタフェース15を介して受信された画像データなどの各種の画像データが、あるフォルダに納められ、蓄積装置11に格納されている。
そして、ユーザは、操作入力部14aから指示を与え、このフォルダの内容を表示部14bに表示させている。図3は、このときの表示部14bの表示内容を例示している。この図に示すように、表示部14bには、未分類の画像データを格納するための未分類フォルダ11aと、風景フォルダ、人物フォルダ、静物フォルダといった特定の種類の画像データを格納するために作成された各種の分類フォルダ11bと、これらのいずれのフォルダにも格納されていない画像データを各々表すアイコンが表示されている。
この状態において、ユーザが、操作入力部14aにより所定の操作を行うと、制御部10では、分類登録部10aが動作を開始する。
そして、ユーザが、操作入力部14aにおけるマウスにより、ある画像データのアイコンをある分類フォルダ11aのアイコン内に入れる操作をすると、分類登録部10aにより、図8に示すルーチンが行われる。
【0015】
まず、分類登録部10aは、マウスによって指示されたアイコンが表している対象画像データを蓄積装置11から読み出し(ステップS10)、対象画像データに対応した特徴量が蓄積装置11に記憶されているか否かを判断する(ステップS11)。この判断結果が否定的である場合、分類登録部10aは、対象画像データを特徴量抽出部10bに引き渡し、特徴量を算出する(ステップS12)。そして、算出した特徴量を、対象画像データに対応付けて蓄積装置11に格納する。次いで、分類フォルダ11bのうちユーザが対象画像データのアイコンを入れようとしたアイコンを求め、このアイコンによって表されている分類フォルダ11b(対象フォルダ)に対応付けられた特徴量が蓄積装置11に格納されているか否かを判断する。該当する特徴量が蓄積装置11に格納されていない場合には(ステップS13:YES)、対象画像データを対象フォルダに格納し(ステップS16)、対象画像データの特徴量により対象フォルダの特徴量を更新する(ステップS17)。ここでは、対象フォルダに対応付けられた特徴量がないので、分類登録部10aは、対象画像データの特徴量そのものを対象フォルダに対応付けて蓄積装置11に格納し、図8に示すルーチンを終了する。
【0016】
対象フォルダに対応付けられた特徴量が蓄積装置11に格納されている場合(ステップS13:NO)、分類登録部10aは、当該特徴量とステップS12で算出した特徴量と類似度評価部10cに引き渡す(ステップS14)。そして、両特徴量によって表される画像が同一種類に属すると認められる程度に類似しているとの判断結果が類似度評価部10cから得られ、対象画像データを対象フォルダに格納することが妥当であると認められる場合(ステップS15:YES)、分類登録部10aは、対象画像データを対象フォルダに格納する(ステップS16)。次いで、対象画像データに係る特徴量を用いて、対象フォルダに対応付けられた特徴量を更新する(ステップS17)。このステップS17の処理の態様には様々なものが考えられるが、1つ具体例を挙げると次の通りである。まず、分類登録部10aは、対象フォルダに対象画像データを格納すると、その時点において対象フォルダに格納されている全ての画像データ(新たに格納された対象画像データを含む)について、各々に対応付けられている各特徴量を蓄積装置11から読み出す。ここで、1つの画像データに対応付けられた特徴量は、画像の特徴を表すベクトルを構成しているのは既に述べた通りである。分類登録部10aは、対象フォルダ内の各画像データに対応付けられた各特徴量、すなわち、画像の特徴を表す複数のベクトルの重心を求め、これを当該対象フォルダに対応付けて蓄積装置11に格納するのである。なお、対象フォルダに対応付ける特徴量を他の算出方法によって求めるようにしても良い。また、特徴量を求めるタイミングは、画像データが分類フォルダ11bに格納された直後から新たな画像データが分類フォルダ11bに格納される直前までのいつでも良い。
【0017】
一方、ステップS15において、対象画像データを対象フォルダに格納することが妥当でないと判定した場合には、「この画像データはこのフォルダには適していません。それでも格納しますか?」という警告メッセージを表示部14bに表示させる(ステップS18)。この警告メッセージに肯定的に応答する指示がユーザから入力されると(ステップS19:YES)、分類登録部10aは、ステップS16〜S17の処理を行う。
しかし、ステップS18において表示された警告メッセージに否定的に応答する指示がユーザから入力されると(ステップS19:NO)、分類登録部10aは、対象画像データを未分類フォルダ11aに格納する(ステップS20)。
【0018】
なお、図示は省略したが、分類登録部10aは、未分類フォルダ11aに格納された画像データについて、分類フォルダ11bに格納させる指示があった場合には、その画像データについて、図8に示すルーチンを実行するように構成されている。従って、ユーザは、未分類フォルダ11aに格納された画像データを適切な分類フォルダ11bに移動することができる。
また、既に分類フォルダ11bに格納された画像データを他の分類フォルダ11bに格納させる指示があった場合についても同様である。
【0019】
以上のようにして、ユーザが画像データを所望のフォルダに格納させようとする際、当該フォルダに既に格納されている画像データと、格納させる対象の画像データとの類似性が判定されることにより、格納対象の画像データを所望のフォルダに格納させることが適切であるか否かが判定される。その判定結果が否定的である場合には、ユーザに対して警告メッセージが出される。従って、ユーザは、画像データの格納先に深い注意を払わなくても、画像データが不適切な格納先に格納されることを防ぐことができる。
【0020】
(3.変形例)
以上、本発明の実施形態について説明したが、本発明はその主要な特徴から逸脱することなく他の様々な形態で実施することが可能である。なお、変形例としては、例えば、以下のようなものが考えられる。
【0021】
<変形例1>
本変形例では、属性情報が操作入力部14aから入力された場合に、制御部10は、画像入力装置12を介して入力された画像データに基づいてジョブパッケージを作成する際に、この属性情報をジョブパッケージに含め、蓄積装置11に格納する。属性情報は、例えば、文書データの名称、サイズ、作成の日付、データフォーマットの種類等についての情報である。そして、上述のステップS27又はステップS61において、制御部10は、発見されたジョブパッケージ内の画像データに基づいてサムネイル画像を表示部14bに表示させる代わりに、ジョブパッケージ内の属性情報を表示させる。
更に、画像データと対応付けられた属性情報を特徴量として用いても良い。
【0022】
<変形例2>
画像入力装置12は、磁気ディスクやメモリカード等の媒体に対して情報の読み書きを行うリード/ライト装置とその制御手段とから構成しても良い。また、画像入力部装置12は、アプリケーションソフトウェアで作成されたデータからビットマップ形式の画像データを生成する装置であっても良い。
【0023】
<変形例3>
画像データ分類装置1は、更に、画像出力装置を備える構成であっても良い。画像出力装置は、プリンタとこのプリンタの駆動制御を行うプリンタ制御回路とを有し、画像データに表される画像を紙に出力するものであっても良い。また、画像出力装置13は、磁気ディスクやメモリカード等の媒体に対して情報の読み書きを行うリード/ライト装置とその制御手段とから構成しても良い。このような画像出力装置13では、画像を紙にではなく、磁気ディスクやメモリカード等の媒体に出力する。
または画像出力装置13は、ネットワークインターフェース15を介してデータの授受を行うデータ転送装置であっても良い。このような画像出力装置13では、画像を出力するのではなく、HTML(Hyper Text Markup Language)などのデータ形式に変換されたデータを出力しても良い。
また、画像出力装置13は、例えば、CRT(Cathode Ray Tube)とその制御手段とで構成されるものであっても良い。
【0024】
<変形例4>
複数の画像データをまとめて1つの分類フォルダに格納させるような構成であっても良い。このような構成においては、制御部10は、複数の画像データに係る各特徴量を取得し、これらの各特徴量と、分類先のフォルダとしてユーザに選択された分類フォルダ(対象フォルダ)に係る特徴量とをそれぞれ比較する。そして、対象フォルダに格納することが妥当ではないと判定した画像データについては、上述の同様にして、警告メッセージを表示させ、対象フォルダに格納することが妥当であると判定した画像データについては、対象フォルダに格納する。このような構成によれば、ユーザの分類作業に係る手間や時間を更に削減することができる。
【0025】
<変形例5>
画像データから算出する特徴量は、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、平坦なエリアの分布状態のどれか一つでもよいし、複数であってもよい。例えば、画像データに表される画像の領域を24分割した場合、一つの領域から色調、エッジ状態を抽出し、特徴量を144次元のベクトルとして表してもよい。また、主成分解析等の手法を用いて、できるだけ画像データの特徴を損なうことなく特徴量の数を減らしてもよい。これにより、類似度評価部10cによって行われる計算量を減少することができる。従って、算出すべき特徴量の種類数は問われない。また、分割する領域の数は問われない。
【0026】
<変形例6>
上述の実施形態においては、画像データに係る特徴を、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、平坦なエリアの分布状態であるとした。このような特徴量を用いて画像データを特定することは、当該画像データに表される画像が原稿の全部またはほとんど全ての部分を占めている場合には非常に有効である。しかしながら、契約書等の文書のように文字が原稿のほとんど全ての部分を占めている場合には、あまり有効ではないこともある。従って、本変形例においては、画像データに表される画像が文書を含む場合に、当該画像データに係る特徴を、文字の高さ、字間、行間、縦書き・横書き等の文書フォーマットに係る特徴として取り扱う。以下、文書フォーマットに係る特徴量を求める方法について説明する。
スキャナ等の画像入力装置12により読み込まれた画像から、文書フォーマットに係る特徴を求めるには、各種従来技術が適用可能である。そのような従来技術の一例が特開平5−108793の段落0009から0012の部分に開示されている。当該技術においては、横書きであることを前提として行間bと、字間dを求めている。しかし、原稿が横書きであるか縦書きであるか分からない場合もある。そこで、通常は行間の方が字間より大きいことを利用し、当該技術により行間として求めたbと字間として求めたdを比較して大きい方を行間、小さい方を字間とし、bの方が大きい場合は横書きとし、dの方が大きい場合は縦書きとする、という方法で、縦書きか横書きかを判別する。
【0027】
また、文書フォーマットに係る特徴を求める他の方法は以下の通りである。画像データに表される画像を複数の領域に分割する。次に分割された領域の各々について、文字の高さ、字間、行間、縦書き・横書きなど情報を含む文書フォーマットに係る特徴量を算出する。例えば、文字の高さ「10pt」、字間「15pt」、行間「10.5pt」、縦書き・横書き「0」という値が得られる。ここでは、縦書きの場合には「0」を、横書きの場合は「1」を対応付けるものとする。
【0028】
次に、算出された全ての領域に係る特徴量のなかで最も頻繁に出現する値を決定し、これをそのページの特徴量とする。例えば、全24個の領域のうち、20個の領域において文字の高さが「10pt」であり、3個の領域において「12pt」、一つの領域では「16pt」であった場合は、当該ページの文字の高さにかかる特徴量として「10pt」が算出される。字間、行間、縦書き・横書きについても同様である。
【0029】
一般的に言えば、表題や見出しがページ全体に占める割合は、文書を特徴付けている本文に比べて小さい。従って、最頻出の値は、本文の特徴を表した量であると推定することができる。これによって、文書に表題や見出し部が存在したとしても、画像データから的確に特徴量を得ることができる。
以上のようにして、1つの画像データから1つの特徴ベクトルが求められる。以下に、4個の成分をもつ4次元ベクトルで表される特徴ベクトルのfの一例を示す。
f=(文字の高さ、字間、行間、[縦書き:0,横書き:1])
【0030】
【発明の効果】
本発明によれば、ユーザの負荷を軽減し、より効率的に、画像データを分類することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る画像データ分類装置1のハードウェア構成を示すブロック図である。
【図2】同実施形態に係る制御部10の機能的構成を示すブロック図である。
【図3】同実施形態に係る分類登録部10aの機能を説明するための図である。
【図4】同実施形態に係る分類登録部10aの機能を説明するための図である。
【図5】同実施形態に係る特徴量抽出部10bの機能を説明するための図である。
【図6】同実施形態に係る類似度評価部10cの機能を説明するための図である。
【図7】同実施形態に係る類似度評価部10cの機能を説明するための図である。
【図8】同実施形態に係る画像データ分類装置1の動作の流れを示すフローチャートである。
【符号の説明】
1・・・画像データ分類装置、10・・・制御部、10a・・・、分類登録部、10b・・・特徴量抽出部、10c・・・類似度評価部、11・・・蓄積装置、12・・・画像入力装置、14・・・ユーザーインターフェース、14a・・・操作入力部、14b・・・表示部、15・・・ネットワークインターフェース、16・・・バス。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a technique for classifying image data.
[0002]
[Prior art]
In recent years, it has become possible to read a document written on paper with a scanner and digitize it and manage it as image data with a computer device, or to store and manage image data representing an image captured by a digital camera with a computer device. Is being done. As a method of managing image data, there is a method of classifying and managing each type in the same manner as a method of managing a document written on paper. A method of classifying image data for each type is as follows, for example. The user grasps in advance the type of an image represented by image data such as a landscape, a person, and a document, and stores the image data in a folder corresponding to the type. When the user performs such a classification operation for each image data, a plurality of image data are classified for each type.
However, when there is a large amount of image data to be classified, it is quite troublesome for the user to perform such classification work for each image data. Further, there is a high possibility that the user makes a mistake in the classification.
Techniques that can solve such a problem are described in
[0003]
[Patent Document 1]
JP 2001-101213 A [Patent Document 2]
JP 2001-256244 A
[Problems to be solved by the invention]
However, since the image data is automatically classified in any of the apparatuses, the classification result does not always match the user's intention. Therefore, the user has to check how it was classified. Therefore, the user needs to display the classification destination of the image data on a computer device, for example, and check the classification result by looking at the display. If the classification destination is contrary to the user's intention, the user must eventually perform the classification work.
[0005]
The present invention has been made in view of the circumstances described above, and an object of the present invention is to provide a technique for reducing the load on a user and more efficiently classifying image data.
[0006]
[Means for Solving the Problems]
The present invention provides a storage device that stores image data and a feature amount of the image data, an operation input unit, an output unit, and an instruction that image data stored in the storage device should be included in a group. When given through the section, the feature amount of the image data is compared with the feature amount associated with the group to determine whether it is appropriate to include the image data in the group. A classification registration unit that stores the image data in the storage device in a case where the image data is appropriate, and outputs a message indicating that the image data is invalid if the image data is invalid. To provide an image data classifying device.
[0007]
According to the present invention, when an instruction to include image data stored in the storage device in a certain group is given through the operation input unit, the feature amount of the image data is associated with the group. It is determined whether or not it is appropriate to include the image data in the group by comparing the obtained feature amount, and if so, the image data is included in the group and stored in the storage device. If not, a message indicating that the message is not valid is output from the output unit.
[0008]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In all the drawings for describing the embodiments, components having the same function are denoted by the same reference numerals, and repeated description thereof will be omitted.
(1. Configuration)
<Overall configuration>
FIG. 1 is a block diagram showing a hardware configuration of an image
The
[0009]
The
The
[0010]
The
[0011]
FIG. 2 is a block diagram illustrating a functional configuration according to the
The feature
A procedure for calculating such a feature amount is, for example, as follows. First, the feature
[0012]
The
The judgment performed by the
Note that the distance to be calculated is not limited to the Euclidean distance, and may be a distance by another calculation method such as a Mahalanobis distance.
[0013]
The
[0014]
(2. Operation)
FIG. 8 is a flowchart showing the operation of the image
The operation described below is performed in the following situation.
First, various types of image data such as image data input via the
Then, the user gives an instruction from the operation input unit 14a, and displays the contents of this folder on the
In this state, when the user performs a predetermined operation using the operation input unit 14a, in the
Then, when the user performs an operation of inserting an icon of certain image data into an icon of a
[0015]
First, the
[0016]
When the feature amount associated with the target folder is stored in the storage device 11 (step S13: NO), the
[0017]
On the other hand, if it is determined in step S15 that storing the target image data in the target folder is not appropriate, a warning message “This image data is not suitable for this folder. Is displayed on the
However, when the user inputs an instruction to respond negatively to the warning message displayed in step S18 (step S19: NO), the
[0018]
Although not shown, the
The same applies to a case where an instruction to store image data already stored in the
[0019]
As described above, when the user attempts to store the image data in the desired folder, the similarity between the image data already stored in the folder and the image data to be stored is determined. It is determined whether it is appropriate to store the image data to be stored in a desired folder. If the result of the determination is negative, a warning message is issued to the user. Therefore, the user can prevent the image data from being stored in an inappropriate storage destination without paying careful attention to the storage destination of the image data.
[0020]
(3. Modified example)
As described above, the embodiments of the present invention have been described, but the present invention can be embodied in various other forms without departing from the main features. Note that, for example, the following modifications are possible.
[0021]
<
In the present modification, when attribute information is input from the operation input unit 14a, the
Further, attribute information associated with image data may be used as a feature amount.
[0022]
<Modification 2>
The
[0023]
<
The image
Alternatively, the image output device 13 may be a data transfer device that exchanges data via the
Further, the image output device 13 may be configured by, for example, a CRT (Cathode Ray Tube) and its control means.
[0024]
<Modification 4>
A configuration in which a plurality of image data are collectively stored in one classification folder may be employed. In such a configuration, the
[0025]
<Modification 5>
The feature amount calculated from the image data may be any one of the color tone, the aspect ratio, the distribution state of the luminance and the color, the distribution state of the edge, and the distribution state of the flat area, or may be plural. . For example, when the area of the image represented by the image data is divided into 24, the color tone and the edge state may be extracted from one area, and the feature amount may be represented as a 144-dimensional vector. In addition, the number of feature values may be reduced as much as possible without impairing the features of the image data by using a technique such as principal component analysis. Thus, the amount of calculation performed by the
[0026]
<Modification 6>
In the above-described embodiment, the features related to the image data are the color tone, the aspect ratio, the distribution state of luminance and color, the distribution state of edges, and the distribution state of flat areas of the entire image. Specifying image data using such feature amounts is very effective when the image represented by the image data occupies all or almost all of the document. However, when characters occupy almost all parts of the manuscript, such as a document such as a contract, it may not be very effective. Therefore, in the present modification, when the image represented by the image data includes a document, the features related to the image data are related to the document format such as character height, character spacing, line spacing, and vertical / horizontal writing. Treat as a feature. Hereinafter, a method of obtaining the feature amount related to the document format will be described.
Various conventional techniques can be applied to determine the characteristics related to the document format from the image read by the
[0027]
Further, another method for obtaining the characteristics related to the document format is as follows. The image represented by the image data is divided into a plurality of regions. Next, for each of the divided areas, a feature amount related to a document format including information such as character height, character spacing, line spacing, and vertical / horizontal writing is calculated. For example, values such as a character height "10 pt", a character spacing "15 pt", a line spacing "10.5 pt", and a vertical / horizontal writing "0" are obtained. Here, “0” is associated with vertical writing, and “1” is associated with horizontal writing.
[0028]
Next, a value that appears most frequently among the calculated feature amounts of all the regions is determined, and is set as the feature amount of the page. For example, if the character height is "10 pt" in 20 of the 24 areas, "12 pt" in 3 areas, and "16 pt" in one area, the page is "10 pt" is calculated as a feature amount related to the height of the character. The same applies to character spacing, line spacing, vertical / horizontal writing.
[0029]
Generally speaking, titles and headings occupy a smaller percentage of the entire page than the text that characterizes the document. Therefore, the most frequently occurring value can be estimated to be a quantity representing the feature of the text. As a result, even if a title or a heading part exists in the document, a feature amount can be accurately obtained from the image data.
As described above, one feature vector is obtained from one image data. An example of a feature vector f represented by a four-dimensional vector having four components is shown below.
f = (character height, character spacing, line spacing, [vertical writing: 0, horizontal writing: 1])
[0030]
【The invention's effect】
According to the present invention, the load on the user can be reduced, and the image data can be classified more efficiently.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a hardware configuration of an image
FIG. 2 is a block diagram showing a functional configuration of a
FIG. 3 is a diagram for explaining a function of a
FIG. 4 is a diagram for explaining functions of a
FIG. 5 is a diagram for explaining a function of a feature
FIG. 6 is a diagram for explaining a function of a
FIG. 7 is a diagram for explaining a function of a
FIG. 8 is a flowchart showing a flow of an operation of the image
[Explanation of symbols]
DESCRIPTION OF
Claims (4)
操作入力部と、
出力部と、
前記蓄積装置に記憶された画像データをあるグループに含めるべき旨の指示が前記操作入力部を介して与えられた場合、当該画像データの特徴量と、当該グループに対応付けられた特徴量とを比較することにより、当該画像データを当該グループに含めることが妥当か否かを判断し、妥当である場合には当該画像データを当該グループに含めて前記蓄積装置に格納し、妥当でない場合には妥当でない旨のメッセージを前記出力部により出力する分類登録部と
を有することを特徴とする画像データ分類装置。A storage device for storing image data and a feature amount of the image data,
An operation input unit;
An output unit;
When an instruction to include the image data stored in the storage device in a certain group is given via the operation input unit, the feature amount of the image data and the feature amount associated with the group are determined. By comparing, it is determined whether or not it is appropriate to include the image data in the group. If the image data is appropriate, the image data is included in the group and stored in the storage device. An image data classification device, comprising: a classification registration unit that outputs a message indicating that the message is invalid by the output unit.
ことを特徴とする請求項1に記載の画像データ分類装置。After outputting the message to the output unit, the classification and registration unit, when an instruction to include the image data in the group is given via the operation input unit, the image data is output to the group. The image data classification device according to claim 1, wherein the image data is stored in the storage device.
前記分類登録部は、前記操作入力部により指示された画像データを前記特徴量抽出部に引き渡し、前記特徴量抽出部により抽出された特徴量を前記画像データに対応付けて前記蓄積装置に格納し、あるグループに対応付けられる特徴量を当該グループに属する画像データに対応付けられて前記蓄積装置に格納された特徴量から算出する
ことを特徴とする請求項1に記載の画像データ分類装置。A feature amount extracting unit that extracts a feature amount of the image data,
The classification registration unit transfers the image data specified by the operation input unit to the feature amount extraction unit, and stores the feature amount extracted by the feature amount extraction unit in the storage device in association with the image data. The image data classification device according to claim 1, wherein a feature amount associated with a certain group is calculated from a feature amount stored in the storage device in association with image data belonging to the group.
当該画像データの特徴量と、当該グループに対応付けられた特徴量とを比較することにより、当該画像データを当該グループに含めることが妥当か否かを判断するステップと、
当該画像データを当該グループに含めることが妥当である場合に当該画像データを当該グループに含めて前記蓄積装置に格納するステップと、
当該画像データを当該グループに含めることが妥当でない場合にその旨のメッセージを出力部により出力するステップと
をコンピュータに実行させるプログラム。Receiving, via the operation input unit, an instruction indicating that the image data stored in the storage device should be included in a certain group;
Determining whether the image data is appropriate to be included in the group by comparing the feature amount of the image data with the feature amount associated with the group;
Storing the image data in the storage device by including the image data in the group when it is appropriate to include the image data in the group;
Outputting a message to the effect that the image data is not to be included in the group by the output unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003078823A JP4329370B2 (en) | 2003-03-20 | 2003-03-20 | Image data classification apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003078823A JP4329370B2 (en) | 2003-03-20 | 2003-03-20 | Image data classification apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004287829A true JP2004287829A (en) | 2004-10-14 |
JP4329370B2 JP4329370B2 (en) | 2009-09-09 |
Family
ID=33293194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003078823A Expired - Fee Related JP4329370B2 (en) | 2003-03-20 | 2003-03-20 | Image data classification apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4329370B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009176217A (en) * | 2008-01-28 | 2009-08-06 | Ricoh Co Ltd | Image display device |
JP2010092159A (en) * | 2008-10-06 | 2010-04-22 | Fuji Xerox Co Ltd | Image data decision device, image data decision system and program |
JP2012231550A (en) * | 2012-08-31 | 2012-11-22 | Casio Comput Co Ltd | Image display apparatus and program |
-
2003
- 2003-03-20 JP JP2003078823A patent/JP4329370B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009176217A (en) * | 2008-01-28 | 2009-08-06 | Ricoh Co Ltd | Image display device |
JP2010092159A (en) * | 2008-10-06 | 2010-04-22 | Fuji Xerox Co Ltd | Image data decision device, image data decision system and program |
JP2012231550A (en) * | 2012-08-31 | 2012-11-22 | Casio Comput Co Ltd | Image display apparatus and program |
Also Published As
Publication number | Publication date |
---|---|
JP4329370B2 (en) | 2009-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5452825B2 (en) | A method for reducing the size of each page of a multi-page document for rendering | |
US20040234169A1 (en) | Image processing apparatus, control method therefor, and program | |
US20100153834A1 (en) | Business form creating system, network system using the same, and business form creating method | |
US7543246B2 (en) | Image displaying program product and an image displaying apparatus | |
JP2005073015A (en) | Device and method for image processing and computer program | |
JP4035228B2 (en) | Image processing method and image processing apparatus | |
JP5412903B2 (en) | Document image processing apparatus, document image processing method, and document image processing program | |
US8023735B2 (en) | Image processing apparatus for extracting representative characteristic from image data and storing image data to be associated with representative characteristic | |
JP2001337994A (en) | Thumbnail display system and method and recording medium with processing program therefor recorded therein | |
JP2009169675A (en) | Document processing apparatus, document processing method and document processing program | |
JP2008052496A (en) | Image display device, method, program and recording medium | |
JP5565130B2 (en) | Reduced image generation apparatus and program | |
US6377359B1 (en) | Information processing apparatus | |
US8559725B2 (en) | Method and apparatus for extracting raster images from portable electronic document | |
JP5098614B2 (en) | Method for controlling sentence processing apparatus and sentence processing apparatus | |
JP5230134B2 (en) | Image forming apparatus with adaptive automatic layout function | |
JP4329370B2 (en) | Image data classification apparatus and program | |
JP2004127203A (en) | Image processor, image processing method, program for causing computer to execute the method, and computer readable recording medium with the program recorded thereon | |
JP2017084304A (en) | Image display device and image display method | |
JP2005157928A (en) | Stamp processor, electronic approval system, program and recording medium | |
JP2004080341A (en) | Image processor, image processing method, program, and recording medium | |
JP2004280691A (en) | Document filing device | |
US8570610B2 (en) | Information processing apparatus, information processing method and computer readable medium for designating a region of reduced document on display and creating image corresponding to the designated region | |
JP2003331299A (en) | Device, method and program for displaying reduced image, and recording medium recorded with program | |
JP2001222717A (en) | Document image recognition method and system, and computer readable recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090303 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090526 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090608 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120626 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120626 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130626 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140626 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |