JP2003316819A - オブジェクト分類検索装置及びそれを実行するためのプログラム - Google Patents
オブジェクト分類検索装置及びそれを実行するためのプログラムInfo
- Publication number
- JP2003316819A JP2003316819A JP2002119730A JP2002119730A JP2003316819A JP 2003316819 A JP2003316819 A JP 2003316819A JP 2002119730 A JP2002119730 A JP 2002119730A JP 2002119730 A JP2002119730 A JP 2002119730A JP 2003316819 A JP2003316819 A JP 2003316819A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- vector
- objects
- similarity
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
(57)【要約】
【課題】 被検索オブジェクトの数や特徴ベクトルの元
の数が増加するにつれて必要とされる計算量や記録領域
が増大する問題を解決し、高速でコンパクトな類似オブ
ジェクトの分類、検索システムを提供する。 【解決手段】 各種オブジェクトを入力するオブジェク
ト入力手段と、入力されたオブジェクトを記録するオブ
ジェクト記録手段と、与えられた検索目標オブジェクト
と類似度の高いオブジェクトの部分集合を前記記録され
たオブジェクトの中から抽出するオブジェクト検索手段
によって構成されるオブジェクト分類検索装置におい
て、オブジェクトをベクトルに変換するベクトル変換手
段と、そのベクトルをクラスターとしてまとめるクラス
ター生成手段と、クラスター生成手段によってツリー状
の樹形図を生成する樹形図生成手段と、樹形図を基に検
索を行う検索手段と、検索結果を表示する抽出オブジェ
クト表示手段を備えている。
の数が増加するにつれて必要とされる計算量や記録領域
が増大する問題を解決し、高速でコンパクトな類似オブ
ジェクトの分類、検索システムを提供する。 【解決手段】 各種オブジェクトを入力するオブジェク
ト入力手段と、入力されたオブジェクトを記録するオブ
ジェクト記録手段と、与えられた検索目標オブジェクト
と類似度の高いオブジェクトの部分集合を前記記録され
たオブジェクトの中から抽出するオブジェクト検索手段
によって構成されるオブジェクト分類検索装置におい
て、オブジェクトをベクトルに変換するベクトル変換手
段と、そのベクトルをクラスターとしてまとめるクラス
ター生成手段と、クラスター生成手段によってツリー状
の樹形図を生成する樹形図生成手段と、樹形図を基に検
索を行う検索手段と、検索結果を表示する抽出オブジェ
クト表示手段を備えている。
Description
【0001】
【発明の属する技術分野】本発明は電子図書館や電子博
物館、電子カタログなどのデジタル化されたオブジェク
ト(画像、音声、テキスト)を分類記録し、それらのデ
ータから、利用者が必要とするデータを抽出する類似デ
ータ検索装置に関する。
物館、電子カタログなどのデジタル化されたオブジェク
ト(画像、音声、テキスト)を分類記録し、それらのデ
ータから、利用者が必要とするデータを抽出する類似デ
ータ検索装置に関する。
【0002】
【従来の技術】会社内やインターネット空間に、電子化
された文書や映像、音声、音楽などのディジタル化され
たオブジェクトが大量に蓄積されてきている。この中か
ら、関心のある、あるいは必要とされるオブジェクトを
検索する必要性は、日に日に高まりつつあると言ってよ
い。利用者が何らかの方法で検索目標オブジェクトを入
力したら、そのオブジェクトと類似度の高いオブジェク
ト群を、蓄積された被検索オブジェクト群の中から、指
定個数抽出してくるシステムの需要は非常に高い。分類
や検索を行うためには、オブジェクト同士の類似度を計
測する必要がある。このためには、オブジェクトごと
に、そのオブジェクトの特徴値を列挙した特徴ベクトル
を作成し、その特徴ベクトル同士の類似度を計算する方
法が提案されてきている。これは、文書であれば特定単
語の出現頻度分布や特定単語の後の属性値などを用い
て、その文書オブジェクトの特徴ベクトルを作成し、特
徴ベクトル同士の類似度を、相関係数やユークリッド距
離等々を用いて計算し、類似度の大きいものからグルー
プにまとめて分類したり、利用者が入力したオブジェク
トに類似した順に表示したりする方法である。映像オブ
ジェクトであれば、明るさや色彩、空間周波数などから
特徴ベクトルを作成する。また、音声や音楽などのオブ
ジェクトであれば、周波数分布などを特徴値とするベク
トルを作成する。いずれにしても、オブジェクトから、
そのオブジェクトを特徴付ける種々の特徴値を元とする
特徴ベクトルを作成して該オブジェクトを代表させ、特
徴ベクトル間の類似度から分類や検索を行うものであ
る。
された文書や映像、音声、音楽などのディジタル化され
たオブジェクトが大量に蓄積されてきている。この中か
ら、関心のある、あるいは必要とされるオブジェクトを
検索する必要性は、日に日に高まりつつあると言ってよ
い。利用者が何らかの方法で検索目標オブジェクトを入
力したら、そのオブジェクトと類似度の高いオブジェク
ト群を、蓄積された被検索オブジェクト群の中から、指
定個数抽出してくるシステムの需要は非常に高い。分類
や検索を行うためには、オブジェクト同士の類似度を計
測する必要がある。このためには、オブジェクトごと
に、そのオブジェクトの特徴値を列挙した特徴ベクトル
を作成し、その特徴ベクトル同士の類似度を計算する方
法が提案されてきている。これは、文書であれば特定単
語の出現頻度分布や特定単語の後の属性値などを用い
て、その文書オブジェクトの特徴ベクトルを作成し、特
徴ベクトル同士の類似度を、相関係数やユークリッド距
離等々を用いて計算し、類似度の大きいものからグルー
プにまとめて分類したり、利用者が入力したオブジェク
トに類似した順に表示したりする方法である。映像オブ
ジェクトであれば、明るさや色彩、空間周波数などから
特徴ベクトルを作成する。また、音声や音楽などのオブ
ジェクトであれば、周波数分布などを特徴値とするベク
トルを作成する。いずれにしても、オブジェクトから、
そのオブジェクトを特徴付ける種々の特徴値を元とする
特徴ベクトルを作成して該オブジェクトを代表させ、特
徴ベクトル間の類似度から分類や検索を行うものであ
る。
【0003】従来の類似オブジェクト検索としては、利
用者が入力した検索オブジェクトの特徴ベクトルと、被
検索オブジェクト群の各々の特徴ベクトルの類似度を全
て計算し、類似度の大きいものから指定個数表示すると
言うものであった。この手法では、検索のたびに全ての
被検索オブジェクトとの類似度計算を実行する必要があ
り、オブジェクト数が増えてくると検索時間がかかりす
ぎて実用に耐えない問題があった。前記類似オブジェク
ト検索の問題を解決するために、検索対象となるオブジ
ェクトを絞り込み、類似度の高い可能性の無いオブジェ
クトに関しては計算を省略することで、検索の高速化を
図る手法が提案されている。第一の提案(特開2000-109
89)においては、被検索オブジェクトの特徴ベクトルの
各元ごとに索引を予め作成しておく。入力された検索オ
ブジェクトの特徴ベクトルの各元の値の近傍値を取るオ
ブジェクトを、前記索引を用いて指定個数リストアップ
する。全ての元の近傍リストの和集合をとれば、類似オ
ブジェクトは必ずこの和集合に含まれるから、この和集
合にリストアップされたオブジェクトに対してのみ類似
度計算を行えば良い。第二の提案(特開2001-134573)に
おいては、被検索オブジェクトの特徴ベクトルの各元ご
とに、部分空間への分割を階層的に行い、特徴値を、特
徴値が含まれる部分空間を表すビット列に変換する。こ
のビット列を、第一の提案同様索引化しておく。検索ベ
クトルが与えられれば、各元の値に関して該当する部分
空間のビット列に変換した後、予め作成されている索引
を用いて近傍値を持つ被検索オブジェクトのリストを作
成する。各元ごとの近傍リストの和集合を求め、これら
に対してのみ類似度計算を実行する。いずれの提案にし
ても、大量に蓄積された被検索オブジェクトの特徴ベク
トルの各元の値について予め索引を作成しておき、検索
オブジェクトが与えられれば、各元の値の近傍値を取る
被検索オブジェクトのリストを、前記索引を利用して作
成し、各元ごとのリストの和集合を以って類似オブジェ
クトの候補とする。不要な類似度計算を省略することに
よって実用時間内での検索実行を可能としようとするも
のである。
用者が入力した検索オブジェクトの特徴ベクトルと、被
検索オブジェクト群の各々の特徴ベクトルの類似度を全
て計算し、類似度の大きいものから指定個数表示すると
言うものであった。この手法では、検索のたびに全ての
被検索オブジェクトとの類似度計算を実行する必要があ
り、オブジェクト数が増えてくると検索時間がかかりす
ぎて実用に耐えない問題があった。前記類似オブジェク
ト検索の問題を解決するために、検索対象となるオブジ
ェクトを絞り込み、類似度の高い可能性の無いオブジェ
クトに関しては計算を省略することで、検索の高速化を
図る手法が提案されている。第一の提案(特開2000-109
89)においては、被検索オブジェクトの特徴ベクトルの
各元ごとに索引を予め作成しておく。入力された検索オ
ブジェクトの特徴ベクトルの各元の値の近傍値を取るオ
ブジェクトを、前記索引を用いて指定個数リストアップ
する。全ての元の近傍リストの和集合をとれば、類似オ
ブジェクトは必ずこの和集合に含まれるから、この和集
合にリストアップされたオブジェクトに対してのみ類似
度計算を行えば良い。第二の提案(特開2001-134573)に
おいては、被検索オブジェクトの特徴ベクトルの各元ご
とに、部分空間への分割を階層的に行い、特徴値を、特
徴値が含まれる部分空間を表すビット列に変換する。こ
のビット列を、第一の提案同様索引化しておく。検索ベ
クトルが与えられれば、各元の値に関して該当する部分
空間のビット列に変換した後、予め作成されている索引
を用いて近傍値を持つ被検索オブジェクトのリストを作
成する。各元ごとの近傍リストの和集合を求め、これら
に対してのみ類似度計算を実行する。いずれの提案にし
ても、大量に蓄積された被検索オブジェクトの特徴ベク
トルの各元の値について予め索引を作成しておき、検索
オブジェクトが与えられれば、各元の値の近傍値を取る
被検索オブジェクトのリストを、前記索引を利用して作
成し、各元ごとのリストの和集合を以って類似オブジェ
クトの候補とする。不要な類似度計算を省略することに
よって実用時間内での検索実行を可能としようとするも
のである。
【0004】前記二提案については、以下の問題点があ
った。特徴ベクトルの各元について索引を形成する必要
があるため、元の数が増加すると、索引を作成するため
の計算時間、結果を格納するための記録領域が増加して
ゆく傾向があった。また、各元ごとに近傍リストを作成
してゆくため、元の数が増加すると、近傍リストの和集
合にリストアップされる被検索オブジェクトの数も増大
し、検索効率が低下する傾向があった。
った。特徴ベクトルの各元について索引を形成する必要
があるため、元の数が増加すると、索引を作成するため
の計算時間、結果を格納するための記録領域が増加して
ゆく傾向があった。また、各元ごとに近傍リストを作成
してゆくため、元の数が増加すると、近傍リストの和集
合にリストアップされる被検索オブジェクトの数も増大
し、検索効率が低下する傾向があった。
【0005】
【発明が解決しようとする課題】本発明は従来法の前記
の諸問題を解決するためになされたものであって、その
目的は、被検索オブジェクトの数や特徴ベクトルの元の
数が増加するにつれて必要とされる計算量や記録領域が
増大する問題を解決し、高速でコンパクトな類似オブジ
ェクトの分類、検索システムを提供することにある。
の諸問題を解決するためになされたものであって、その
目的は、被検索オブジェクトの数や特徴ベクトルの元の
数が増加するにつれて必要とされる計算量や記録領域が
増大する問題を解決し、高速でコンパクトな類似オブジ
ェクトの分類、検索システムを提供することにある。
【0006】
【課題を解決するための手段】前記目的を達成するため
の手段として本発明請求項1記載のオブジェクト分類検
索装置では、各種オブジェクトを入力するオブジェクト
入力手段と、入力されたオブジェクトを記録するオブジ
ェクト記録手段と、与えられた検索目標オブジェクトと
類似度の高いオブジェクトの部分集合を前記記録された
オブジェクトの中から抽出するオブジェクト検索手段に
よって構成されるオブジェクト分類検索装置において、
入力オブジェクトの多変量要素を特徴ベクトルに変換す
るベクトル変換手段と、変換された特徴ベクトルを記録
するベクトル記録手段と、特徴ベクトル間の類似度を計
算する類似度計算手段と、最も類似度の高い特徴ベクト
ルの部分集合を一つのクラスターとし、クラスターの内
部に含まれる特徴ベクトルの個数、クラスター代表ベク
トル生成手段により生成されたこのクラスターを代表す
る特徴ベクトル、クラスターを構成する特徴ベクトルリ
ストへのポインター、等の情報を生成記録するクラスタ
ー生成手段と、前記クラスター生成手段を用いて、特徴
ベクトルないしクラスター代表ベクトル間で順次クラス
ターを生成し、ツリー状の樹形図を生成する樹形図生成
手段と、検索目標オブジェクトや抽出するオブジェクト
の個数などの検索条件入力手段と、検索目標オブジェク
トを前記ベクトル変換手段によって特徴ベクトルに変換
し、高次のクラスターの直下にあるクラスター群の各ク
ラスター代表ベクトルとの類似度を前記類似度計算手段
により求め、類似度の高いクラスターを選択するクラス
ター選択手段と、前記クラスター選択を、より高次から
低次に実行し、検索条件を満足するまでクラスター検索
を繰り返すクラスター検索手段と、検索されたクラスタ
ー内の特徴ベクトルに対応するオブジェクトを表示する
抽出オブジェクト表示手段を備えている。
の手段として本発明請求項1記載のオブジェクト分類検
索装置では、各種オブジェクトを入力するオブジェクト
入力手段と、入力されたオブジェクトを記録するオブジ
ェクト記録手段と、与えられた検索目標オブジェクトと
類似度の高いオブジェクトの部分集合を前記記録された
オブジェクトの中から抽出するオブジェクト検索手段に
よって構成されるオブジェクト分類検索装置において、
入力オブジェクトの多変量要素を特徴ベクトルに変換す
るベクトル変換手段と、変換された特徴ベクトルを記録
するベクトル記録手段と、特徴ベクトル間の類似度を計
算する類似度計算手段と、最も類似度の高い特徴ベクト
ルの部分集合を一つのクラスターとし、クラスターの内
部に含まれる特徴ベクトルの個数、クラスター代表ベク
トル生成手段により生成されたこのクラスターを代表す
る特徴ベクトル、クラスターを構成する特徴ベクトルリ
ストへのポインター、等の情報を生成記録するクラスタ
ー生成手段と、前記クラスター生成手段を用いて、特徴
ベクトルないしクラスター代表ベクトル間で順次クラス
ターを生成し、ツリー状の樹形図を生成する樹形図生成
手段と、検索目標オブジェクトや抽出するオブジェクト
の個数などの検索条件入力手段と、検索目標オブジェク
トを前記ベクトル変換手段によって特徴ベクトルに変換
し、高次のクラスターの直下にあるクラスター群の各ク
ラスター代表ベクトルとの類似度を前記類似度計算手段
により求め、類似度の高いクラスターを選択するクラス
ター選択手段と、前記クラスター選択を、より高次から
低次に実行し、検索条件を満足するまでクラスター検索
を繰り返すクラスター検索手段と、検索されたクラスタ
ー内の特徴ベクトルに対応するオブジェクトを表示する
抽出オブジェクト表示手段を備えている。
【0007】請求項2記載のオブジェクト分類検索装置
では請求項1記載のクラスター生成手段において、クラ
スター内分布情報も生成記録する構成とした。
では請求項1記載のクラスター生成手段において、クラ
スター内分布情報も生成記録する構成とした。
【0008】請求項3記載のプログラムでは、請求項1
ないし2記載のオブジェクト分類検索装置を実行する機
能を備えている。
ないし2記載のオブジェクト分類検索装置を実行する機
能を備えている。
【0009】
【発明の実施の形態】オブジェクトの検索において、そ
の都度、全ての記録されたオブジェクトとの類似度を計
算していたのでは、時間がかかりすぎて到底実用になら
ない。予め記録されたオブジェクト間の類似度を計算
し、似たもの同士をまとめてクラスターとして代表的な
特徴ベクトルをクラスター代表ベクトルと定義しておけ
ば、少数の類似度を計算し比較するだけで、類似のオブ
ジェクトが存在する可能性の最も高いクラスターを選び
出すことができる。このようにすれば、これ以外のクラ
スター内のオブジェクト群は類似度計算の対象から省く
ことが出来る。この手順を高次のクラスターから順に低
次のクラスターに対して実行すれば、少数回の類似度計
算で、検索目標オブジェクトと類似度の高いオブジェク
トの部分集合を求めることができる。
の都度、全ての記録されたオブジェクトとの類似度を計
算していたのでは、時間がかかりすぎて到底実用になら
ない。予め記録されたオブジェクト間の類似度を計算
し、似たもの同士をまとめてクラスターとして代表的な
特徴ベクトルをクラスター代表ベクトルと定義しておけ
ば、少数の類似度を計算し比較するだけで、類似のオブ
ジェクトが存在する可能性の最も高いクラスターを選び
出すことができる。このようにすれば、これ以外のクラ
スター内のオブジェクト群は類似度計算の対象から省く
ことが出来る。この手順を高次のクラスターから順に低
次のクラスターに対して実行すれば、少数回の類似度計
算で、検索目標オブジェクトと類似度の高いオブジェク
トの部分集合を求めることができる。
【0010】従来のクラスター分析では、各特徴ベクト
ル同士の類似度の組み合わせを全て求め、最も類似度の
高い特徴ベクトル同士を一つのグループ(クラスター)
にまとめ、クラスター内に存在する特徴ベクトルの個
数、クラスター内の特徴ベクトルの分布指標、このクラ
スターを代表する新たな特徴ベクトルなどからなるクラ
スター情報を計算する。これを繰り返して一つずつクラ
スターをまとめてゆき、全てが一つのクラスターとなる
まで繰り返すものである。この経過は、図1に示すよう
に、樹状図と呼ばれ、似たもの同士がクラスターを形成
してゆく様子が表現され、各クラスターが分類のカテゴ
リーに相当する。このようにして、葉から枝、幹、根に
向かって、低次から高次に向かって特徴ベクトルの自動
分類が行われる。最下段の1−17が特徴ベクトルであ
り、樹状の分岐点に、クラスター情報が定義されている
ことになる。この従来のクラスター分析は、もっぱら分
類自体を目的としたものであり、得られた分類構造を用
いて検索に供するものではなかった。また、被検索オブ
ジェクトがn個あれば、全ての組み合わせについて類似
度計算が必要であるから、(n×n)に比例した類似度
計算量が必要となる。オブジェクト数が少ないうちは良
いが、数百万個単位のオブジェクト数を対象とした場
合、計算量が膨大となって、実用に耐えなくなる欠点が
あった。
ル同士の類似度の組み合わせを全て求め、最も類似度の
高い特徴ベクトル同士を一つのグループ(クラスター)
にまとめ、クラスター内に存在する特徴ベクトルの個
数、クラスター内の特徴ベクトルの分布指標、このクラ
スターを代表する新たな特徴ベクトルなどからなるクラ
スター情報を計算する。これを繰り返して一つずつクラ
スターをまとめてゆき、全てが一つのクラスターとなる
まで繰り返すものである。この経過は、図1に示すよう
に、樹状図と呼ばれ、似たもの同士がクラスターを形成
してゆく様子が表現され、各クラスターが分類のカテゴ
リーに相当する。このようにして、葉から枝、幹、根に
向かって、低次から高次に向かって特徴ベクトルの自動
分類が行われる。最下段の1−17が特徴ベクトルであ
り、樹状の分岐点に、クラスター情報が定義されている
ことになる。この従来のクラスター分析は、もっぱら分
類自体を目的としたものであり、得られた分類構造を用
いて検索に供するものではなかった。また、被検索オブ
ジェクトがn個あれば、全ての組み合わせについて類似
度計算が必要であるから、(n×n)に比例した類似度
計算量が必要となる。オブジェクト数が少ないうちは良
いが、数百万個単位のオブジェクト数を対象とした場
合、計算量が膨大となって、実用に耐えなくなる欠点が
あった。
【0011】これに対して、図2に示すように、根から
幹、枝、葉というように、高次から低次方向にクラスタ
ーを構成してゆく方法もある。図2に(イ)示すよう
に、登録オブジェクト1と入力オブジェクト2がある場
合に、これらは無条件に同一分類とされる。また、
(ロ)に示すように、登録オブジェクト1があると、入
力オブジェクト2は無条件に同一分類となる。次に、入
力オブジェクト3が入ってきた場合に、登録オブジェク
ト1とは類似しないため、オブジェクト2の方向へ分岐
してオブジェクト2と並列した状態で分類される。
(ハ)はオブジェクト1の別分岐としてオブジェクト2
が分類され、さらにオブジェクト2の別分岐としてオブ
ジェクト3とオブジェクト4が分類されている。この方
法を用いれば、後述するように、途中まで出来ている樹
状図を利用して追加分の特徴ベクトルの配置先を検索で
きるため、図1の方法に比較して遥かに少ない類似度計
算しか要しない利点がある。図1、図2の何れの方法を
用いるにせよ、樹状図の葉の部分に特徴値ベクトルがあ
り、途中の分岐点にクラスター情報が格納されていれば
良い。このようにして、記録された特徴ベクトルが予め
分類されていれば、新に検索目標オブジェクトが与えら
れても、クラスター情報を用いて、極めて少数回の類似
度計算を行うだけで、目的とする類似オブジェクトの部
分集合を得ることができる。
幹、枝、葉というように、高次から低次方向にクラスタ
ーを構成してゆく方法もある。図2に(イ)示すよう
に、登録オブジェクト1と入力オブジェクト2がある場
合に、これらは無条件に同一分類とされる。また、
(ロ)に示すように、登録オブジェクト1があると、入
力オブジェクト2は無条件に同一分類となる。次に、入
力オブジェクト3が入ってきた場合に、登録オブジェク
ト1とは類似しないため、オブジェクト2の方向へ分岐
してオブジェクト2と並列した状態で分類される。
(ハ)はオブジェクト1の別分岐としてオブジェクト2
が分類され、さらにオブジェクト2の別分岐としてオブ
ジェクト3とオブジェクト4が分類されている。この方
法を用いれば、後述するように、途中まで出来ている樹
状図を利用して追加分の特徴ベクトルの配置先を検索で
きるため、図1の方法に比較して遥かに少ない類似度計
算しか要しない利点がある。図1、図2の何れの方法を
用いるにせよ、樹状図の葉の部分に特徴値ベクトルがあ
り、途中の分岐点にクラスター情報が格納されていれば
良い。このようにして、記録された特徴ベクトルが予め
分類されていれば、新に検索目標オブジェクトが与えら
れても、クラスター情報を用いて、極めて少数回の類似
度計算を行うだけで、目的とする類似オブジェクトの部
分集合を得ることができる。
【0012】以下、図面に基づいて本発明の実施の形態
を説明する。図3はデータ分類装置のハードウェア構成
を示すブロック図である。入力装置はキーボード、マウ
ス、タブレット、タッチパネル、スキャナー、ビデオカ
メラ、カメラ等であり、この入力装置により、文字列デ
ータ、画像データの入力が行なわれる。その他、音声入
力装置を備え、音声データ等の入力も可能となってい
る。表示装置はCRTや液晶ディスプレイ、スピーカ等
であり、この表示装置により入力データ情報、検索結果
の表示がなされる。制御装置はCPUであり、装置全体
の制御を行なう。メモリ装置はROM、RAM等であ
り、制御装置が各種制御や処理を実行するために必要な
プログラムを格納するプログラム部と処理の際に必要な
データを格納するバッファ部を有している。CPUの制
御を行なうメモリ装置にはベクトル入力手段、オブジェ
クト記録手段、ベクトル変換手段、ベクトル記録手段、
類似度計算手段、クラスター生成手段、樹形図生成手
段、検索条件入力手段、クラスター選択手段、クラスタ
ー検索手段、抽出オブジェクト表示手段を実行するプロ
グラムが格納されている。外部記憶装置はハードディス
ク、光磁気ディスク、フラッシュメモリ等であり、膨大
なデータオブジェクトが格納されている。また、通信装
置はネットワークアダプターボードとも呼ばれ、LAN
に接続されている。LAN内には、同様のコンピュータ
や大容量のデータを記録するサーバーが接続されてい
る。クライアントPCによりサーバーにデータ検索など
の要求を送信し、サーバーはデータベースの検索を行な
い、結果をクライアントPCに返信する。サーバーは必
要に応じて、インターネットを介して必要な情報の収
集、処理を行なう。
を説明する。図3はデータ分類装置のハードウェア構成
を示すブロック図である。入力装置はキーボード、マウ
ス、タブレット、タッチパネル、スキャナー、ビデオカ
メラ、カメラ等であり、この入力装置により、文字列デ
ータ、画像データの入力が行なわれる。その他、音声入
力装置を備え、音声データ等の入力も可能となってい
る。表示装置はCRTや液晶ディスプレイ、スピーカ等
であり、この表示装置により入力データ情報、検索結果
の表示がなされる。制御装置はCPUであり、装置全体
の制御を行なう。メモリ装置はROM、RAM等であ
り、制御装置が各種制御や処理を実行するために必要な
プログラムを格納するプログラム部と処理の際に必要な
データを格納するバッファ部を有している。CPUの制
御を行なうメモリ装置にはベクトル入力手段、オブジェ
クト記録手段、ベクトル変換手段、ベクトル記録手段、
類似度計算手段、クラスター生成手段、樹形図生成手
段、検索条件入力手段、クラスター選択手段、クラスタ
ー検索手段、抽出オブジェクト表示手段を実行するプロ
グラムが格納されている。外部記憶装置はハードディス
ク、光磁気ディスク、フラッシュメモリ等であり、膨大
なデータオブジェクトが格納されている。また、通信装
置はネットワークアダプターボードとも呼ばれ、LAN
に接続されている。LAN内には、同様のコンピュータ
や大容量のデータを記録するサーバーが接続されてい
る。クライアントPCによりサーバーにデータ検索など
の要求を送信し、サーバーはデータベースの検索を行な
い、結果をクライアントPCに返信する。サーバーは必
要に応じて、インターネットを介して必要な情報の収
集、処理を行なう。
【0013】図4は、第1の樹形図の作成手順を示すフ
ローチャートである。オブジェクト入力手段によってオ
ブジェクトが入力されると(S1)、ベクトル変換手段
によって各オブジェクトは特徴ベクトルに変換され(S
2)、ベクトル記録手段によって特徴ベクトルリストが
作成される(S3,S4)。類似度計算手段を用いて、
特徴ベクトルの全ての組合わせについて類似度を計算
し、類似度行列を求める(S5)。前記特徴ベクトルリ
ストは図5のa,b,c,d・・・nで示されるベクト
ルであり、これらのベクトルを縦軸と横軸に列記してそ
れぞれの類似度を計算したものが類似度行列(図5)で
ある。図5では全てのベクトル同士の類似度が計算され
てそれぞれ交差する所に類似度(数値)が記入される。
尚、同ベクトルはそれぞれ完全一致し、対角線で折り曲
げると左右は対象の数値となる。同値のベクトルがあれ
ば、そのなかで特徴ベクトル番号の最小のものを残し、
他は同値リストに登録し(S6)、以下の処理から除外
する。最も類似度の高い特徴ベクトルの組合わせを求め
(S7)、同一のクラスターとする。末端の最下層のク
ラスターは2個の特徴ベクトルを含み、2つの下位クラ
スターが集約されて1つの上位クラスターとなる。
ローチャートである。オブジェクト入力手段によってオ
ブジェクトが入力されると(S1)、ベクトル変換手段
によって各オブジェクトは特徴ベクトルに変換され(S
2)、ベクトル記録手段によって特徴ベクトルリストが
作成される(S3,S4)。類似度計算手段を用いて、
特徴ベクトルの全ての組合わせについて類似度を計算
し、類似度行列を求める(S5)。前記特徴ベクトルリ
ストは図5のa,b,c,d・・・nで示されるベクト
ルであり、これらのベクトルを縦軸と横軸に列記してそ
れぞれの類似度を計算したものが類似度行列(図5)で
ある。図5では全てのベクトル同士の類似度が計算され
てそれぞれ交差する所に類似度(数値)が記入される。
尚、同ベクトルはそれぞれ完全一致し、対角線で折り曲
げると左右は対象の数値となる。同値のベクトルがあれ
ば、そのなかで特徴ベクトル番号の最小のものを残し、
他は同値リストに登録し(S6)、以下の処理から除外
する。最も類似度の高い特徴ベクトルの組合わせを求め
(S7)、同一のクラスターとする。末端の最下層のク
ラスターは2個の特徴ベクトルを含み、2つの下位クラ
スターが集約されて1つの上位クラスターとなる。
【0014】以下のクラスター情報を計算し、記録する
(S8)。(1)クラスター内の特徴ベクトルの個数。
同値があれば、その分加算する。(2)クラスター代表
ベクトル生成手段を用いて、クラスター内の全ての特徴
ベクトルを代表する特徴ベクトルを計算する。ここで
は、特徴ベクトルの諸元の平均値を用いている。必要に
応じて(3)クラスター内の特徴ベクトルの分布情報、
ここでは分散を計算する。クラスターを構成する特徴ベ
クトルリストへのポインターを作成する。このポインタ
ーはリスト中で何処に位置するか、何番目に位置するか
を示す指標である。クラスター内に取り込まれた特徴ベ
クトルは、クラスター代表ベクトルに置き換え、以下の
処理からはずす(S9)クラスター代表ベクトルと、他
の特徴ベクトルの間の類似度を計算し、類似度行列を再
構成する(クラスター生成手段)(S11)。前記クラ
スター生成手段を繰返し用いて、順次高次のクラスター
を生成する。この過程で、ツリー状の樹形図が作成され
ることになる(樹形図生成手段)。残った特徴ベクトル
が一つになったら分類処理を終了する(S10)。ここ
では頂点から2方向に分岐して上位クラスターに連続
し、さらに上位のクラスターから2方向に分岐して下位
のクラスターに連続した図1に示すような樹形図が作成
される。
(S8)。(1)クラスター内の特徴ベクトルの個数。
同値があれば、その分加算する。(2)クラスター代表
ベクトル生成手段を用いて、クラスター内の全ての特徴
ベクトルを代表する特徴ベクトルを計算する。ここで
は、特徴ベクトルの諸元の平均値を用いている。必要に
応じて(3)クラスター内の特徴ベクトルの分布情報、
ここでは分散を計算する。クラスターを構成する特徴ベ
クトルリストへのポインターを作成する。このポインタ
ーはリスト中で何処に位置するか、何番目に位置するか
を示す指標である。クラスター内に取り込まれた特徴ベ
クトルは、クラスター代表ベクトルに置き換え、以下の
処理からはずす(S9)クラスター代表ベクトルと、他
の特徴ベクトルの間の類似度を計算し、類似度行列を再
構成する(クラスター生成手段)(S11)。前記クラ
スター生成手段を繰返し用いて、順次高次のクラスター
を生成する。この過程で、ツリー状の樹形図が作成され
ることになる(樹形図生成手段)。残った特徴ベクトル
が一つになったら分類処理を終了する(S10)。ここ
では頂点から2方向に分岐して上位クラスターに連続
し、さらに上位のクラスターから2方向に分岐して下位
のクラスターに連続した図1に示すような樹形図が作成
される。
【0015】図6を用いて第2の樹形図を作成する手順
を説明する。この方法は前記図2において説明した方法
と同様の手順によるものである。前記第1の手順は特徴
ベクトルの全てについて類似度を比較して下層から樹形
図を作成したが、第2の方法は上層から順次、樹形図を
作成する方法である。各オブジェクトの入力、特徴ベク
トルへの変換、記録までは第1の分類装置と同様である
(S1〜S4)。先ず2個の特徴ベクトルを取り出し
(S20)、根クラスターとする。クラスター生成手段
によって、根クラスター内のクラスター情報である、オ
ブジェクト個数(現在は2)、クラスター代表ベクト
ル、必要に応じクラスター内分布情報を計算し、記録す
る(S21)。次の特徴ベクトルを取り出す(S2
2)。根クラスターの有するポインターをたどり(S2
3)、二つのポインターの指す特徴ベクトルを求める。
両ベクトルと次の特徴ベクトル間の類似度を、類似度計
算手段によって求め、より類似度の高い特徴ベクトルを
選択し、この特徴ベクトルと同じクラスターに所属させ
ることとなる(S24)。選ばれた特徴ベクトルが葉で
あれば新クラスターを形成し(S25、S26)、クラ
スターであれば、クラスター内のオブジェクト数に1を
加え、既存のクラスター代表ベクトルと追加ベクトルか
ら新クラスター代表ベクトルを計算し、また、必要に応
じクラスター内の分布情報を更新する(S28)。この
手順を、葉クラスターに至るまで繰り返す(S25,S
28)。
を説明する。この方法は前記図2において説明した方法
と同様の手順によるものである。前記第1の手順は特徴
ベクトルの全てについて類似度を比較して下層から樹形
図を作成したが、第2の方法は上層から順次、樹形図を
作成する方法である。各オブジェクトの入力、特徴ベク
トルへの変換、記録までは第1の分類装置と同様である
(S1〜S4)。先ず2個の特徴ベクトルを取り出し
(S20)、根クラスターとする。クラスター生成手段
によって、根クラスター内のクラスター情報である、オ
ブジェクト個数(現在は2)、クラスター代表ベクト
ル、必要に応じクラスター内分布情報を計算し、記録す
る(S21)。次の特徴ベクトルを取り出す(S2
2)。根クラスターの有するポインターをたどり(S2
3)、二つのポインターの指す特徴ベクトルを求める。
両ベクトルと次の特徴ベクトル間の類似度を、類似度計
算手段によって求め、より類似度の高い特徴ベクトルを
選択し、この特徴ベクトルと同じクラスターに所属させ
ることとなる(S24)。選ばれた特徴ベクトルが葉で
あれば新クラスターを形成し(S25、S26)、クラ
スターであれば、クラスター内のオブジェクト数に1を
加え、既存のクラスター代表ベクトルと追加ベクトルか
ら新クラスター代表ベクトルを計算し、また、必要に応
じクラスター内の分布情報を更新する(S28)。この
手順を、葉クラスターに至るまで繰り返す(S25,S
28)。
【0016】以上の操作を、特徴ベクトル全てについて
繰り返す。これによって第1の分類装置と同様の樹形図
が出来上がる。樹形図の各分岐点には分岐点以下のオブ
ジェクトの個数、分岐点特有の特徴ベクトル(代表ベク
トル)等の情報が格納されている。第2の樹形図の作成
方法では、それまでの分類を手がかりにして追加特徴ベ
クトルの所属クラスターを探索してゆくため、類似度の
比較回数は(n×log(n))のオーダーで済み、大幅な
効率化となる。
繰り返す。これによって第1の分類装置と同様の樹形図
が出来上がる。樹形図の各分岐点には分岐点以下のオブ
ジェクトの個数、分岐点特有の特徴ベクトル(代表ベク
トル)等の情報が格納されている。第2の樹形図の作成
方法では、それまでの分類を手がかりにして追加特徴ベ
クトルの所属クラスターを探索してゆくため、類似度の
比較回数は(n×log(n))のオーダーで済み、大幅な
効率化となる。
【0017】ついで、図7を用いて検索手順の動作を述
べる。前記段落(0009)〜(0016)によって樹
形図が作成された後は、樹形図を基に次の手順によって
検索を行なう。まず、樹系図上層の頂点において、検索
対象の特徴ベクトルと登録オブジェクトの特徴ベクトル
の比較を行なう。ここでは、大分類の比較が行なわれ、
大きく絞り込みが行なわれる。検索手段は樹形図の各分
岐点において、左右のどちらに分かれるか演算を行な
う。各分岐点において類似度計算手段により、左右どち
らに類似するかを演算する。または、集合それぞれの代
表ベクトルとの比較を行ない、どちらの代表ベクトルに
近いか演算を行なう。演算の結果、類似する集合の分岐
線の方へ進み、非類似の樹系図の枝は検索の対象から外
す。以下、分岐点において類似する方向を進みながら絞
り込みを行なう。
べる。前記段落(0009)〜(0016)によって樹
形図が作成された後は、樹形図を基に次の手順によって
検索を行なう。まず、樹系図上層の頂点において、検索
対象の特徴ベクトルと登録オブジェクトの特徴ベクトル
の比較を行なう。ここでは、大分類の比較が行なわれ、
大きく絞り込みが行なわれる。検索手段は樹形図の各分
岐点において、左右のどちらに分かれるか演算を行な
う。各分岐点において類似度計算手段により、左右どち
らに類似するかを演算する。または、集合それぞれの代
表ベクトルとの比較を行ない、どちらの代表ベクトルに
近いか演算を行なう。演算の結果、類似する集合の分岐
線の方へ進み、非類似の樹系図の枝は検索の対象から外
す。以下、分岐点において類似する方向を進みながら絞
り込みを行なう。
【0018】フローチャートに基づいて説明すると、検
索条件入力手段によって、検索の際の目標となるオブジ
ェクト(検索目標オブジェクト)、類似オブジェクトを
何個まで検索するか(検索個数)などの検索条件を入力
する(S30)。入力された検索目標オブジェクトは、
分類の際と同様のベクトル変換手段によって特徴ベクト
ル(検索目標ベクトル)に変換する(S31)。樹形図
の最高次である根のクラスターから検索を開始する(S
32)。クラスター情報を参照する。次クラスターのク
ラスター代表ベクトルへのポインターを用い(S3
3)、各々のクラスター代表ベクトルを参照し、類似度
計算手段によって検索目標ベクトルとの類似度を計算す
る。より類似度の高い方のクラスターを選択する(クラ
スター選択手段)(S34)。このクラスター内のオブ
ジェクトの個数が検索個数以下なら検索終了であり、ま
だ検索個数より大きければ、選択されたクラスターに移
動して同様の操作を繰り返す(クラスター検索手段)
(S35)。得られたクラスター内の特徴ベクトルに対
応するオブジェクト群が、求める類似オブジェクトの部
分集合である。必要に応じ、検索目標ベクトルとクラス
ター内特徴ベクトル群との類似度計算を行い、類似度の
高い順に対応するオブジェクトのリストを表示する(抽
出オブジェクト表示手段)(S36,S37,S3
8)。検索において、例では択一方式でクラスターを選
択したが、クラスター内の特徴ベクトルの分布には重な
り合いがあるため、一部類似度の高い特徴ベクトルが切
り捨てられる危険性がある。このリスクを最小とする必
要がある場合は、分散から標準偏差を求め、予め指定さ
れた倍数以上に特徴ベクトルが離れるまではクラスター
を切り捨てずに検索を進めるといった方法で、廃棄リス
クを制御する。
索条件入力手段によって、検索の際の目標となるオブジ
ェクト(検索目標オブジェクト)、類似オブジェクトを
何個まで検索するか(検索個数)などの検索条件を入力
する(S30)。入力された検索目標オブジェクトは、
分類の際と同様のベクトル変換手段によって特徴ベクト
ル(検索目標ベクトル)に変換する(S31)。樹形図
の最高次である根のクラスターから検索を開始する(S
32)。クラスター情報を参照する。次クラスターのク
ラスター代表ベクトルへのポインターを用い(S3
3)、各々のクラスター代表ベクトルを参照し、類似度
計算手段によって検索目標ベクトルとの類似度を計算す
る。より類似度の高い方のクラスターを選択する(クラ
スター選択手段)(S34)。このクラスター内のオブ
ジェクトの個数が検索個数以下なら検索終了であり、ま
だ検索個数より大きければ、選択されたクラスターに移
動して同様の操作を繰り返す(クラスター検索手段)
(S35)。得られたクラスター内の特徴ベクトルに対
応するオブジェクト群が、求める類似オブジェクトの部
分集合である。必要に応じ、検索目標ベクトルとクラス
ター内特徴ベクトル群との類似度計算を行い、類似度の
高い順に対応するオブジェクトのリストを表示する(抽
出オブジェクト表示手段)(S36,S37,S3
8)。検索において、例では択一方式でクラスターを選
択したが、クラスター内の特徴ベクトルの分布には重な
り合いがあるため、一部類似度の高い特徴ベクトルが切
り捨てられる危険性がある。このリスクを最小とする必
要がある場合は、分散から標準偏差を求め、予め指定さ
れた倍数以上に特徴ベクトルが離れるまではクラスター
を切り捨てずに検索を進めるといった方法で、廃棄リス
クを制御する。
【0019】以上、図を用いて本発明を説明してきた
が、実施例に限定されるものでなく、発明の要旨を逸脱
しない範囲の設計変更等があっても本発明に含まれる。
ベクトル同士の類似度を計算する方法としてはベクトル
の余弦の相関関係を求める方法の他、ユークリッド距
離、マハラノビスの距離、主成分得点の差を用いる方法
などがある。要は、二つのベクトルの類似に対応する指
標が得られればよい。本発明では、類似度を用いたが、
逆に相違度を用いても良い。この場合は、特徴ベクトル
間の距離などが相当するが、数値が大きいほど似ていな
いことになる。目的応じて使い分ければ良い。クラスタ
ー代表ベクトルは、クラスター内に含まれる特徴ベクト
ルの各元の平均値からなるベクトルとしたが、重み付平
均、中央値、最頻値などを用いても良い。要は、そのク
ラスターを特徴付けるベクトルであれば良い。クラスタ
ー内の分布情報として、クラスター内分散、即ち各ベク
トルと代表ベクトルの各元における差の分散を用いた
が、最大直径、即ちクラスター内で最も類似度の低い特
徴ベクトル間の類似度、最大半径、即ちクラスター内特
徴ベクトルを内包する半径などを用いても良い。例では
クラスターの分岐は2の例をあげたが、目的に応じて3
以上の分岐を許しても良い。例では、クラスター内の特
徴ベクトル数が2を越えたときに新クラスターを生成し
たが、前記クラスター内分布情報で、バラツキが予め設
定された限度を越えたときに強制的に別クラスターを生
成しても良い。例えば、例外的な特徴ベクトルが入って
きた時などが該当する。例では、選択されたクラスター
内のオブジェクト個数が検索目標個数以下となったとこ
ろで検索終了としたが、ここで一つ前の段階のクラスタ
ーに戻して検索終了とし、このクラスター内の特徴ベク
トルに対して検索目標ベクトルとの類似度を計算、ソー
トを行い、上位から検索目標個数分を選択しても良い。
が、実施例に限定されるものでなく、発明の要旨を逸脱
しない範囲の設計変更等があっても本発明に含まれる。
ベクトル同士の類似度を計算する方法としてはベクトル
の余弦の相関関係を求める方法の他、ユークリッド距
離、マハラノビスの距離、主成分得点の差を用いる方法
などがある。要は、二つのベクトルの類似に対応する指
標が得られればよい。本発明では、類似度を用いたが、
逆に相違度を用いても良い。この場合は、特徴ベクトル
間の距離などが相当するが、数値が大きいほど似ていな
いことになる。目的応じて使い分ければ良い。クラスタ
ー代表ベクトルは、クラスター内に含まれる特徴ベクト
ルの各元の平均値からなるベクトルとしたが、重み付平
均、中央値、最頻値などを用いても良い。要は、そのク
ラスターを特徴付けるベクトルであれば良い。クラスタ
ー内の分布情報として、クラスター内分散、即ち各ベク
トルと代表ベクトルの各元における差の分散を用いた
が、最大直径、即ちクラスター内で最も類似度の低い特
徴ベクトル間の類似度、最大半径、即ちクラスター内特
徴ベクトルを内包する半径などを用いても良い。例では
クラスターの分岐は2の例をあげたが、目的に応じて3
以上の分岐を許しても良い。例では、クラスター内の特
徴ベクトル数が2を越えたときに新クラスターを生成し
たが、前記クラスター内分布情報で、バラツキが予め設
定された限度を越えたときに強制的に別クラスターを生
成しても良い。例えば、例外的な特徴ベクトルが入って
きた時などが該当する。例では、選択されたクラスター
内のオブジェクト個数が検索目標個数以下となったとこ
ろで検索終了としたが、ここで一つ前の段階のクラスタ
ーに戻して検索終了とし、このクラスター内の特徴ベク
トルに対して検索目標ベクトルとの類似度を計算、ソー
トを行い、上位から検索目標個数分を選択しても良い。
【0020】
【発明の効果】以上説明してきたように、請求項1記載
のオブジェクト分類検索装置においては、オブジェクト
のベクトルを作成し、ベクトル同士の比較によって樹形
図に分類するので、系統的に効率良く分類される。ま
た、樹形図の上層から検索を行なうので、オブジェクト
の取捨選択が効率良く行なわれ、検索時間が短縮され
る。請求項2記載のオブジェクト分類検索装置において
は、分布情報を用いて切り捨てるクラスター内に類似度
の高い特徴ベクトルが含まれるリスクが計算できるの
で、このリスクを最小とする必要がある場合は、分散か
ら標準偏差を求め、予め指定された倍数以上に特徴ベク
トルが離れるまではクラスターを切り捨てずに検索を進
めることができる。請求項3記載のオブジェクト分類検
索装置を実行するためのプログラムでは、このプログラ
ムを実行させて上記のような効率良い検索を行なうこと
ができる。
のオブジェクト分類検索装置においては、オブジェクト
のベクトルを作成し、ベクトル同士の比較によって樹形
図に分類するので、系統的に効率良く分類される。ま
た、樹形図の上層から検索を行なうので、オブジェクト
の取捨選択が効率良く行なわれ、検索時間が短縮され
る。請求項2記載のオブジェクト分類検索装置において
は、分布情報を用いて切り捨てるクラスター内に類似度
の高い特徴ベクトルが含まれるリスクが計算できるの
で、このリスクを最小とする必要がある場合は、分散か
ら標準偏差を求め、予め指定された倍数以上に特徴ベク
トルが離れるまではクラスターを切り捨てずに検索を進
めることができる。請求項3記載のオブジェクト分類検
索装置を実行するためのプログラムでは、このプログラ
ムを実行させて上記のような効率良い検索を行なうこと
ができる。
【図1】クラスター分類を葉から根に向かって行った樹
形図である。
形図である。
【図2】クラスター分類を根から葉に向かって行った樹
形図である。
形図である。
【図3】オブジェクト分類検索装置のハードウェア構成
を示すブロック図である。
を示すブロック図である。
【図4】第1の樹形図の作成手順を示すフローチャート
である。
である。
【図5】類似度行列の説明図である。
【図6】第2の樹形図の作成手順を示すフローチャート
である。
である。
【図7】検索手順を示すフローチャートである。
フロントページの続き
Fターム(参考) 5B050 BA10 CA07 EA04 EA18 FA02
GA08
5B075 ND35 NK06 NK39 NR12 NS10
PP02 PP03 PP04 PP23 PQ02
UU38
5L096 FA74 JA03 JA11 JA28 KA09
MA07
Claims (3)
- 【請求項1】 各種オブジェクトを入力するオブジェク
ト入力手段と、入力されたオブジェクトを記録するオブ
ジェクト記録手段と、与えられた検索目標オブジェクト
と類似度の高いオブジェクトの部分集合を前記記録され
たオブジェクトの中から抽出するオブジェクト検索手段
によって構成されるオブジェクト分類検索装置におい
て、 入力オブジェクトの多変量要素を特徴ベクトルに変換す
るベクトル変換手段と、 変換された特徴ベクトルを記録するベクトル記録手段
と、 特徴ベクトル間の類似度を計算する類似度計算手段と、 最も類似度の高い特徴ベクトルの部分集合を一つのクラ
スターとし、クラスターの内部に含まれる特徴ベクトル
の個数、クラスター代表ベクトル生成手段により生成さ
れたこのクラスターを代表する特徴ベクトル、クラスタ
ーを構成する特徴ベクトルリストへのポインター、等の
情報を生成記録するクラスター生成手段と、 前記クラスター生成手段を用いて、特徴ベクトルないし
クラスター代表ベクトル間で順次クラスターを生成し、
ツリー状の樹形図を生成する樹形図生成手段と、 検索目標オブジェクトや抽出するオブジェクトの個数な
どの検索条件入力手段と、 検索目標オブジェクトを前記ベクトル変換手段によって
特徴ベクトルに変換し、高次のクラスターの直下にある
クラスター群の各クラスター代表ベクトルとの類似度を
前記類似度計算手段により求め、類似度の高いクラスタ
ーを選択するクラスター選択手段と、 前記クラスター選択を、より高次から低次に実行し、検
索条件を満足するまでクラスター検索を繰り返すクラス
ター検索手段と、 検索されたクラスター内の特徴ベクトルに対応するオブ
ジェクトを表示する抽出オブジェクト表示手段を備えた
ことを特徴とするオブジェクト分類検索装置。 - 【請求項2】 前記クラスター生成手段において、クラ
スター内分布情報も生成記録することを特徴とする請求
項1記載のオブジェクト分類検索装置。 - 【請求項3】 請求項1ないし2記載のオブジェクト分
類検索装置を実行するためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002119730A JP2003316819A (ja) | 2002-04-22 | 2002-04-22 | オブジェクト分類検索装置及びそれを実行するためのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002119730A JP2003316819A (ja) | 2002-04-22 | 2002-04-22 | オブジェクト分類検索装置及びそれを実行するためのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003316819A true JP2003316819A (ja) | 2003-11-07 |
Family
ID=29536204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002119730A Pending JP2003316819A (ja) | 2002-04-22 | 2002-04-22 | オブジェクト分類検索装置及びそれを実行するためのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003316819A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007052698A (ja) * | 2005-08-19 | 2007-03-01 | Kddi Corp | 暗号化された文書のためのインデックス生成および検索方法ならびに暗号化文書検索システム |
JP2007172616A (ja) * | 2005-12-19 | 2007-07-05 | Ricoh Co Ltd | 文書検索方法及び装置 |
JP2007334402A (ja) * | 2006-06-12 | 2007-12-27 | Hitachi Ltd | クラスタリングされたベクトルデータを検索するサーバ、システム及び方法 |
WO2009110671A1 (en) * | 2008-03-03 | 2009-09-11 | Samsung Electronics Co., Ltd. | Apparatus for storing and processing contents and method of transmitting object meta information on contents using media transfer protocol from the apparatus |
JP2009294855A (ja) * | 2008-06-04 | 2009-12-17 | Hitachi Ltd | 類似データ検索システム |
KR101043523B1 (ko) | 2004-04-15 | 2011-06-23 | 마이크로소프트 코포레이션 | 검색어 제안을 위한 다중 유형 데이터 오브젝트들의 강화된클러스터링 |
JP2012137908A (ja) * | 2010-12-27 | 2012-07-19 | Yahoo Japan Corp | クラスタリング装置及びクラスタリング方法 |
CN107004025A (zh) * | 2015-03-13 | 2017-08-01 | 株式会社日立制作所 | 图像检索装置及检索图像的方法 |
JP2023013869A (ja) * | 2021-07-16 | 2023-01-26 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254905A (ja) * | 1997-03-06 | 1998-09-25 | Kokusai Denshin Denwa Co Ltd <Kdd> | 情報検索装置 |
-
2002
- 2002-04-22 JP JP2002119730A patent/JP2003316819A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254905A (ja) * | 1997-03-06 | 1998-09-25 | Kokusai Denshin Denwa Co Ltd <Kdd> | 情報検索装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101043523B1 (ko) | 2004-04-15 | 2011-06-23 | 마이크로소프트 코포레이션 | 검색어 제안을 위한 다중 유형 데이터 오브젝트들의 강화된클러스터링 |
JP2007052698A (ja) * | 2005-08-19 | 2007-03-01 | Kddi Corp | 暗号化された文書のためのインデックス生成および検索方法ならびに暗号化文書検索システム |
JP4722620B2 (ja) * | 2005-08-19 | 2011-07-13 | Kddi株式会社 | 暗号化文書検索方法および暗号化文書検索システム |
JP2007172616A (ja) * | 2005-12-19 | 2007-07-05 | Ricoh Co Ltd | 文書検索方法及び装置 |
JP2007334402A (ja) * | 2006-06-12 | 2007-12-27 | Hitachi Ltd | クラスタリングされたベクトルデータを検索するサーバ、システム及び方法 |
WO2009110671A1 (en) * | 2008-03-03 | 2009-09-11 | Samsung Electronics Co., Ltd. | Apparatus for storing and processing contents and method of transmitting object meta information on contents using media transfer protocol from the apparatus |
JP2009294855A (ja) * | 2008-06-04 | 2009-12-17 | Hitachi Ltd | 類似データ検索システム |
JP2012137908A (ja) * | 2010-12-27 | 2012-07-19 | Yahoo Japan Corp | クラスタリング装置及びクラスタリング方法 |
CN107004025A (zh) * | 2015-03-13 | 2017-08-01 | 株式会社日立制作所 | 图像检索装置及检索图像的方法 |
CN107004025B (zh) * | 2015-03-13 | 2020-07-14 | 株式会社日立制作所 | 图像检索装置及检索图像的方法 |
JP2023013869A (ja) * | 2021-07-16 | 2023-01-26 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
JP7469262B2 (ja) | 2021-07-16 | 2024-04-16 | Lineヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3347088B2 (ja) | 関連情報検索方法およびシステム | |
JP4569955B2 (ja) | 情報格納及び検索方法 | |
JP2005122295A (ja) | 関係図作成プログラム、関係図作成方法、および関係図作成装置 | |
CN105005578A (zh) | 多媒体目标信息可视化分析系统 | |
JP5594145B2 (ja) | 検索装置、検索方法、及びプログラム | |
JPWO2010053160A1 (ja) | コンテンツ検索装置およびコンテンツ検索プログラム | |
KR20090077073A (ko) | 퍼스널 음악 추천 매핑 | |
JP4173246B2 (ja) | 類似画像表示方法及び類似画像表示処理プログラムを格納した記録媒体 | |
JP4374902B2 (ja) | 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム | |
JPWO2011004529A1 (ja) | 分類階層再作成システム、分類階層再作成方法及び分類階層再作成プログラム | |
JP3204154B2 (ja) | 時系列データ解析装置 | |
JP2005011042A (ja) | データ検索方法、データ検索装置、データ検索プログラムおよびコンピュータで読み取り可能な記録媒体 | |
JP2003316819A (ja) | オブジェクト分類検索装置及びそれを実行するためのプログラム | |
US20070233733A1 (en) | Fast generalized 2-Dimensional heap for hausdorff and earth mover's distance | |
KR100706389B1 (ko) | 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치 | |
Ren et al. | Motion data retrieval from very large motion databases | |
Ramzan et al. | A comprehensive review on Data Stream Mining techniques for data classification; and future trends | |
CN118069791B (zh) | 一种电子档案智能检索方法及系统 | |
JP4305836B2 (ja) | コンテンツ検索表示装置およびコンテンツ検索表示方法 | |
JP5061147B2 (ja) | 画像検索装置 | |
KR100340036B1 (ko) | 사용자 프로파일을 이용한 상품정보 필터링 장치 및 방법 | |
JPH0934909A (ja) | 情報検索装置 | |
JP5265610B2 (ja) | 関連語抽出装置 | |
JP2004206571A (ja) | 文書情報提示方法及び装置並びにプログラム及び記録媒体 | |
KR20070102036A (ko) | 문서분석 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050405 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050913 |