JP5121872B2 - Image search device - Google Patents
Image search device Download PDFInfo
- Publication number
- JP5121872B2 JP5121872B2 JP2010076944A JP2010076944A JP5121872B2 JP 5121872 B2 JP5121872 B2 JP 5121872B2 JP 2010076944 A JP2010076944 A JP 2010076944A JP 2010076944 A JP2010076944 A JP 2010076944A JP 5121872 B2 JP5121872 B2 JP 5121872B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- tag
- search
- query
- tag information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、クエリに関連する画像データを検索する技術に関するものである。 The present invention relates to a technique for retrieving image data related to a query.
画像検索技術として知られている類似画像検索では、画像から色や形状、パターン等についての特徴量を抽出して、画像間の特徴量の類似度によって画像検索を行う。ユーザは、クエリとして画像を指定することで、視覚的に類似する画像を検索することができる。但し、コンピュータが抽出した特徴量を用いるため、クエリの画像と内容的に一致する画像が検索される精度は必ずしも良いとはいえない。 In a similar image search known as an image search technique, feature amounts for colors, shapes, patterns, and the like are extracted from images, and image searches are performed based on the similarity of feature amounts between images. The user can search for visually similar images by designating images as queries. However, since the feature amount extracted by the computer is used, the accuracy of searching for an image that matches the query image in terms of content is not necessarily good.
これに対して、画像検索技術の一つであるタグ画像検索では、画像にタグと呼ばれるテキスト情報を付与しておき、タグに基づいて画像検索を行う。このタグには一般に画像の特徴を表す言葉が用いられる。クエリとして指定されるタグと、画像に付与されているタグとを比較することで、タグの内容に関連する画像を検索することができる。 On the other hand, in tag image search, which is one of image search techniques, text information called a tag is assigned to an image, and image search is performed based on the tag. In general, words representing image characteristics are used for this tag. By comparing the tag specified as the query with the tag attached to the image, an image related to the content of the tag can be searched.
上述した類似画像検索とタグ画像検索とを組み合わせた技術として、画像の特徴によって類似画像を検索し、その検索された画像に付された付帯情報(タグ)を用いてタグ画像検索を行う技術が知られている(特許文献1参照)。 As a technique combining the above-described similar image search and tag image search, there is a technique in which a similar image is searched based on image characteristics, and tag image search is performed using incidental information (tag) attached to the searched image. It is known (see Patent Document 1).
上述したように、タグ画像検索は、画像の特徴を表す言葉であるタグに基づいて行われるため、該タグの付与を人手によって行うことで検索ノイズの低減が期待できる。しかし、タグを人手により付与する場合、タグの内容自体にばらつきを生じやすいという傾向がある。例えば、自動車の画像に対して、タグとして「自動車」、「四輪駆動車」、「特定の車種名」等のように、様々な言葉が使用される可能性がある。また、画像の内容を逐一ユーザが確認して、タグを網羅的に付与するのは、人為的にコストがかかる。 As described above, the tag image search is performed based on a tag that is a word representing the feature of the image. Therefore, search noise can be expected to be reduced by manually attaching the tag. However, when a tag is manually attached, there is a tendency that the tag content itself tends to vary. For example, various words such as “automobile”, “four-wheel drive vehicle”, “specific vehicle type name”, and the like may be used as tags for an automobile image. Further, it is artificially expensive for the user to confirm the contents of the image one by one and to give the tags comprehensively.
本発明は、上述の課題に鑑みて為されたものであり、その目的は、人為的なコストを抑えて画像に対するタグの付与を行うことで、タグ画像検索の精度向上を図ることである。 The present invention has been made in view of the above-described problems, and an object of the present invention is to improve the accuracy of tag image search by giving a tag to an image while suppressing artificial costs.
上述の課題を解決するために、本発明の第1の側面は、
画像と、タグ情報と、該画像の特徴量とを対応付けて記憶する記憶手段と、
クエリとして入力されたタグ情報に基づいて前記記憶手段に記憶された画像を検索するクエリタグ検索手段と、
前記検索された画像の特徴量に基づいて前記記憶手段から類似画像を検索する類似画像検索手段と、
前記クエリとして入力されたタグ情報と意味的に関連しているタグ情報を前記類似画像に対応付けられた前記タグ情報から抽出する意味的関連タグ抽出手段と、
前記抽出されたタグ情報が対応付けられた画像を前記記憶手段から検索し、この画像に前記入力されたタグ情報を対応付けて前記記憶手段に追加記憶するタグ登録手段と、
を備えることを特徴としている。
In order to solve the above-described problem, the first aspect of the present invention provides:
Storage means for storing an image, tag information, and a feature amount of the image in association with each other;
Query tag search means for searching for an image stored in the storage means based on tag information input as a query;
Similar image search means for searching for a similar image from the storage means based on the feature amount of the searched image;
Semantically related tag extraction means for extracting tag information semantically related to the tag information input as the query from the tag information associated with the similar image;
A tag registration unit that searches the storage unit for an image associated with the extracted tag information, associates the input tag information with the image, and additionally stores the tag information in the storage unit;
It is characterized by having.
この第1の側面によれば、クエリとして入力されたタグ情報(クエリタグ)に基づいて得られた検索結果に類似する類似画像から該クエリと意味的に関連するタグ情報を収集し、そのタグ情報で更に検索した画像に対してクエリを登録する。このため、該クエリに対して検索範囲が拡張され、更に意味的に関連する画像に対して、自動的にタグが付与される。従って、人為的なコストを抑えて画像に対するタグの付与を行うことで、タグ画像検索の精度向上を図ることができる。 According to the first aspect, tag information semantically related to the query is collected from similar images similar to the search result obtained based on the tag information (query tag) input as the query, and the tag information In addition, a query is registered for the image retrieved in step (1). For this reason, the search range is expanded with respect to the query, and a tag is automatically assigned to a semantically related image. Therefore, the tag image search accuracy can be improved by adding a tag to the image while suppressing artificial costs.
また、第2の側面において前記タグ登録手段は、前記意味的に関連しているタグ情報が対応付けられた画像と、前記タグ画像検索手段により検索された画像との類似度を算出し、その類似度に基づいて前記タグ情報の追加記憶を行うことを特徴としている。 Further, in the second aspect, the tag registration means calculates a similarity between the image associated with the semantically related tag information and the image searched by the tag image search means, The tag information is additionally stored based on the degree of similarity.
この第2の側面によれば、クエリに対して検索された画像との類似度に基づいてタグの付与を行う。このため、クエリと意味的に関連する画像の中でも、視覚的な類似度によってタグの付与範囲を絞ることができる。従って、タグ付与の精度を高めることができる。 According to the second aspect, the tag is attached based on the similarity to the image searched for the query. For this reason, even in an image that is semantically related to a query, it is possible to narrow down the tag assignment range based on the visual similarity. Therefore, the tagging accuracy can be increased.
第3の側面において、前記記憶手段は、前記画像と前記タグ情報との関連度を示す重み値を更に対応付けて記憶し、前記タグ登録手段は、前記算出した類似度に基づいて、前記入力されたタグ情報の重み値を設定することを特徴としている。 In the third aspect, the storage unit further stores a weight value indicating a degree of association between the image and the tag information in association with each other, and the tag registration unit performs the input based on the calculated similarity degree. It is characterized in that the weight value of the tag information is set.
この第3の側面によれば、算出した類似度を、画像とタグ情報の関連度として記憶していくため、タグに基づく画像検索を行う際の、検索結果の関連度として用いることができ、タグ画像検索の精度向上が図れる。 According to the third aspect, since the calculated similarity is stored as the degree of association between the image and the tag information, it can be used as the degree of association of the search result when performing an image search based on the tag. The accuracy of tag image search can be improved.
また、第4の発明において、前記タグ登録手段により検索された画像と、前記タグ画像検索手段により検索された画像とを、前記入力されたタグ情報に対する検索結果として出力する検索結果出力手段を更に備えることを特徴としている。 Further, in the fourth invention, there is further provided search result output means for outputting the image searched by the tag registration means and the image searched by the tag image search means as a search result for the input tag information. It is characterized by providing.
この第4の発明によれば、ユーザが画像検索結果を得るために入力したクエリによってタグ付与を逐次行っていく。このため、タグ情報のインデックス化をユーザの検索行為によって促進することができる。 According to the fourth aspect of the invention, tagging is sequentially performed by a query input by the user to obtain an image search result. For this reason, indexing of tag information can be promoted by a user's search act.
また、第5の側面においては、入力されたタグ情報に基づいて前記記憶手段から画像を検索するタグ画像検索手段を更に備え、前記クエリタグ検索手段は、ユーザにより入力されたタグ情報を前記タグ画像検索手段に入力することで、前記画像を検索し、前記タグ登録手段は、前記抽出されたタグ情報を前記タグ画像検索手段に入力することで、該タグ情報が対応付けられた画像を検索することを特徴としている。 In the fifth aspect, the image processing device further comprises tag image search means for searching for an image from the storage means based on the input tag information, wherein the query tag search means uses the tag information input by a user as the tag image. The image is searched by inputting to the search means, and the tag registration means searches the image associated with the tag information by inputting the extracted tag information to the tag image search means. It is characterized by that.
第5の側面によれば、クエリタグ検索手段及びタグ登録手段は、1つのタグ画像検索手段を共有することで、画像検索結果を得ることができる。 According to the fifth aspect, the query tag search means and the tag registration means can obtain an image search result by sharing one tag image search means.
本発明によれば、人為的なコストを抑えて画像に対するタグの付与を行うことで、タグ画像検索の精度向上を図ることができる。 According to the present invention, it is possible to improve the accuracy of tag image search by adding a tag to an image while suppressing artificial costs.
〔第1の実施形態〕
先ず、本発明を適用した第1の実施形態に係る画像検索装置を、添付の図面に基づいて説明する。本実施形態の画像検索装置1の機能構成の一例を示すブロック図を図1に示す。画像検索装置1は、ユーザ端末Tとインターネット等の通信回線網を介して相互に通信可能に接続されている。
[First Embodiment]
First, an image search apparatus according to a first embodiment to which the present invention is applied will be described with reference to the accompanying drawings. FIG. 1 is a block diagram illustrating an example of a functional configuration of the image search apparatus 1 according to the present embodiment. The image search device 1 is connected to a user terminal T through a communication network such as the Internet so that they can communicate with each other.
ユーザ端末Tは、ユーザが画像検索のためのクエリを入力する入力機能と、該クエリに応じた検索結果を表示出力する出力機能とを備えた端末であり、CPUや入力装置、表示装置等を有するパーソナルコンピュータや携帯端末等により実現される。 The user terminal T is a terminal provided with an input function for a user to input a query for image search, and an output function for displaying and outputting a search result corresponding to the query, and includes a CPU, an input device, a display device, and the like. This is realized by a personal computer, a portable terminal or the like.
画像検索装置1は、ユーザ端末Tで入力されたクエリに基づいて画像検索を行って、その検索結果をユーザ端末Tに返送する。画像検索装置1は、図1に示すように、クエリ受付部10と、検索部20と、出力部40と、画像DB部50と、シソーラス辞書90とを備えて構成される。
The image search device 1 performs an image search based on the query input at the user terminal T, and returns the search result to the user terminal T. As shown in FIG. 1, the image search device 1 includes a
クエリ受付部10は、画像検索のためのクエリをユーザ端末Tから受信して受け付ける。ユーザが画像検索のために入力するクエリは、キーワードや画像がある。クエリ受付部10は、クエリとして入力されたキーワードに基づいてクエリタグを生成する。クエリタグは、タグ情報(テキスト情報)であり、その生成方法の例を以下に挙げる。
The
・ユーザが入力したキーワードをクエリタグとする方法
・ユーザが入力したキーワードと関連性を有するタグを検索し、そのタグをクエリタグとする方法
・キーワードに関連するタグのうち、ユーザの付与率の高いタグを選別し、これをクエリタグとする方法
・ A method that uses the keyword entered by the user as a query tag ・ A method that searches for a tag that has a relationship with the keyword entered by the user and uses that tag as a query tag To select and use this as a query tag
また、キーワードの入力は、ユーザ端末Tにおいて行うことができる。キーワードの入力方法としては、
・ユーザがテキストを入力する方法
・ユーザに提示された選択肢の中から、ユーザが選択する方法
等がある。
The keyword can be input at the user terminal T. As a keyword input method,
A method in which the user inputs text. There is a method in which the user selects from among options presented to the user.
検索部20は、クエリに基づいて画像DB部50に格納された画像を検索する機能部であり、タグをクエリとして画像検索を行うタグ画像検索部22と、画像をクエリとして画像検索を行う類似画像検索部24と、意味的関連タグ抽出部26と、タグ付与部28とを備えて構成される。
The
画像DB部50は、画像DB60と、タグインデックス70と、特徴量インデックス80とを備えて構成される。画像DB60は、図2(a)に示すように画像を固有に識別する画像ID(例えばファイル名)と、画像データとを対応付けて記憶するデータベースである。画像はファイル管理されている場合には、ファイル名は画像データのヘッダ情報として対応付けられて、画像データとファイル名とは一体的に管理される。
The
タグインデックス70は、図2(b)に示すように画像DB60に記憶されている画像IDと、一又は複数のタグ情報とを対応付けて記憶するデータベースであり、該タグ情報が検索のためのインデックスとなる。画像IDによって、画像DB60に記憶された画像データと、タグインデックス70に記憶されたタグ情報との間に関連付けがなされる。
The
タグ情報は、何らかの意味を持つ文字列ないし記号列であり、勿論、単一の文字或いは記号によって構成することも可能である。例えば、漢字の場合は、一文字でも意味を持つので、タグとして機能できる。 The tag information is a character string or a symbol string having some meaning, and of course can be constituted by a single character or symbol. For example, in the case of kanji, even a single character is meaningful and can function as a tag.
画像DB部50に記憶される画像やタグ情報は、所謂ロボット検索によるクローラによってインターネット上から収集されてもよい。この際、タグ情報は、画像が掲載されたウェブページにおいて、該画像の近傍に記述されたテキスト情報を形態素解析等によって単語に分割することにより設定されるものであってもよい。また、タグ情報としては、画像のファイル名やURL、ALTタグ(アンカーテキスト)を設定することとしてもよい。
The image and tag information stored in the
タグ画像検索部22は、入力されたタグ情報と一致(又は前方一致等の略一致)するタグ情報が関連付けられた画像IDをタグインデックス70から検索するタグ画像検索を行うことにより、入力されたタグ情報に対する画像検索結果を得る。タグ情報の入力としては、クエリ受付部10からの入力と、タグ付与部28からの入力とがある。
The tag
特徴量インデックス80は、図2(c)に示すように画像IDと、画像の特徴量とを対応付けて記憶するデータベースであり、該特徴量が検索のためのインデックスとなる。ここで、画像の特徴量の例としては、色、形状、テクスチャー等があり、全ての特徴は多次元の特徴ベクトルにより表すことができる。画像の類似度(または距離)を算出する際に、特徴ベクトル間の類似度を算出する。画像IDによって、画像DB60に記憶された画像データと、特徴量インデックス80に記憶された特徴量との間に関連付けがなされる。
The
類似画像検索部24は、クエリとなる画像(クエリ画像)から特徴量を算出・抽出して、該特徴量と、特徴量インデックス80に記憶された特徴量との類似度を算出する類似画像検索を行うことにより、クエリ画像に対する画像検索結果を得る。
The similar
本実施形態の画像検索装置1においては、先ず、クエリ受付部10が生成したクエリタグがタグ画像検索部22に入力されて、該クエリタグに基づいてタグ画像検索(1回目のタグ画像検索)を行い、その検索結果の画像をクエリ画像として類似画像検索を行う。これにより、クエリタグに関連する画像に対して視覚的に類似する画像が得られる。
In the image search device 1 of the present embodiment, first, a query tag generated by the
意味的関連タグ抽出部26は、類似画像検索によって得られた類似画像に付与されたタグ情報を収集して、そのタグ情報の中からクエリタグと意味的に関連するタグ情報を抽出する。この意味的に関連するタグ情報の収集にシソーラス辞書90を用いる。
The semantic related
シソーラス辞書90は、言葉同士の関連性を記録した辞書DBであり、意味的に類似性を有した類義語を関連付けて記憶する。意味的関連タグ抽出部26は、クエリタグに対する類義語をシソーラス辞書90から読み出し、この類義語と略一致するタグ情報を意味的関連タグとして収集したタグ情報の中から抽出する。
The
意味的関連タグの抽出手法としては、シソーラス辞書90を用いる他、次のようにしてもよい。即ち、タグ情報に含まれる言葉に設定された属性(カテゴリ等)をベクトル空間にマッピングして特徴ベクトルとして表現し、その特徴ベクトル間の距離(例えば、コサイン距離)を算出することによって、言葉の近さ(関連性)を計って、意味的関連タグを抽出することとしてもよい。尚、言葉の近さの算出する手法としては、適宜、言語処理による公知技術を採用することとしてよい。
As a method for extracting semantic related tags, the following method may be used in addition to the
タグ付与部28は、意味的関連タグ抽出部26によって抽出された意味的関連タグをタグ画像検索部22に入力することによって、タグ画像検索部22に2回目のタグ画像検索を行わせて、その検索結果を得る。これにより、クエリ受付部10が生成したクエリタグに基づいた検索結果の他に、意味的関連タグによる検索結果が得られる。
The
また、タグ付与部28は、2回目のタグ画像検索、即ち、意味的関連タグを用いたタグ画像検索の検索結果として得られた画像に対して、クエリ受付部10が生成したクエリタグをタグ情報としてタグインデックス70に追加登録する。これにより、1回目のタグ画像検索で用いたクエリタグを、2回目のタグ画像検索の検索結果に付与することができる。
In addition, the
上述のように、本発明のクエリタグ検索手段は、クエリ受付部10とタグ画像検索部22との連関により実現され、タグ登録手段は、タグ付与部28とタグ画像検索部22との連関により実現される。
As described above, the query tag search unit of the present invention is realized by the association between the
上述したように、クエリタグは、ユーザによって入力されたキーワード等に基づいて生成される。タグ付与部28は、その生成元となるキーワードをタグ情報としてタグインデックス70に追加登録することとしてもよい。
As described above, the query tag is generated based on a keyword or the like input by the user. The
出力部40は、検索部20で得た検索結果をユーザ端末Tに出力するためのものであり、具体的には、検索結果の画像データにアクセス可能な表示データ(例えばウェブページデータ)を生成して、ユーザ端末Tに送信する。
The
出力部40は、検索部20のタグ画像検索部22により検索された画像の一覧として、クエリタグとタグインデックス70のタグ情報との関連度等を用いてランキングを行って、その画像の一覧を表示させるためのデータを生成する。例えば、1回目のタグ画像検索の結果を上位にランキングし、2回目のタグ画像検索の結果をその下位にランキングする。
The
〔画像検索方法〕
次に、前記した画像検索装置1の動作の一例を、図3〜図4を主に参照しながら説明する。
[Image search method]
Next, an example of the operation of the image search apparatus 1 will be described with reference mainly to FIGS.
先ず、ユーザはユーザ端末Tを用いてクエリを入力する。入力されたクエリは、インターネットを介してクエリ受付部10に送られる。クエリ受付部10では、クエリに基づいてクエリタグを上述したように取得する(ステップS11)。例えば、クエリとしてキーワードが入力された場合は、下記の方法で該キーワードからクエリタグを取得する。勿論、タグ自体をユーザが直接に入力することも可能である。
First, the user inputs a query using the user terminal T. The input query is sent to the
(1)タグインデックス70に記憶されているタグの中から類似文字列マッチングを使って、文字列としてクエリのキーワードに近いタグを特定する方法。
(2)タグインデックス70に記憶されているタグの中からシソーラス辞書90を使って意味的にクエリのキーワードに近いタグを特定する方法。
(1) A method of identifying a tag close to a query keyword as a character string from among tags stored in the
(2) A method of identifying a tag semantically close to a query keyword from the tags stored in the
タグ画像検索部22は、クエリタグに基づいて1回目のタグ画像検索を行うことにより、該クエリタグに対応するタグを持つ画像を検索結果として取得する(ステップS12)。図4(a)のように、タグ1がクエリタグとして取得された場合、タグ1が関連付けられた2つの画像G1、G2が検索される(図4(b)参照)。
The tag
次いで、1回目のタグ画像検索結果の画像をクエリ画像として類似画像検索部24が類似画像検索を行って、検索結果を取得する(ステップS13)。つまり、ここでは、画像の特徴量を用いて画像を検索する。その結果、画像G1と視覚的に類似する画像G11〜G13、画像G2に類似する画像G21〜G23が図4(c)のように検索される。
Next, the similar
そして、意味的関連タグ抽出部26は、類似画像に付されたタグを収集する(ステップS14)。このようにして収集されたタグを関連タグと称する。図4(d)では、画像G11〜G13、画像G21〜G23に付与されているタグ3、タグ4、タグ5、タグ7が収集されて、ユーザが指定したクエリに直接に関連するタグだけでなく、より幅広い範囲でタグを取得することができる。
Then, the semantic related
意味的関連タグ抽出部26は、収集した関連タグの中から、クエリタグに意味的に関連しているタグ(意味的関連タグ)を抽出する(ステップS15)。図4(e)では、タグ3〜タグ5の3つのタグが意味的関連タグとして抽出される。
The semantic related
例えば、クエリタグが「車」であり、類似画像検索によって収集された画像に付与された関連タグが「自動車」「カー」「白い箱」である場合の関連タグ「白い箱」のように、関連タグが、クエリタグと意味的に関連しない可能性があるが、ステップS15によりクエリタグに対して意味的に関連するもの「自動車」「カー」を意味的関連タグとして抽出する。但し、クエリタグ以外のタグを取得できており、その範囲では、タグが拡張されているといえる。 For example, the related tag “white box” when the query tag is “car” and the related tag given to the images collected by similar image search is “car” “car” “white box” Although there is a possibility that the tag is not semantically related to the query tag, in step S15, those "car" and "car" that are semantically related to the query tag are extracted as semantically related tags. However, tags other than the query tag can be acquired, and it can be said that the tag is expanded in that range.
そして、タグ画像検索部22は、意味的関連タグに基づいて2回目のタグ画像検索を行う(ステップS16)。図4(f)では、タグ3〜タグ5のそれぞれについて3枚の画像(G31〜G33、G41〜G43、G51〜G53)が検索されている。このようにして得た画像は、クエリタグと意味的に関連するタグを用いた検索により得られたものなので、ユーザにより指定されたクエリと関連する可能性が高い。
Then, the tag
タグ付与部28は、このタグ画像検索結果の画像に対してクエリタグをタグ情報としてタグインデックス70に追加記憶する(ステップS17)。即ち、検索結果の画像の画像IDにクエリタグを対応付けてタグインデックス70に記憶する。
The
これにより、図4(g)のように、2回目のタグ画像検索によって検索された画像には、意味的に関連するクエリタグが自動的に付与されるようになる。従って、画像に対するタグ付け作業の手間を省力化することができる。 As a result, as shown in FIG. 4G, semantically related query tags are automatically assigned to images searched by the second tag image search. Therefore, labor for tagging the image can be saved.
出力部40は、ステップS12と、ステップS16とのそれぞれの検索結果の画像を含む文書データをユーザ端末Tに返す。
The
上述のように、本実施形態によれば、クエリタグに基づいて行ったタグ画像検索の結果から類似画像検索を行うことで検索結果の画像を拡張して、その拡張した画像からクエリタグに意味的に近いタグを収集して更にタグ画像検索を行うことで、検索結果がクエリタグの意味から遠ざかることを防止する。 As described above, according to the present embodiment, the image of the search result is expanded by performing a similar image search from the result of the tag image search performed based on the query tag, and the query tag is semantically converted from the expanded image. By collecting near tags and further performing a tag image search, the search result is prevented from moving away from the meaning of the query tag.
また、このクエリタグと意味的に近いタグを最終的な検索結果の画像に付与することで、タグの意味的な内容を考慮したタグ付けを自動的に行うことができる。従って、人為的なコストを抑えて画像に対するタグの付与を行うことで、タグ画像検索の精度向上を図ることができる。 Moreover, tagging in consideration of the semantic content of the tag can be automatically performed by adding a tag semantically close to the query tag to the final search result image. Therefore, the tag image search accuracy can be improved by adding a tag to the image while suppressing artificial costs.
〔第2の実施形態〕
次に、第2の実施形態について図5及び6を用いて説明する。尚、上述した実施形態と同様の機能構成に実現される機能ブロックや、処理ステップは同一の符号によりその詳細な説明は省略する。
[Second Embodiment]
Next, a second embodiment will be described with reference to FIGS. Note that functional blocks and processing steps implemented in the same functional configuration as those of the above-described embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.
図5は、第2の実施形態における画像検索装置1の動作を示すフローチャートである。第2の実施形態においても画像検索装置1は、第1の実施形態と同様に、ステップS11〜S16までの処理を行って、意味的関連タグに基づいたタグ画像検索を行う。即ち、図4の例示においては(f)の状態の検索結果が得られる。 FIG. 5 is a flowchart showing the operation of the image search apparatus 1 in the second embodiment. Also in the second embodiment, the image search apparatus 1 performs the processing from steps S11 to S16 and performs a tag image search based on the semantically related tags, as in the first embodiment. That is, in the example of FIG. 4, a search result in the state (f) is obtained.
第2の実施形態においては、タグ画像検索部22の2回目のタグ画像検索(ステップS16)により得られた画像と、クエリタグに対する最初のタグ画像検索(ステップS12)により得られた画像との間の類似度を算出する(ステップS18)。この類似度の算出は、類似画像検索部24の機能により実現することができる。
In the second embodiment, between the image obtained by the second tag image search (step S16) of the tag
例えば、図6に示すように、クエリタグに対するタグ画像検索結果として画像G1が得られているとする。そして、二回目のタグ画像検索では、画像G31〜G33、G41〜G43、G51〜G53が得られているとする。この場合は、画像G1と、二回目のタグ画像検索で得られた画像それぞれとの間の類似度を算出する(図6(h)参照)。 For example, as shown in FIG. 6, it is assumed that an image G1 is obtained as a tag image search result for the query tag. It is assumed that images G31 to G33, G41 to G43, and G51 to G53 are obtained in the second tag image search. In this case, the similarity between the image G1 and each of the images obtained by the second tag image search is calculated (see FIG. 6H).
尚、類似度の算出に際して、クエリタグに対する検索結果(1回目のタグ画像検索)が複数(例えば、画像G1,G2)ある場合には、その複数の画像の特徴量の平均値(画像G1と画像G2の特徴量の平均値)を算出して、その平均値と、2回目のタグ画像検索結果との類似度に基づいてタグの付与を行うこととしてもよい。この場合、1回目のタグ画像検索結果と、2回目のタグ画像検索結果との間の全ての組み合わせで類似度を算出する手間が省ける。 When calculating the similarity, if there are a plurality of search results for the query tag (first tag image search) (for example, images G1 and G2), the average value of the feature values of the plurality of images (image G1 and image G1). An average value of G2 feature values) may be calculated, and tagging may be performed based on the similarity between the average value and the second tag image search result. In this case, it is possible to save the trouble of calculating the similarity for all combinations between the first tag image search result and the second tag image search result.
また、1回目のタグ画像検索結果の複数の画像(例えば画像G1,G2)と、2回目のタグ画像検索結果の個々の画像(例えば画像G31)との間の類似度を算出し、その類似度の平均値(画像G1と画像G31の類似度と、画像G2と画像G31の類似度との平均値)を算出して、その平均値に基づいてタグを付与することとしてもよい。この場合、1回目のタグ画像検索の結果を総合的に勘案して、個々の画像に対してタグの付与を行うことができる。 In addition, a similarity between a plurality of images (for example, images G1 and G2) as a result of the first tag image search and an individual image (for example, image G31) as a result of the second tag image search is calculated. An average value (an average value of the similarity between the image G1 and the image G31 and a similarity between the image G2 and the image G31) may be calculated, and a tag may be assigned based on the average value. In this case, it is possible to give a tag to each image by comprehensively considering the result of the first tag image search.
タグ付与部28は、算出した類似度に基づいて、二回目のタグ画像検索により得られた画像に対してクエリタグを付与して、登録する(ステップS19)。即ち、類似度が所定値以上である場合に(例えば0〜1の類似度範囲において0.5である場合や、類似度が相対的に一定以上高い場合)、クエリタグを付与する。
The
例えば、図6のようなタグ画像検索結果が得られているとすると、類似度が所定値以上と判断された画像G31〜G33、G42、G43、G52にクエリタグであるタグ1が付与されることとなる(図6(i)参照)。 For example, if a tag image search result as shown in FIG. 6 is obtained, the tag 1 as a query tag is assigned to the images G31 to G33, G42, G43, and G52 whose similarity is determined to be equal to or higher than a predetermined value. (See FIG. 6I).
このように、クエリタグについてのタグ画像検索結果と、二回目のタグ画像検索結果との類似度を用いてタグの付与を行う。これにより、クエリタグが付与された画像と視覚的に類似する画像、即ち、クエリに対する関連性が高い画像に対して、クエリタグと同一のタグを付与することができるため、タグ付与の精度を高めることができる。 In this way, the tag is assigned using the similarity between the tag image search result for the query tag and the second tag image search result. As a result, the same tag as the query tag can be assigned to an image that is visually similar to the image to which the query tag is assigned, that is, an image that is highly relevant to the query. Can do.
また、第2の実施形態では、算出した類似度によりタグ付けを行うこととして説明したが、その類似度をタグ画像検索における重み値として設定して更に登録することとしてもよい。 In the second embodiment, tagging is performed based on the calculated similarity, but the similarity may be set as a weight value in tag image search and further registered.
例えば、図7に示すタグインデックス72のように、タグ情報と画像IDの対応関係に対してスコア(重み値)を対応付けたインデックスを構成する。このスコアは、タグ情報と、画像との関連度を示す指標となる重み値である。 For example, an index in which a score (weight value) is associated with the correspondence between the tag information and the image ID is configured like a tag index 72 shown in FIG. This score is a weight value serving as an index indicating the degree of association between tag information and an image.
上述のステップS19においてクエリタグを画像に対して登録する際には、該クエリタグと画像とに対応付けられるスコアに類似度を加算する。図6において、画像G31には、タグ1が付与されて登録されるが、タグ1と画像G31とに対応付けられるスコアに類似度が加算される。 When a query tag is registered for an image in step S19 described above, the similarity is added to the score associated with the query tag and the image. In FIG. 6, the image G31 is registered with the tag 1 added thereto, but the similarity is added to the score associated with the tag 1 and the image G31.
タグ画像検索部22は、クエリタグに対応付けられた画像をタグインデックス72から検索する際に、このスコアが所定値以上である画像を検索結果として出力する。このため、クエリタグと関連性の高い画像を検索するようになり、タグ画像検索の更なる精度向上を図れる。
When the tag
上述した各実施形態の動作は、コンピュータに適宜のコンピュータソフトウエアを組み込むことにより実施することができる。尚、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。 The operation of each embodiment described above can be implemented by incorporating appropriate computer software into the computer. The contents of the present invention are not limited to the above embodiment. In the present invention, various modifications can be made to the specific configuration within the scope of the claims.
例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。更に本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。 For example, each component described above may exist as a functional block, and may not exist as independent hardware. As a mounting method, hardware or computer software may be used. Furthermore, one functional element in the present invention may be realized by a set of a plurality of functional elements, and a plurality of functional elements in the present invention may be realized by one functional element.
また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。 Moreover, the functional element may be arrange | positioned in the position physically separated. In this case, the functional elements may be connected by a network. It is also possible to realize functions or configure functional elements by grid computing.
1 画像検索装置
10 クエリ受付部
20 検索部
22 タグ画像検索部
24 類似画像検索部
26 意味的関連タグ抽出部
28 タグ付与部
40 出力部
50 画像DB部
60 画像DB
70,72 タグインデックス
80 特徴量インデックス
90 シソーラス辞書
DESCRIPTION OF SYMBOLS 1
70, 72
Claims (7)
クエリとして入力されたタグ情報に基づいて前記記憶手段に記憶された画像を検索するクエリタグ検索手段と、
前記検索された画像の特徴量に基づいて前記記憶手段から類似画像を検索する類似画像検索手段と、
前記クエリとして入力されたタグ情報と意味的に関連しているタグ情報を前記類似画像に対応付けられた前記タグ情報から抽出する意味的関連タグ抽出手段と、
前記抽出されたタグ情報が対応付けられた画像を前記記憶手段から検索し、この画像に前記入力されたタグ情報を対応付けて前記記憶手段に追加記憶するタグ登録手段と、
を備えることを特徴とする画像検索装置。 Storage means for storing an image, tag information, and a feature amount of the image in association with each other;
Query tag search means for searching for an image stored in the storage means based on tag information input as a query;
Similar image search means for searching for a similar image from the storage means based on the feature amount of the searched image;
Semantically related tag extraction means for extracting tag information semantically related to the tag information input as the query from the tag information associated with the similar image;
A tag registration unit that searches the storage unit for an image associated with the extracted tag information, associates the input tag information with the image, and additionally stores the tag information in the storage unit;
An image search apparatus comprising:
前記意味的に関連しているタグ情報が対応付けられた画像と、前記クエリタグ検索手段により検索された画像との類似度を算出し、その類似度に基づいて前記タグ情報の追加記憶を行うことを特徴とする請求項1に記載の画像検索装置。 The tag registration means includes
Calculating the similarity between the image associated with the semantically related tag information and the image searched by the query tag search means, and additionally storing the tag information based on the similarity The image search device according to claim 1.
前記タグ登録手段は、
前記算出した類似度に基づいて、前記入力されたタグ情報の重み値を設定することを特徴とする請求項2に記載の画像検索装置。 The storage means further stores a weight value indicating a degree of association between the image and the tag information in association with each other,
The tag registration means includes
The image search apparatus according to claim 2, wherein a weight value of the input tag information is set based on the calculated similarity.
前記クエリタグ検索手段は、
ユーザにより入力されたタグ情報を前記タグ画像検索手段に入力することで、前記画像を検索し、
前記タグ登録手段は、
前記抽出されたタグ情報を前記タグ画像検索手段に入力することで、該タグ情報が対応付けられた画像を検索することを特徴とする請求項1〜4の何れか一項に記載の画像検索装置。 Tag image search means for searching for an image from the storage means based on the input tag information;
The query tag search means includes:
By inputting the tag information input by the user into the tag image search means, the image is searched,
The tag registration means includes
5. The image search according to claim 1, wherein an image associated with the tag information is searched by inputting the extracted tag information to the tag image search unit. apparatus.
クエリとして入力されたタグ情報に基づいて前記記憶手段に記憶された画像を検索するクエリタグ検索工程と、
前記検索された画像の特徴量に基づいて前記記憶手段から類似画像を検索する類似画像検索工程と、
前記クエリとして入力されたタグ情報と意味的に関連しているタグ情報を前記類似画像に対応付けられた前記タグ情報から抽出する意味的関連タグ抽出工程と、
前記抽出されたタグ情報が対応付けられた画像を前記記憶手段から検索し、この画像に前記入力されたタグ情報を対応付けて前記記憶手段に追加記憶するタグ登録工程と、
を前記コンピュータが行うことを特徴とする画像検索方法。 In an image search method in which a computer searches for an image from a storage unit that stores an image, tag information, and a feature amount of the image in association with each other,
A query tag search step of searching for an image stored in the storage unit based on tag information input as a query;
A similar image search step of searching for a similar image from the storage means based on a feature amount of the searched image;
A semantically related tag extraction step of extracting tag information that is semantically related to the tag information input as the query from the tag information associated with the similar image;
A tag registration step of searching the storage unit for an image associated with the extracted tag information, and additionally storing the input tag information in association with the image;
The image search method characterized in that the computer performs the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010076944A JP5121872B2 (en) | 2010-03-30 | 2010-03-30 | Image search device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010076944A JP5121872B2 (en) | 2010-03-30 | 2010-03-30 | Image search device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011210000A JP2011210000A (en) | 2011-10-20 |
JP5121872B2 true JP5121872B2 (en) | 2013-01-16 |
Family
ID=44940990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010076944A Active JP5121872B2 (en) | 2010-03-30 | 2010-03-30 | Image search device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5121872B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3593260A1 (en) * | 2017-03-07 | 2020-01-15 | Selerio Limited | Multi-modal image search |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6409294B2 (en) * | 2014-03-17 | 2018-10-24 | 日本電気株式会社 | Information processing apparatus, system, method, and program |
JP5968381B2 (en) * | 2014-09-03 | 2016-08-10 | ヤフー株式会社 | Extraction apparatus, extraction method and extraction program |
JP6310509B2 (en) * | 2016-07-05 | 2018-04-11 | ヤフー株式会社 | Extraction apparatus, extraction method and extraction program |
JP7266797B2 (en) * | 2019-03-04 | 2023-05-01 | テンソル・コンサルティング株式会社 | Styling database management system and method |
JP7362074B2 (en) * | 2021-05-25 | 2023-10-17 | ソフトバンク株式会社 | Information processing device, information processing method, and information processing program |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10289240A (en) * | 1997-04-14 | 1998-10-27 | Canon Inc | Image processor and its control method |
JP2005115721A (en) * | 2003-10-09 | 2005-04-28 | Nippon Telegr & Teleph Corp <Ntt> | Method, device and program for searching for image |
JP5061137B2 (en) * | 2009-02-12 | 2012-10-31 | ヤフー株式会社 | Image search device |
-
2010
- 2010-03-30 JP JP2010076944A patent/JP5121872B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3593260A1 (en) * | 2017-03-07 | 2020-01-15 | Selerio Limited | Multi-modal image search |
US12093310B2 (en) | 2017-03-07 | 2024-09-17 | Streem, Llc | Multi-modal image search |
Also Published As
Publication number | Publication date |
---|---|
JP2011210000A (en) | 2011-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI524193B (en) | Computer-readable media and computer-implemented method for semantic table of contents for search results | |
JP6785921B2 (en) | Picture search method, device, server and storage medium | |
US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
JP4011906B2 (en) | Profile information search method, program, recording medium, and apparatus | |
JP3225912B2 (en) | Information retrieval apparatus, method and recording medium | |
CN103678576B (en) | The text retrieval system analyzed based on dynamic semantics | |
CN106095738B (en) | Recommending form fragments | |
US20110078176A1 (en) | Image search apparatus and method | |
JP5444115B2 (en) | Data search apparatus, data search method and program | |
JP2017157192A (en) | Method of matching between image and content item based on key word | |
JP5121872B2 (en) | Image search device | |
JP2012515379A (en) | Method and system for querying information | |
US20120162244A1 (en) | Image search color sketch filtering | |
US9542474B2 (en) | Forensic system, forensic method, and forensic program | |
WO2015017166A1 (en) | Method for systematic mass normalization of titles | |
JP6165955B1 (en) | Method and system for matching images and content using whitelist and blacklist in response to search query | |
JP6363682B2 (en) | Method for selecting an image that matches content based on the metadata of the image and content | |
JP2005250980A (en) | Document retrieval system, retrieval condition input device, retrieval execution device, document retrieval method and document retrieval program | |
JP2004341753A (en) | Retrieval support device, retrieval support method and program | |
JP5226241B2 (en) | How to add tags | |
CN103744970B (en) | A kind of method and device of the descriptor determining picture | |
JP2011203776A (en) | Similar image retrieval device, method, and program | |
CN114141384A (en) | Method, apparatus and medium for retrieving medical data | |
KR101592670B1 (en) | Apparatus for searching data using index and method for using the apparatus | |
JP5265610B2 (en) | Related word extractor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121002 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121023 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151102 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5121872 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |