[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6035173B2 - Image search system and image search method - Google Patents

Image search system and image search method Download PDF

Info

Publication number
JP6035173B2
JP6035173B2 JP2013052074A JP2013052074A JP6035173B2 JP 6035173 B2 JP6035173 B2 JP 6035173B2 JP 2013052074 A JP2013052074 A JP 2013052074A JP 2013052074 A JP2013052074 A JP 2013052074A JP 6035173 B2 JP6035173 B2 JP 6035173B2
Authority
JP
Japan
Prior art keywords
image
feature
position information
feature point
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013052074A
Other languages
Japanese (ja)
Other versions
JP2014178857A (en
Inventor
悠一 吉田
悠一 吉田
満 安倍
満 安倍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso IT Laboratory Inc
Original Assignee
Denso IT Laboratory Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso IT Laboratory Inc filed Critical Denso IT Laboratory Inc
Priority to JP2013052074A priority Critical patent/JP6035173B2/en
Publication of JP2014178857A publication Critical patent/JP2014178857A/en
Application granted granted Critical
Publication of JP6035173B2 publication Critical patent/JP6035173B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、大量の参照画像の中からクエリ画像に対応する対応画像を検索する画像検索システム及び画像検索方法等に関するものである。   The present invention relates to an image search system and an image search method for searching a corresponding image corresponding to a query image from a large number of reference images.

複数の画像の間で対応点を抽出する際に、局所画像特徴量が用いられる。例えば、1つの被写体を異なる2つの視点から撮影して得た2枚の画像を用いれば、撮影した機材の焦点距離などの内部パラメータと呼ばれる装置固有の情報が与えられたときに、三角測量の原理で撮影場所から被写体までの距離を測定したり、被写体の大きさを推定したりできる。   When extracting corresponding points between a plurality of images, local image feature amounts are used. For example, if two images obtained by photographing one subject from two different viewpoints are used, triangulation can be performed when device-specific information called internal parameters such as the focal length of the photographed equipment is given. In principle, the distance from the shooting location to the subject can be measured, and the size of the subject can be estimated.

このとき、被写体上のある点は、2つの画像上にそれぞれ投影され、2つの画像間で共通して観測される。このような2つの画像間で共通して観測される点(対応点)を検出するために、局所画像特徴量が用いられる。即ち、局所画像特徴量が一致する点が対応点であると判断する。   At this time, a certain point on the subject is projected on each of the two images, and is commonly observed between the two images. In order to detect a point (corresponding point) observed in common between two images, a local image feature amount is used. That is, it is determined that a point where the local image feature amounts match is a corresponding point.

この局所画像特徴量を応用して、画像検索を実現できることが知られている。この画像検索技術では、複数の画像をデータベースに保存しておくとともに、それらすべての画像について、特徴点を抽出して、抽出した特徴点の局所画像特徴量を計算し、これらもデータベースに保存しておく。クエリ画像が入力されると、クエリ画像から特徴点を抽出し、それらの局所画像特徴量を算出する。そして、データベースに保存された複数の画像の各々について、クエリ画像に含まれる特徴点の局所画像特徴量と一致する局所画像特徴量を有する特徴点を対応点としてカウントし、その対応点の数が最も多い画像が、クエリ画像に最も近似した画像であると判断される。   It is known that image search can be realized by applying this local image feature amount. In this image retrieval technology, a plurality of images are stored in a database, feature points are extracted from all the images, and local image feature amounts of the extracted feature points are calculated, and these are also stored in the database. Keep it. When a query image is input, feature points are extracted from the query image, and their local image feature amounts are calculated. Then, for each of the plurality of images stored in the database, feature points having local image feature amounts that match the local image feature amounts of feature points included in the query image are counted as corresponding points, and the number of corresponding points is It is determined that the most images are the images most similar to the query image.

さらに、この局所画像特徴量を用いた画像検索技術では、特徴点の位置情報も利用される。上述のように、局所画像特徴量を用いた画像検索技術では、データベース中の画像の中で、クエリ画像の特徴点と対応する特徴点を多く多く持つ画像をクエリ画像に近い画像と判断するが、このように局所画像特徴量の比較のみで対応点であると判断すると、実際には対応しないが偶然に局所画像特徴量が一致する点同士が対応点であると誤って判断されることになる。   Further, in the image search technique using the local image feature amount, the position information of the feature point is also used. As described above, in the image search technique using the local image feature amount, an image having many feature points corresponding to the feature points of the query image is determined as an image close to the query image among the images in the database. Thus, when it is determined that the corresponding point is a comparison point only by comparing the local image feature amounts, it is erroneously determined that the points that do not actually correspond but coincide with each other by chance are the corresponding points. Become.

このようなノイズによる誤判断を防ぐため、クエリ画像のある特徴点の局所画像特徴量とデータベース中の画像のある特徴点の局所画像特徴量とが一致するか否かのみではなく、クエリ画像の当該特徴点の位置とデータベース中の画像の当該特徴点の位置との幾何的射影関係を求めて、クエリ画像の当該特徴点がデータベース中の画像の当該特徴点に正しく射影されているかを判定し、その判定結果も合わせて、それらの特徴点が対応点であるかを判断する手法がある。   In order to prevent such misjudgment due to noise, not only whether or not the local image feature quantity of a feature point of a query image matches the local image feature quantity of a feature point of an image in the database, The geometric projection relationship between the position of the feature point and the position of the feature point of the image in the database is obtained, and it is determined whether the feature point of the query image is correctly projected onto the feature point of the image in the database. In addition, there is a method for determining whether or not those feature points are corresponding points together with the determination result.

具体的には、被写体が紙面などの二次元平面であると仮定できる場合、次のようにして、局所画像特徴量が一致する特徴点同士について、それらの位置も一致しているか否かを判断する。まず、クエリ画像とデータベース中の画像との間で、局所画像特徴量が一致する特徴点の組をすべて検出する。そして、それらの複数の特徴点の組について、RANSAC法を使用して、クエリ画像の特徴点の位置をその特徴点と組になったデータベース中の画像の特徴点の位置に射影するホモグラフィ行列を計算する。   Specifically, when it can be assumed that the subject is a two-dimensional plane such as a paper surface, it is determined whether or not the positions of feature points having the same local image feature amount also match as follows. To do. First, all pairs of feature points having the same local image feature amount are detected between the query image and the image in the database. A homography matrix that projects the position of the feature point of the query image to the position of the feature point of the image in the database paired with the feature point using the RANSAC method for the set of the plurality of feature points Calculate

さらに、そのホモグラフィ行列によって、再度、データベース中の画像の特徴点と局所画像特徴量が一致すると判断されたクエリ画像の特徴点の位置を射影する。そして、その結果得られた位置が、クエリ画像の特徴点と局所画像特徴量が一致すると判断されたデータベース中の画像の特徴点の位置とどれだけずれているかを計算し(位置のマッチング)、その計算結果(マッチングスコア)に基づいて、最終的にそれらの特徴点が対応点であるか否かを判断する。   Further, the position of the feature point of the query image determined to match the feature point of the image in the database and the local image feature amount is projected again by the homography matrix. And the position obtained as a result is calculated how much the feature point of the query image and the position of the feature point of the image in the database determined to match the local image feature amount (position matching), Based on the calculation result (matching score), it is finally determined whether or not those feature points are corresponding points.

ところで、1つの画像から数百点の特徴点を抽出し、それぞれの点ごとの局所画像特徴量を算出し、さらに、他の画像の局所画像特徴量と比較すると、その演算に用いられるデータ量は膨大になり、巨大なメモリや高速なCPU、さらに巨大な保存用ストレージが必要となる。局所画像特徴量として一般に知られているSIFT特徴量の場合には、各特徴点の情報を表す特徴点データとして、局所画像特徴量の他に、スケール情報、位置情報、主軸情報等の付随情報が含まれる。これらをすべての特徴点について足し合わせると例えば、1枚の画像に800点の特徴点が含まれるとすると、1枚あたり約422Kバイトのデータ量になる。このため、例えば1万枚の画像を検索対象に使用すると、扱うデータの量は(422Kバイト×10,000)約4.2Gバイトにもなる。   By the way, when hundreds of feature points are extracted from one image, local image feature amounts for each point are calculated, and when compared with the local image feature amounts of other images, the amount of data used for the calculation Requires a huge memory, a high-speed CPU, and a huge storage for storage. In the case of a SIFT feature quantity generally known as a local image feature quantity, in addition to the local image feature quantity, incidental information such as scale information, position information, and spindle information is used as feature point data representing information of each feature point. Is included. If these are added for all feature points, for example, if one image contains 800 feature points, the data amount is about 422 Kbytes per image. For this reason, for example, when 10,000 images are used as a search target, the amount of data to be handled is (422 Kbytes × 10,000), which is approximately 4.2 Gbytes.

このような課題に対して、各特徴点の局所画像特徴量を圧縮することで、対応点の抽出を高速化する技術として、ORB、brisk、CARD等の技術が提案されており、本願発明者らもそのような技術に関して特許出願をしている(特許文献1)。これらの技術は、各特徴点の局所画像特徴量を実数ベクトルではなく、二値のベクトルで表現することによって、局所画像特徴量の圧縮を実現している。また、従来とは異なる計算手法を採用することで、局所画像特徴量の高速な算出を実現している。   In response to such a problem, techniques such as ORB, brisk, and CARD have been proposed as techniques for speeding up the extraction of corresponding points by compressing the local image feature quantity of each feature point. Have also filed a patent application regarding such technology (Patent Document 1). In these techniques, the local image feature value is compressed by expressing the local image feature value of each feature point with a binary vector instead of a real vector. In addition, by adopting a calculation method different from the conventional one, high speed calculation of the local image feature amount is realized.

なお、本発明に関連する先行技術として、以下の先行技術文献がある。   In addition, there exist the following prior art documents as a prior art relevant to this invention.

特開2012−160047号公報JP 2012-160047 A

David G. Lowe, "Object recognition from local scale-invariant features," International Conference on Computer Vision, Corfu, Greece (September 1999), pp. 1150-1157David G. Lowe, "Object recognition from local scale-invariant features," International Conference on Computer Vision, Corfu, Greece (September 1999), pp. 1150-1157

本発明は、局所画像特徴量を用いた画像検索技術において、画像検索に用いるデータの量を抑えることを目的とする。   An object of the present invention is to suppress the amount of data used for image search in an image search technique using local image feature amounts.

本願発明者らは、局所画像特徴量を圧縮した場合には、位置情報、主軸情報等の付随情報のデータ量の割合が相対的に大きくなり、特徴点情報の更なるデータ量の削減、演算の高速化にとって、付随情報のデータ量の影響が大きくなることに着目し、局所画像特徴量を圧縮した場合には、付随情報のデータ量を削減することが、特徴点情報の更なるデータ量の削減、演算の高速化にとって有利であることを見出した。   When the local image feature amount is compressed, the inventors of the present application have a relatively large proportion of the amount of accompanying information such as position information and spindle information, and further reduce the amount of feature point information and perform computation If the local image feature value is compressed, reducing the data amount of the accompanying information may reduce the additional data amount of the feature point information. It has been found that it is advantageous for reducing the amount of data and increasing the calculation speed.

即ち、特徴点データには、その点の局所画像特徴量のほかに、スケール情報、位置情報、主軸情報等の付随情報が含まれるが、局所画像特徴量に対する圧縮が行われていない場合には、この付随情報のデータ量が特徴点データの全体のデータ量に占める割合も小さく、付随情報のデータ量が問題となることはなかった。具体的には、例えば、スケール情報、位置情報、及び主軸情報のデータ量は、一般的な実数型で表現すると、それぞれ4バイト、8バイト(位置は二次元であるので4バイト×2)、4バイトであり、付随情報の合計のデータ量は16バイトであり、一方、局所画像特徴量は、それが128次元の実数であるとすると、そのデータ量は(128×4=)512バイトであり、よって、付随情報のデータ量が全体のデータ量に占める割合は(16/(512+16)=)約3%でしかなかった。   That is, the feature point data includes accompanying information such as scale information, position information, and spindle information in addition to the local image feature amount of the point, but when the local image feature amount is not compressed. The ratio of the data amount of the accompanying information to the entire data amount of the feature point data is small, and the data amount of the accompanying information does not become a problem. Specifically, for example, the data amount of scale information, position information, and spindle information is 4 bytes and 8 bytes (4 bytes × 2 because the position is two-dimensional) when expressed in a general real number type. 4 bytes, the total data amount of the accompanying information is 16 bytes. On the other hand, if the local image feature amount is a 128-dimensional real number, the data amount is (128 × 4 =) 512 bytes. Therefore, the ratio of the data amount of the accompanying information to the total data amount is only about 3% (16 / (512 + 16) =).

一方、圧縮された局所画像特徴量を含む特徴点データにおいては、局所画像特徴量のデータ量が削減されているため、全体のデータ量に対して、スケール情報、位置情報、主軸情報等の付随情報のデータ量の占める割合が相対的に大きくなる。具体的には、局所画像特徴量を128ビット(=16バイト)に圧縮した場合、全体のデータ量に対して付随情報のデータ量が占める割合は、(16/(16+16)=)50%にもなる。   On the other hand, in the feature point data including the compressed local image feature amount, since the data amount of the local image feature amount is reduced, scale information, position information, spindle information, etc. are attached to the entire data amount. The ratio of the data amount of information becomes relatively large. Specifically, when the local image feature amount is compressed to 128 bits (= 16 bytes), the ratio of the data amount of the accompanying information to the total data amount is (16 / (16 + 16) =) 50%. Also become.

画像検索では、主軸及びスケールの情報は使われないため、これらを削除することができる。しかし、それらを削除できたとしても、位置情報は必要であり、特徴点データの中での位置情報のデータ量(8バイト)は、特徴点データの全体のデータ量に対して、(8/(16+8)=)約33%となる。したがって、特徴点データに占める局所画像特徴量以外の情報を削減することが有利である。   In the image search, information on the main axis and scale is not used, so these can be deleted. However, even if they can be deleted, the position information is necessary, and the amount of position information in the feature point data (8 bytes) is (8 / (16 + 8) =) about 33%. Therefore, it is advantageous to reduce information other than the local image feature amount in the feature point data.

このために、本発明の画像検索システムは、クエリ画像処理装置と検索サーバ装置とからなる画像検索システムであって、前記クエリ画像処理装置は、クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部と、前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部と、前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを送信するクエリ画像処理装置側通信部とを備え、前記検索サーバ装置は、前記特徴点データを受信する検索サーバ装置側通信部と、受信した前記特徴点データに含まれる前記局所画像特徴量及び前記位置情報を用いて、複数の参照画像から、前記クエリ画像に対応する対応画像を検索する画像検索部とを備えた構成を有している。   To this end, the image search system of the present invention is an image search system including a query image processing device and a search server device, and the query image processing device includes local image feature quantities of a plurality of feature points in the query image. A feature point including a local image feature quantity extraction unit for extracting the feature point, a feature point position coarse quantization unit for coarsely quantizing the position information of the feature point, and the local image feature quantity and the coarsely quantized position information A query image processing device side communication unit for transmitting data, wherein the search server device receives the feature point data, and the local image feature amount included in the received feature point data And an image search unit that searches for a corresponding image corresponding to the query image from a plurality of reference images using the position information.

この構成によれば、クエリ画像処理装置において、局所画像特徴量が抽出された特徴点の位置情報が粗量子化されるので、特徴点データの全体のデータ量に占める位置情報のデータ量の割合を小さくできる。特に、局所画像特徴量がバイナリ変換等によって圧縮されている場合には、粗量子化による位置情報のデータ量の削減の効果は大きくなる。   According to this configuration, since the position information of the feature point from which the local image feature amount is extracted is roughly quantized in the query image processing device, the ratio of the data amount of the position information to the entire data amount of the feature point data Can be reduced. In particular, when the local image feature amount is compressed by binary conversion or the like, the effect of reducing the data amount of the position information by coarse quantization becomes large.

上記の画像検索システムにおいて、前記画像検索部は、粗量子化された前記位置情報を元の画像サイズの位置情報に変換する位置情報変換部をさらに備えていてよい。この構成によれば、クエリ画像に対応する対応画像の検索を行う画像検索部において、クエリ画像の特徴点の位置情報が復元される。   In the image search system, the image search unit may further include a position information conversion unit that converts the coarsely quantized position information into position information of the original image size. According to this configuration, the position information of the feature points of the query image is restored in the image search unit that searches for the corresponding image corresponding to the query image.

上記の画像検索システムにおいて、前記特徴点位置粗量子化部は、前記粗量子化を行う際の粗量子化レベルを変更可能であってよい。この構成によれば、データ量削減の必要性や可能性に応じて位置情報のデータ量を変更できる。   In the image search system, the feature point position coarse quantization unit may be capable of changing a coarse quantization level when performing the coarse quantization. According to this configuration, the data amount of the position information can be changed according to the necessity and possibility of reducing the data amount.

上記の画像検索システムにおいて、前記特徴点位置粗量子化部は、前記クエリ画像処理装置側通信部の通信状態に応じて前記粗量子化レベルを変更してよい。この構成によれば、通信状態がよくない場合に粗量子化レベルを変更して、より位置情報のデータ量を少なくする等の制御が可能になる。   In the image search system, the feature point position coarse quantization unit may change the coarse quantization level according to a communication state of the query image processing device side communication unit. According to this configuration, it is possible to perform control such as changing the coarse quantization level when the communication state is not good and reducing the amount of position information data.

上記の画像検索システムにおいて、前記特徴点位置粗量子化部は、前記クエリ画像処理装置の処理状態に応じて前記粗量子化レベルを変更してよい。この構成によれば、クエリ画像処理装置の処理能力に余裕がない状態である場合に粗量子化レベルを変更して、より位置情報のデータ量を少なくする等の制御が可能になる。   In the image search system, the feature point position coarse quantization unit may change the coarse quantization level according to a processing state of the query image processing apparatus. According to this configuration, it is possible to perform control such as changing the coarse quantization level when the processing capacity of the query image processing apparatus is not sufficient, thereby reducing the amount of position information.

上記の画像検索システムにおいて、前記特徴点位置粗量子化部は、前記クエリ画像の画像サイズに応じて前記粗量子化レベルを変更してよい。この構成によれば、画像サイズが小さいほど位置情報のデータ量を少なくする等の制御が可能になる。   In the image search system, the feature point position coarse quantization unit may change the coarse quantization level in accordance with an image size of the query image. According to this configuration, it is possible to perform control such as reducing the amount of position information as the image size is smaller.

上記の画像検索システムにおいて、前記特徴点位置粗量子化部は、前記特徴点の位置情報を2バイトのデータ量になるように粗量子化してよい。この構成によれば、実数である位置情報が8バイト程度で表現される通常の場合と比較して十分にデータ量を削減できる。   In the image search system, the feature point position coarse quantization unit may coarsely quantize the feature point position information so as to have a data amount of 2 bytes. According to this configuration, the data amount can be sufficiently reduced as compared with the normal case where the position information that is a real number is expressed by about 8 bytes.

上記の画像検索システムにおいて、前記検索サーバ装置は、前記複数の参照画像中の複数の特徴点の局所画像特徴量及び位置情報を関連付けて保存する画像保存部をさらに備えていてよく、前記画像検索部は、前記クエリ画像の前記局所画像特徴量と前記参照画像の前記特徴点の局所画像特徴量とを比較することにより、互いに対応する特徴点の組を求める比較マッチング部と、前記クエリ画像の前記位置情報及び前記参照画像の前記位置情報のいずれか一方を他方に射影することにより、互いに対応する特徴点の組を求める射影判定部とを備えていてよく、前記比較マッチング部にて対応すると判断され、かつ、前記射影判定部にて対応すると判断された特徴点を最も多く含む前記参照画像を前記対応画像としてよい。   In the image search system, the search server device may further include an image storage unit that stores the local image feature quantities and position information of a plurality of feature points in the plurality of reference images in association with each other. A comparison matching unit that obtains a pair of feature points corresponding to each other by comparing the local image feature amount of the query image and the local image feature amount of the feature point of the reference image; A projection determination unit that obtains a pair of feature points corresponding to each other by projecting either one of the position information and the position information of the reference image to the other; The reference image including the largest number of feature points determined and determined to correspond by the projection determination unit may be used as the corresponding image.

この構成によれば、単に特徴点の局所画像特徴量を比較するのではなく、位置も対応している特徴点を対応点としてカウントして対応画像を検索できるので、特徴点の位置情報を有効に用いて対応画像検索の精度を向上できる。   According to this configuration, instead of simply comparing the local image feature quantities of feature points, it is possible to search for a corresponding image by counting feature points that correspond to positions as corresponding points. To improve the accuracy of the corresponding image search.

本発明の別の態様の画像検索システムは、クエリ画像処理装置と検索サーバ装置とからなる画像検索システムであって、前記クエリ画像処理装置は、クエリ画像中の複数の特徴点の局所画像特徴量及び位置情報を含む特徴点データを送信するクエリ画像処理装置側通信部を備え、前記検索サーバ装置は、前記特徴点データを受信する検索サーバ装置側通信部と、複数の参照画像中の複数の特徴点の局所画像特徴量及び粗量子化された位置情報を関連付けて保存する画像保存部と、前記クエリ画像の前記局所画像特徴量と前記参照画像の特徴点の前記局所画像特徴量とを比較することにより、互いに対応する特徴点の組を求める比較マッチング部と、前記クエリ画像の前記位置情報及び前記参照画像の前記位置情報のいずれか一方を他方に射影することにより、互いに対応する特徴点の組を求める射影判定部とを備え、前記比較マッチング部にて対応すると判断され、かつ、前記射影判定部にて対応すると判断された特徴点を最も多く含む前記参照画像を、前記クエリ画像に対応する対応画像であると判定する構成を有している。   An image search system according to another aspect of the present invention is an image search system including a query image processing device and a search server device, wherein the query image processing device is a local image feature quantity of a plurality of feature points in a query image. And a query image processing device side communication unit that transmits feature point data including position information, and the search server device includes a search server device side communication unit that receives the feature point data, and a plurality of reference images. Comparing the local image feature quantity of the feature point and the coarsely quantized position information in association with each other, and comparing the local image feature quantity of the query image and the local image feature quantity of the feature point of the reference image A comparison matching unit for obtaining a pair of feature points corresponding to each other, and projecting one of the position information of the query image and the position information of the reference image to the other A projection determination unit that obtains a pair of feature points corresponding to each other, and includes the largest number of feature points that are determined to correspond by the comparison matching unit and that are determined to correspond by the projection determination unit. The reference image is determined to be a corresponding image corresponding to the query image.

この構成によれば、特徴点の局所画像特徴量及び位置情報を含む特徴点データ用いて、大量の参照画像の中からクエリ画像に対応する対応画像を検索する場合に、当該参照画像の特徴点データを保存するためのストレージの容量を抑えることができ、あるいは、限られた容量のストレージにより多くの参照画像の特徴点データを保存できる。   According to this configuration, when a corresponding image corresponding to a query image is searched from a large amount of reference images using feature point data including local image feature amounts and position information of feature points, the feature points of the reference image The capacity of the storage for storing the data can be suppressed, or the feature point data of many reference images can be stored by the storage having a limited capacity.

上記の画像検索システムにおいて、前記検索サーバ装置は、前記参照画像の粗量子化された前記位置情報を元の画像サイズの位置情報に変換する位置情報変換部をさらに備えていてよい。この構成により、大量の参照画像の中からクエリ画像に対応する対応画像を検索する際に、参照画像の特徴点の位置情報が復元される。   In the above-described image search system, the search server device may further include a position information conversion unit that converts the coarsely quantized position information of the reference image into position information of the original image size. With this configuration, when searching for a corresponding image corresponding to a query image from a large number of reference images, position information of feature points of the reference image is restored.

上記の画像検索システムにおいて、前記クエリ画像処理装置は、撮影によって前記クエリ画像を生成する撮像部をさらに備えた携帯情報端末であってよい。この構成によれば、クエリ画像処理装置のユーザは、撮影によってクエリ画像を生成できる。   In the above-described image search system, the query image processing device may be a portable information terminal that further includes an imaging unit that generates the query image by shooting. According to this configuration, the user of the query image processing apparatus can generate a query image by photographing.

上記の画像検索システムにおいて、前記検索サーバ装置側通信部は、前記対応画像及び/又は前記対応画像に関連付けられた関連情報を送信してよく、前記クエリ画像処理装置側通信部は、前記対応画像及び/又は前記関連情報を受信してよい。この構成によれば、クエリ画像処理装置において、クエリ画像に対応する対応画像や関連情報を取得できる。   In the above image search system, the search server device side communication unit may transmit the corresponding image and / or related information associated with the corresponding image, and the query image processing device side communication unit may transmit the corresponding image. And / or the related information may be received. According to this configuration, in the query image processing device, it is possible to acquire the corresponding image and related information corresponding to the query image.

本発明の別の態様は、クエリ画像処理装置と検索サーバ装置とからなる画像検索システムにおける前記クエリ画像処理装置であって、このクエリ画像処理装置は、クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部と、前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部と、前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを、前記検索サーバ装置に送信するクエリ画像処理装置側通信部とを備えた構成を有している。   Another aspect of the present invention is the query image processing device in an image search system including a query image processing device and a search server device, wherein the query image processing device is a local image of a plurality of feature points in the query image. A local image feature amount extraction unit for extracting feature amounts; a feature point position coarse quantization unit for coarsely quantizing the position information of the feature points; and the local image feature amount and the coarsely quantized position information. A query image processing device side communication unit that transmits the feature point data to the search server device.

この構成によっても、局所画像特徴量が抽出された特徴点の位置情報が粗量子化されるので、特徴点データの全体のデータ量に占める位置情報のデータ量の割合を小さくできる。   Also with this configuration, the position information of the feature point from which the local image feature amount has been extracted is roughly quantized, so that the ratio of the data amount of the position information to the entire data amount of the feature point data can be reduced.

本発明の別の態様は、クエリ画像処理装置と検索サーバ装置とからなる画像検索システムにおける前記検索サーバ装置であって、この検索サーバ装置は、前記クエリ画像処理装置から、クエリ画像中の複数の特徴点の局所画像特徴量及び位置情報を含む特徴点データを受信する通信部、と、複数の参照画像中の複数の特徴点の局所画像特徴量及び粗量子化された位置情報を関連付けて保存する画像保存部と、前記クエリ画像の前記局所画像特徴量と前記参照画像の特徴点の前記局所画像特徴量とを比較することにより、互いに対応する特徴点の組を求める比較マッチング部と、前記クエリ画像の前記位置情報及び前記参照画像の前記位置情報のいずれか一方を他方に射影することにより、互いに対応する特徴点の組を求める射影判定部とを備え、前記比較マッチング部にて対応すると判断され、かつ、前記射影判定部にて対応すると判断された特徴点を最も多く含む前記参照画像を、前記クエリ画像に対応する対応画像であると判定する構成を有している。   Another aspect of the present invention is the search server device in an image search system including a query image processing device and a search server device, the search server device receiving a plurality of query images from the query image processing device. A communication unit that receives feature point data including local image feature amounts and position information of feature points, and stores local image feature amounts and coarsely quantized position information of a plurality of feature points in a plurality of reference images in association with each other. An image storage unit that compares the local image feature amount of the query image with the local image feature amount of the feature point of the reference image, thereby obtaining a pair of feature points corresponding to each other, and A projection determination unit that obtains a pair of feature points corresponding to each other by projecting one of the position information of the query image and the position information of the reference image to the other. Configuration for determining that the reference image including the largest number of feature points determined to correspond by the comparison matching unit and determined to correspond by the projection determination unit is a corresponding image corresponding to the query image have.

この構成によっても、特徴点の局所画像特徴量及び位置情報を含む特徴点データ用いて、大量の参照画像の中からクエリ画像に対応する対応画像を検索する場合に、当該参照画像の特徴点データを保存するためのストレージの容量を抑えることができ、あるいは、限られた容量のストレージにより多くの参照画像の特徴点データを保存できる。   Even with this configuration, when searching for a corresponding image corresponding to a query image from a large number of reference images using feature point data including local image feature quantities and position information of feature points, the feature point data of the reference image The capacity of the storage for storing the image can be reduced, or the feature point data of many reference images can be stored by the storage having a limited capacity.

本発明の別の態様は、クエリ画像処理装置と検索サーバ装置とからなる画像検索システムにおける画像検索方法であって、この画像検索方法は、前記クエリ画像処理装置にて実行される、クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出ステップと、前記特徴点の位置情報を粗量子化する特徴点位置粗量子化ステップと、前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを送信するクエリ画像処理装置側通信ステップと、前記検索サーバ装置にて実行される、前記特徴点データを受信する検索サーバ装置側通信ステップと、受信した前記特徴点データに含まれる前記局所画像特徴量及び前記位置情報を用いて、複数の参照画像から、前記クエリ画像に対応する対応画像を検索する画像検索ステップとを含む。   Another aspect of the present invention is an image search method in an image search system including a query image processing device and a search server device, and the image search method is executed by the query image processing device. A local image feature amount extraction step for extracting local image feature amounts of a plurality of feature points, a feature point position coarse quantization step for coarsely quantizing position information of the feature points, and the local image feature amount and coarse quantization A query image processing device side communication step for transmitting feature point data including the position information, and a search server device side communication step for receiving the feature point data, which is executed by the search server device, Image search for searching for a corresponding image corresponding to the query image from a plurality of reference images using the local image feature amount and the position information included in the feature point data And a step.

この構成によっても、局所画像特徴量が抽出された特徴点の位置情報が粗量子化されるので、特徴点データの全体のデータ量に占める位置情報のデータ量の割合を小さくできる。   Also with this configuration, the position information of the feature point from which the local image feature amount has been extracted is roughly quantized, so that the ratio of the data amount of the position information to the entire data amount of the feature point data can be reduced.

本発明の別の態様は、クエリ画像処理プログラムであって、このクエリ画像処理プログラムは、コンピュータを、クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部、前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部、及び前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを、検索サーバ装置に送信する通信部、として機能させる。   Another aspect of the present invention is a query image processing program, wherein the query image processing program causes a computer to extract a local image feature quantity of a plurality of feature points in the query image, A feature point position coarse quantization unit that coarsely quantizes position information of feature points, and a communication unit that transmits feature point data including the local image feature amount and the coarsely quantized position information to a search server device; To function as.

この構成によっても、局所画像特徴量が抽出された特徴点の位置情報が粗量子化されるので、特徴点データの全体のデータ量に占める位置情報のデータ量の割合を小さくできる。   Also with this configuration, the position information of the feature point from which the local image feature amount has been extracted is roughly quantized, so that the ratio of the data amount of the position information to the entire data amount of the feature point data can be reduced.

本発明の別の態様は、検索サーバプログラムであって、この検索サーバプログラムは、複数の参照画像中の複数の特徴点の局所画像特徴量及び粗量子化された位置情報を関連付けて保存する画像保存部を含むコンピュータを、クエリ画像処理装置から、クエリ画像中の複数の特徴点の局所画像特徴量及び位置情報を含む特徴点データを受信する通信部、前記クエリ画像の前記局所画像特徴量と前記参照画像の特徴点の前記局所画像特徴量とを比較することにより、互いに対応する特徴点の組を求める比較マッチング部、及び前記クエリ画像の前記位置情報及び前記参照画像の前記位置情報のいずれか一方を他方に射影することにより、互いに対応する特徴点の組を求める射影判定部として機能させ、前記比較マッチング部にて対応すると判断され、かつ、前記射影判定部にて対応すると判断された特徴点を最も多く含む前記参照画像を、前記クエリ画像に対応する対応画像であると判定する。   Another aspect of the present invention is a search server program, and the search server program associates and stores local image feature amounts of a plurality of feature points and coarsely quantized position information in a plurality of reference images. A computer that includes a storage unit; a communication unit that receives, from the query image processing device, feature image data including local image feature values and position information of a plurality of feature points in the query image; and the local image feature values of the query image A comparison matching unit that obtains a pair of feature points corresponding to each other by comparing the feature points of the reference image with the local image feature amount, and any of the position information of the query image and the position information of the reference image By projecting one of them to the other, it is made to function as a projection determination unit that obtains a pair of feature points corresponding to each other, and it is determined that the comparison matching unit corresponds. Is, and determines that the reference image with the highest concentration feature points determined to correspond to the at the projection determination unit, the corresponding image corresponding to the query image.

この構成によっても、特徴点の局所画像特徴量及び位置情報を含む特徴点データ用いて、大量の参照画像の中からクエリ画像に対応する対応画像を検索する場合に、当該参照画像の特徴点データを保存するためのストレージの容量を抑えることができ、あるいは、限られた容量のストレージにより多くの参照画像の特徴点データを保存できる。   Even with this configuration, when searching for a corresponding image corresponding to a query image from a large number of reference images using feature point data including local image feature quantities and position information of feature points, the feature point data of the reference image The capacity of the storage for storing the image can be reduced, or the feature point data of many reference images can be stored by the storage having a limited capacity.

本発明によれば、局所画像特徴量が抽出された特徴点の位置情報が粗量子化されるので、位置情報のデータ量の割合を小さくでき、それによって画像検索に用いるデータの量を抑えることができる。   According to the present invention, the position information of feature points from which local image feature values are extracted is roughly quantized, so that the ratio of the data amount of position information can be reduced, thereby suppressing the amount of data used for image search. Can do.

本発明の実施の形態における画像検索システムの構成を示すブロック図The block diagram which shows the structure of the image search system in embodiment of this invention 本発明の実施の形態における特徴点データ生成部の構成を示すブロック図The block diagram which shows the structure of the feature point data generation part in embodiment of this invention 本発明の実施の形態における比較マッチングの例を示す図The figure which shows the example of the comparison matching in embodiment of this invention 本発明の実施の形態における変換行列の算出のフロー図Flow chart for calculating transformation matrix in the embodiment of the present invention

以下、本発明の実施の形態の画像検索システムについて、図面を参照しながら説明する。なお、以下に説明する実施の形態は、本発明を実施する場合の一例を示すものであって、本発明を以下に説明する具体的構成に限定するものではない。本発明の実施にあたっては、実施の形態に応じた具体的構成が適宜採用されてよい。   Hereinafter, an image search system according to an embodiment of the present invention will be described with reference to the drawings. The embodiment described below shows an example when the present invention is implemented, and the present invention is not limited to the specific configuration described below. In carrying out the present invention, a specific configuration according to the embodiment may be adopted as appropriate.

図1は、本発明の実施の形態の画像検索システムの構成を示す図である。画像検索システム100は、クエリ画像処理装置10と、検索サーバ装置20とがネットワークNWを介して通信可能に接続されている。ネットワークNWの一部は無線であってよい。クエリ画像処理装置10は携帯情報端末であってよく、アプリケーションが実行されることで図1に示す構成が実現されてもよい。   FIG. 1 is a diagram showing a configuration of an image search system according to an embodiment of the present invention. In the image search system 100, a query image processing apparatus 10 and a search server apparatus 20 are connected to be communicable via a network NW. A part of the network NW may be wireless. The query image processing apparatus 10 may be a portable information terminal, and the configuration shown in FIG. 1 may be realized by executing an application.

クエリ画像処理装置10は、検索したい画像を撮影して、それをクエリ画像として検索サーバ装置20に送信するとともに、検索サーバ装置20から当該クエリ画像に関連する関連情報を取得する装置である。検索サーバ装置20は、クエリ画像処理装置10からクエリ画像を受信すると、そのクエリ画像に含まれる被写体に対応する被写体を含む画像を検索して、検索された画像及び/又は検索された画像に関連付けられた関連情報を当該クエリ画像に関する情報としてクエリ画像処理装置10に返信する装置である。   The query image processing apparatus 10 is an apparatus that captures an image to be searched and transmits it as a query image to the search server apparatus 20 and acquires related information related to the query image from the search server apparatus 20. When the search server device 20 receives the query image from the query image processing device 10, the search server device 20 searches for an image including a subject corresponding to the subject included in the query image, and associates it with the searched image and / or the searched image. The related information is returned to the query image processing apparatus 10 as information related to the query image.

画像検索システム100は、検索サーバ装置20に保存する画像及びそれに付随させる関連情報の如何によって様々な応用が可能である。本実施の形態では、画像検索システム100がポスター検索をするためシステムとして応用されている例を説明する。即ち、検索サーバ装置20には、検索対象画像として複数のポスターの画像が保存されており、かつ、各ポスターの画像には当該ポスターに関連する関連情報が付随している。ユーザは、クエリ画像処理装置10にてポスターの画像を撮影して、そのデータを検索サーバ装置20に送ると、検索サーバ装置20では、当該撮影されたポスターの画像に対応する画像が検索され、検索された画像及びそれに付随する関連情報がクエリ画像処理装置10に返信される。   The image search system 100 can be applied in various ways depending on the image stored in the search server device 20 and the related information associated therewith. In the present embodiment, an example in which the image search system 100 is applied as a system for searching posters will be described. That is, the search server device 20 stores a plurality of poster images as search target images, and each poster image is associated with related information related to the poster. When the user captures a poster image in the query image processing apparatus 10 and sends the data to the search server apparatus 20, the search server apparatus 20 searches for an image corresponding to the captured poster image. The searched image and related information accompanying it are returned to the query image processing apparatus 10.

なお、画像検索システム100の応用例はこれに限られない。例えば、検索サーバ装置20に大量の書籍の表表紙の画像を保存しておき、各保存画像に関連情報として各書籍のユーザレビュー、購入のための情報、関連する他の書籍等の情報を付随しておくことで、画像検索システム100を書籍検索システムとして応用できる。また、検索サーバ装置20に観光地に特有の建造物等の画像と、関連情報としてその建造物の解説を保存しておくことで、画像検索システム100を観光地案内システムとして応用できる。さらに、検索サーバ装置20に野鳥の画像と、関連情報としてその野鳥の解説を記載したウェブページのURLを保存しておくことで、画像検索システム100を野鳥検索システムとして応用できる。   The application example of the image search system 100 is not limited to this. For example, a large number of book cover images are stored in the search server device 20 and each stored image is accompanied by information such as a user review of each book, information for purchase, and other related books as related information. By doing so, the image search system 100 can be applied as a book search system. Moreover, the image search system 100 can be applied as a sightseeing spot guidance system by storing an image of a building or the like peculiar to a sightseeing spot in the search server device 20 and a description of the building as related information. Furthermore, the image search system 100 can be applied as a bird search system by storing the image of the bird in the search server device 20 and the URL of the web page describing the description of the bird as related information.

クエリ画像処理装置10は、撮像部11と、特徴点データ生成部12と、通信部13と、通信状態測定部14と、粗量子化レベル決定部15とを備えている。撮像部11は、光学系、撮像素子、信号処理回路等からなる一般的なカメラユニットである。撮像部11は光学系を通して、被写体を撮影し、信号処理回路から特徴点データ生成部12に画像信号(以下単に「画像」という。)を出力する。   The query image processing apparatus 10 includes an imaging unit 11, a feature point data generation unit 12, a communication unit 13, a communication state measurement unit 14, and a coarse quantization level determination unit 15. The imaging unit 11 is a general camera unit including an optical system, an imaging element, a signal processing circuit, and the like. The imaging unit 11 captures a subject through an optical system, and outputs an image signal (hereinafter simply referred to as “image”) from the signal processing circuit to the feature point data generation unit 12.

図2は、特徴点データ生成部12の構成を示すブロック図である。特徴点データ生成部12は、特徴点検出部31と、局所画像特徴量抽出部32と、バイナリ変換部33と、特徴点位置粗量子化部34と、データ合成部35とを備えている。撮像部11(図1参照)にて撮影によって生成された画像は特徴点検出部31に入力される。   FIG. 2 is a block diagram illustrating a configuration of the feature point data generation unit 12. The feature point data generation unit 12 includes a feature point detection unit 31, a local image feature amount extraction unit 32, a binary conversion unit 33, a feature point position rough quantization unit 34, and a data synthesis unit 35. An image generated by shooting by the imaging unit 11 (see FIG. 1) is input to the feature point detection unit 31.

特徴点検出部31は、入力画像から特徴点を検出する。特徴点検出部31は、画像からエッジを抽出してエッジ画像を生成し、そのエッジ画像から特徴点を検出する。特徴点を検出するアルゴリズムとして、既存の任意のものを採用できる。また、特徴点検出部31は、入力画像のサイズも検出する。特徴点検出部31は、検出したすべての特徴点について、特徴点を識別する情報、画像サイズ、及び画像内での特徴点の位置の情報を含む特徴点情報を局所画像特徴量抽出部32及び特徴点位置粗量子化部34に出力する。なお、特徴点の位置の情報は、特徴点のX座標及びY座標であり、X座標及びY座標の値は入力画像の1画素を1単位とする。特徴点は2つの直線の交点のような決定の仕方をするので、そのX座標及びY座標は、それぞれ一般的には整数とはならず、単精度実数(32ビット)になる。なお、位置情報のX座標及びY座標は、倍精度実数(64ビット)のデータあるいはそれ以上の精度の実数型で得られてもよい。   The feature point detection unit 31 detects feature points from the input image. The feature point detection unit 31 extracts an edge from the image to generate an edge image, and detects the feature point from the edge image. Any existing algorithm can be adopted as an algorithm for detecting feature points. The feature point detector 31 also detects the size of the input image. The feature point detection unit 31 outputs, for all the detected feature points, feature point information including information for identifying the feature points, image size, and information on the position of the feature points in the image, to the local image feature amount extraction unit 32 and The result is output to the feature point position coarse quantization unit 34. Note that the feature point position information is the X coordinate and Y coordinate of the feature point, and the X coordinate and Y coordinate values are based on one pixel of the input image. Since the feature point is determined like an intersection of two straight lines, its X coordinate and Y coordinate are generally not integers but single precision real numbers (32 bits). Note that the X coordinate and Y coordinate of the position information may be obtained as double-precision real number (64-bit) data or a real number type with higher accuracy.

局所画像特徴量抽出部32は、特徴点検出部31にて検出された各特徴点の局所画像特徴量を抽出する。局所画像特徴量を抽出する方法としては、既知の技術を用いることが可能であり、例えば、局所画像特徴量を128次元のベクトルとして算出する方法として、SIFT特徴量を利用する方法(David G. Lowe, "Distinctive image features from scale-invariant keypoints," International Journal of Computer Vision, 60, 2 (2004), pp. 91-110. 参照)などを用いることができる。局所画像特徴量抽出部32において、局所画像特徴量は、単精度実数のベクトルとして求められる。局所画像特徴量抽出部32は、各特徴点について、その識別情報とともに、抽出された局所画像特徴量をバイナリ変換部33に出力する。   The local image feature amount extraction unit 32 extracts the local image feature amount of each feature point detected by the feature point detection unit 31. A known technique can be used as a method for extracting a local image feature quantity. For example, as a method for calculating a local image feature quantity as a 128-dimensional vector, a method using a SIFT feature quantity (David G. Lowe, “Distinctive image features from scale-invariant keypoints,” International Journal of Computer Vision, 60, 2 (2004), pp. 91-110. In the local image feature quantity extraction unit 32, the local image feature quantity is obtained as a single-precision real vector. The local image feature amount extraction unit 32 outputs the extracted local image feature amount together with the identification information of each feature point to the binary conversion unit 33.

バイナリ変換部33は、検出されたすべての特徴点について、それらの局所画像特徴量をバイナリコードに変換する。局所画像特徴量抽出部32にて抽出された局所画像特徴量は128次元のベクトルv∈R128であるので、バイナリ変換部33は、この局所画像特徴量を下式(1)でバイナリコードに変換する。

Figure 0006035173
The binary conversion unit 33 converts the local image feature values of all the detected feature points into binary codes. Since the local image feature amount extracted by the local image feature amount extraction unit 32 is a 128-dimensional vector vεR 128 , the binary conversion unit 33 converts the local image feature amount into a binary code by the following equation (1). Convert.
Figure 0006035173

但し、式(1)において、dは、変換後のバイナリコードのサイズ(即ちビット数)であり、sgn関数は、下式(2)で与えられる。

Figure 0006035173
また、ベクトルwkは、128次元における半径1の超球上の点から、一様分布に従ってランダムサンプリングをして得られるベクトルである。wk(k=1,……d)は、128行d列の行列として表現できる。本実施の形態では、バイナリコードのビット長を128ビットとし、即ちd=128とする。バイナリ変換部33は、各特徴点について、その識別情報とともに、バイナリコードに変換された局所画像特徴量をデータ合成部35に出力する。 In equation (1), d is the size (that is, the number of bits) of the binary code after conversion, and the sgn function is given by the following equation (2).
Figure 0006035173
The vector w k is a vector obtained by random sampling according to a uniform distribution from a point on a hypersphere having a radius of 1 in 128 dimensions. w k (k = 1,... d) can be expressed as a matrix of 128 rows and d columns. In this embodiment, the bit length of the binary code is 128 bits, that is, d = 128. The binary conversion unit 33 outputs the local image feature amount converted into the binary code together with the identification information for each feature point to the data synthesis unit 35.

特徴点位置粗量子化部34は、特徴点検出部31にて検出された各特徴点の位置情報を粗量子化する。粗量子化のレベル(粒度)は、粗量子化レベル決定部15(図1参照)によって指定される。粗量子化レベルの決定方法については、後述する。上述のように、特徴点の位置座標は、単精度実数で与えられている。特徴点位置粗量子化部34は、その特徴点のX座標及びY座標の値を入力画像の幅及び高さでそれぞれ除算した実数値を指定された粗量子化レベルで粗量子化する。   The feature point position coarse quantization unit 34 roughly quantizes the position information of each feature point detected by the feature point detection unit 31. The level of coarse quantization (granularity) is specified by the coarse quantization level determination unit 15 (see FIG. 1). A method for determining the coarse quantization level will be described later. As described above, the position coordinates of feature points are given as single-precision real numbers. The feature point position coarse quantization unit 34 roughly quantizes a real value obtained by dividing the X coordinate and Y coordinate values of the feature point by the width and height of the input image at a designated coarse quantization level.

例えば、入力画像の画像サイズが、320×240であり、ある特徴点の位置座標が(21.568987・・・, 37.908325・・・)であり、かつ、粗量子化レベルが256(8ビット)であるとすると、X座標の21.568987・・・は、21.568987・・・×(256/320)=17.25・・・となり、Y座標の37.908325・・・は、37.908325・・・×(256/240)=40.43・・・となるので、粗量子化された特徴点の位置座標は(17, 40)となる。粗量子化された特徴点の位置情報のデータ量は、X座標、Y座標がそれぞれ8ビット(1バイト)であるので、全体として16ビット(2バイト)となる。なお、粗量子化レベルを調整することで、特徴点位置粗量子化部34は、X座標、Y座標がそれぞれ16ビット(2バイト)となるように特徴点の位置情報を粗量子化してもよい。   For example, the image size of the input image is 320 × 240, the position coordinates of a certain feature point are (21.568987..., 37.908325...), And the coarse quantization level is 256 (8 Bit), the X coordinate 21.568987 ... 21.568987 ... × (256/320) = 17.25 ... and the Y coordinate 37.908325 ... 37.908325 ... × (256/240) = 40.43 ... Therefore, the position coordinates of the coarsely quantized feature points are (17, 40). The amount of data of the position information of the coarsely quantized feature point is 16 bits (2 bytes) as a whole because the X coordinate and the Y coordinate are 8 bits (1 byte) each. It should be noted that by adjusting the coarse quantization level, the feature point position coarse quantization unit 34 may coarsely quantize the feature point position information so that the X coordinate and the Y coordinate are each 16 bits (2 bytes). Good.

特徴点位置粗量子化部34は、各特徴点について、特徴点の識別情報と、入力画像の画像サイズと、粗量子化レベルと、粗量子化された特徴点の位置座標とをデータ合成部35に出力する。データ合成部35は、識別情報が同一である特徴点について、バイナリ変換部33にて生成された局所画像特徴量に対して、特徴点位置粗量子化部34で得られた入力画像の画像サイズと、粗量子化レベルと、粗量子化された特徴点の位置座標とを付随情報として付随させて、特徴点データを生成する。このようにしてデータ合成部35にて生成された特徴点データは、通信部13(図1参照)に出力される。   For each feature point, the feature point position coarse quantization unit 34 generates a feature point identification information, an image size of the input image, a coarse quantization level, and a position coordinate of the coarsely quantized feature point. 35. The data composition unit 35 determines the image size of the input image obtained by the feature point position coarse quantization unit 34 with respect to the local image feature amount generated by the binary conversion unit 33 for the feature points having the same identification information. And the coarse quantization level and the position coordinates of the coarsely quantized feature points are attached as accompanying information to generate feature point data. The feature point data generated by the data synthesis unit 35 in this way is output to the communication unit 13 (see FIG. 1).

図1に戻って、画像検索システム100の説明を続ける。通信部13は、ネットワークNWを介して特徴点データ生成部12で生成されたクエリ画像の複数の特徴点データを検索サーバ装置20に送信する。   Returning to FIG. 1, the description of the image search system 100 will be continued. The communication unit 13 transmits a plurality of feature point data of the query image generated by the feature point data generation unit 12 to the search server device 20 via the network NW.

なお、以上の撮像部11、特徴点データ生成部12、及び通信部13による一連の処理は、撮像部11でレリーズ操作が行われたタイミングで、それによって生成された1つの画像について行ってもよいし、過去に撮像部11にて生成された画像が図示しないストレージに保存されており、ユーザが保存された画像を選択して指示することで、特徴点データ生成部12及び通信部13による上述の処理がなされてもよい。また、撮像部11で連続的にプレビュー動画が生成され、そのプレビュー動画の各フレーム画像について、特徴点データ生成部12及び通信部13による上述の処理が順次なされてもよい。   Note that the above-described series of processing by the imaging unit 11, the feature point data generation unit 12, and the communication unit 13 may be performed on one image generated by the release operation at the imaging unit 11. In addition, images generated in the past by the imaging unit 11 are stored in a storage (not shown), and the feature point data generation unit 12 and the communication unit 13 can select and specify the stored images. The above-described processing may be performed. Further, the preview moving image may be continuously generated by the imaging unit 11, and the above-described processing by the feature point data generating unit 12 and the communication unit 13 may be sequentially performed on each frame image of the preview moving image.

通信状態測定部14は、通信部13による通信状態を測定する。ここで、通信状態は、クエリ画像処理装置10が無線端末である場合には、受信電界強度であってよい。また、通信状態は、通信速度又は回線速度であってもよい。   The communication state measurement unit 14 measures the communication state by the communication unit 13. Here, the communication state may be the received electric field strength when the query image processing apparatus 10 is a wireless terminal. The communication state may be a communication speed or a line speed.

粗量子化レベル決定部15は、通信状態測定部14にて測定された通信状態に応じて粗量子化レベルを決定する。具体的には、粗量子化レベル決定部15は、通信状態が悪いほど粗量子化レベルを小さくし、通信状態が良いほど粗量子化レベルを大きくする。粗量子化レベルは、特徴点の位置情報(X座標及びY座標)を何段階で表現するかを示す情報である。粗量子化レベル決定部15は、決定した粗量子化レベルを特徴点データ生成部12の特徴点位置粗量子化部34に出力する。   The coarse quantization level determination unit 15 determines the coarse quantization level according to the communication state measured by the communication state measurement unit 14. Specifically, the coarse quantization level determination unit 15 decreases the coarse quantization level as the communication state is poor, and increases the coarse quantization level as the communication state is good. The coarse quantization level is information indicating the number of stages in which feature point position information (X coordinate and Y coordinate) is expressed. The rough quantization level determination unit 15 outputs the determined rough quantization level to the feature point position rough quantization unit 34 of the feature point data generation unit 12.

次に、検索サーバ装置20について説明する。検索サーバ装置20は、参照画像のデータベースを構築するための構成として、参照画像取得部21、特徴点データ生成部22、及び画像データベース23を備えている。参照画像取得部21は、画像データベース23に保存すべき画像を取得する。参照画像取得部21は、通信部24を介して外部から参照画像を取得してよく、あるいは他の方法によって参照画像を取得してよい。   Next, the search server device 20 will be described. The search server device 20 includes a reference image acquisition unit 21, a feature point data generation unit 22, and an image database 23 as a configuration for constructing a reference image database. The reference image acquisition unit 21 acquires an image to be stored in the image database 23. The reference image acquisition unit 21 may acquire a reference image from the outside via the communication unit 24, or may acquire a reference image by another method.

特徴点データ生成部22は、参照画像取得部21にて取得された画像を入力して、各画像に含まれる複数の特徴点について特徴点データを生成する。その構成は図2を用いて説明したクエリ画像処理装置10の特徴点データ生成部12の構成と同じである。但し、特徴点位置粗量子化部34で採用する粗量子化レベルは固定であってよく、ユーザによって指定されてよく、又は他の何らかの手段によって指定されてもよい。特徴点データ生成部22にて生成された特徴点データは、画像データベース23に保存される。   The feature point data generation unit 22 receives the image acquired by the reference image acquisition unit 21 and generates feature point data for a plurality of feature points included in each image. The configuration is the same as the configuration of the feature point data generation unit 12 of the query image processing apparatus 10 described with reference to FIG. However, the coarse quantization level employed by the feature point position coarse quantization unit 34 may be fixed, specified by the user, or specified by some other means. The feature point data generated by the feature point data generation unit 22 is stored in the image database 23.

画像データベース23には、各参照画像について、その画像データ、特徴点データ、及び関連情報のデータが関連付けられて記憶されている。なお、画像データ及び関連情報データは、別の保存手段に保存され、識別情報等によって画像データベース23に保存された特徴点データと紐付けられていてもよい。   The image database 23 stores image data, feature point data, and related information data in association with each reference image. Note that the image data and the related information data may be stored in another storage unit and associated with the feature point data stored in the image database 23 by identification information or the like.

ここで、関連情報とは、画像検索の結果の一つとしてクエリ画像処理装置10に返信される情報である。本実施の形態の画像検索システム100は、上述のようにポスター画像を検索するものであり、関連情報としては、そのポスターによる告知の詳細内容ないし、そのような詳細内容を掲示したウェブサイトへのアクセス方法(URL等)が含まれる。即ち、クエリ画像処理装置10のユーザは、例えば、街中であるポスターを見かけたときに、そのポスターを撮影して検索サーバ装置20に詳細内容をリクエストすると、検索サーバ装置20は、その撮影画像に対応する参照画像を検索して、検出された参照画像に関連付けられた関連情報をユーザに返信する。これによって、ユーザは、撮影したポスターの詳細内容を知ることができる。   Here, the related information is information returned to the query image processing apparatus 10 as one of the image search results. The image search system 100 according to the present embodiment searches for a poster image as described above, and as related information, detailed information on the notification by the poster or a website to which such detailed content is posted. An access method (URL or the like) is included. That is, when the user of the query image processing apparatus 10 sees a poster in the city, for example, if the user captures the poster and requests the search server apparatus 20 for detailed contents, the search server apparatus 20 adds the captured image to the captured image. A corresponding reference image is searched, and related information associated with the detected reference image is returned to the user. Thereby, the user can know the detailed contents of the photographed poster.

検索サーバ装置20は、さらに画像検索を行うための構成として、通信部24、比較マッチング部25、位置情報変換部26、変換行列算出部27、及び射影判定部28を備えている。比較マッチング部25、位置情報変換部26、変換行列算出部27、及び射影判定部28からなる構成は、画像検索部に相当する。通信部24は、クエリ画像処理装置10から送信されてきた特徴点データを受信する。   The search server device 20 further includes a communication unit 24, a comparison matching unit 25, a position information conversion unit 26, a conversion matrix calculation unit 27, and a projection determination unit 28 as a configuration for performing an image search. A configuration including the comparison matching unit 25, the position information conversion unit 26, the conversion matrix calculation unit 27, and the projection determination unit 28 corresponds to an image search unit. The communication unit 24 receives feature point data transmitted from the query image processing apparatus 10.

比較マッチング部25は、通信部24にて受信した特徴点データと、保存されているすべての参照画像のすべての特徴点データとを比較して、その一致度を示すマッチングスコアを算出する。クエリ画像及び参照画像の局所画像特徴量はいずれも同じビット数にバイナリコード化されているので、それらのハミング距離を計算することで高速に一致度を計算できる。比較マッチング部25は、バイナリコードの一致度の評価にハミング距離を採用する。   The comparison matching unit 25 compares the feature point data received by the communication unit 24 with all feature point data of all stored reference images, and calculates a matching score indicating the degree of matching. Since the local image feature quantities of the query image and the reference image are both binary-coded into the same number of bits, the degree of coincidence can be calculated at high speed by calculating their Hamming distance. The comparison matching unit 25 employs a Hamming distance for evaluating the degree of coincidence of the binary code.

比較マッチング部25は、特徴点の位置に関わらず、一致度が最も高い特徴点の組、換言すれば局所画像特徴量の差が最も小さい特徴点の組を対応点としてカウントする。こうすることで、クエリ画像のすべての特徴点がいずれかの参照画像のいずれかの特徴点と対応すると判断され、即ちクエリ画像のすべての特徴点がいずれかの参照画像に投票されることになる。   Regardless of the position of the feature point, the comparison matching unit 25 counts the set of feature points having the highest degree of matching, in other words, the set of feature points having the smallest difference in local image feature amounts as the corresponding points. In this way, it is determined that all feature points of the query image correspond to any feature point of any reference image, that is, all feature points of the query image are voted for any reference image. Become.

図3は、比較マッチング部25における比較マッチングの例を示す図である。図3の例では、クエリ画像Cから11個の特徴点が検出されてその局所画像特徴量が抽出され、参照画像R1〜R4において、それぞれ図3に示す特徴点が検出されてその局所画像特徴量が抽出されている。なお、実際には1つの画像からは数百の特徴点が検出されるが、図3では説明の簡略化のために一部の特徴点のみを示している。   FIG. 3 is a diagram illustrating an example of comparison matching in the comparison matching unit 25. In the example of FIG. 3, eleven feature points are detected from the query image C, and the local image feature amounts are extracted. In the reference images R1 to R4, the feature points shown in FIG. The amount has been extracted. In practice, several hundred feature points are detected from one image, but only some feature points are shown in FIG. 3 for the sake of simplicity.

図3において、一致度が最も高い特徴点(以下単に「対応点」という。)の組を線で連結して示している。図3の例では、対応点は、参照画像R1〜R3から、それぞれ5点、2点、4点検出され、参照画像R4からは対応点は検出されていない。比較マッチング部25は、対応点の数が所定の数以上の画像を対応画像候補として検出する。図3の例では、比較マッチング部25は、対応点の数が3以上である参照画像を対応画像候補として検出する。その結果、参照画像R1及びR3が対応画像候補として検出される。   In FIG. 3, sets of feature points having the highest degree of coincidence (hereinafter simply referred to as “corresponding points”) are connected by lines. In the example of FIG. 3, the corresponding points are detected from the reference images R1 to R3 at 5 points, 2 points, and 4 points, respectively, and no corresponding points are detected from the reference image R4. The comparison matching unit 25 detects an image having a predetermined number of corresponding points or more as a corresponding image candidate. In the example of FIG. 3, the comparison matching unit 25 detects a reference image having three or more corresponding points as a corresponding image candidate. As a result, reference images R1 and R3 are detected as corresponding image candidates.

これらの対応画像候補の対応点について、後段の処理で、位置情報も対応しており、真の対応点であるか否かの判定がされ、位置情報も対応していると判定された対応点の数が最も多い参照画像を、クエリ画像の対応画像であると決定する。以下、位置情報が対応しているか否かの判定をする構成を説明する。   With respect to the corresponding points of these corresponding image candidates, in the subsequent processing, the position information also corresponds, it is determined whether or not it is a true corresponding point, and the corresponding points that are determined to correspond also to the position information The reference image with the largest number of is determined to be the corresponding image of the query image. Hereinafter, a configuration for determining whether or not position information corresponds will be described.

位置情報変換部26は、比較マッチング部25から取得したクエリ画像及び対応画像候補の特徴点の位置情報を変換する。位置情報変換部26は、特徴点位置粗量子化部34にて行った位置情報の粗量子化と逆の処理を行うことで位置情報を変換する。このとき、位置情報変換部26は、画像に付随している情報のうち、画像サイズ及び粗量子化レベルの情報を用いて、粗量子化された特徴点の位置情報を変換する。   The position information conversion unit 26 converts the position information of the feature points of the query image and the corresponding image candidate acquired from the comparison matching unit 25. The position information conversion unit 26 converts the position information by performing processing reverse to the rough quantization of the position information performed by the feature point position rough quantization unit 34. At this time, the position information conversion unit 26 converts the position information of the coarsely quantized feature points using the information of the image size and the coarse quantization level among the information attached to the image.

上述の例では、粗量子化された特徴点の位置座標は(17, 40)であり、画像サイズが320×240であり、粗量子化レベルは256である。この例では、変換後の位置のX座標は(17×(320/256)=)22.2500であり、Y座標は(40×(240/256)=)37.5000であり、変換後の位置座標は(22.2500,37.5000)となる。なお、もとの座標は(21.568987・・・, 37.908325・・・)であるので、粗量子化及びその後の復元による若干の誤差は生じるが、位置の一致を判定する際の許容誤差をこの誤差より十分に大きくとれば問題はない。   In the above example, the position coordinates of the coarsely quantized feature points are (17, 40), the image size is 320 × 240, and the coarse quantization level is 256. In this example, the X coordinate of the converted position is (17 × (320/256) =) 22.2500, the Y coordinate is (40 × (240/256) =) 37.5000, The position coordinates are (22.2500, 37.5000). Since the original coordinates are (21.568987... 37.908325...), A slight error occurs due to coarse quantization and subsequent restoration. There is no problem if the error is sufficiently larger than this error.

このようにしてクエリ画像及び対応画像候補のすべての対応点の位置情報が変換されると、変換行列算出部27は、対応画像候補ごとに、対応点を射影するための変換行列を算出する。具体的には、変換行列算出部27は、RANSAC法を用いて、変換行列としてホモグラフィ行列を算出する。具体的には以下のとおりである。   When the position information of all corresponding points of the query image and the corresponding image candidate is converted in this way, the conversion matrix calculating unit 27 calculates a conversion matrix for projecting the corresponding point for each corresponding image candidate. Specifically, the transformation matrix calculation unit 27 calculates a homography matrix as a transformation matrix using the RANSAC method. Specifically, it is as follows.

図4は、変換行列算出部27における変換行列の算出のフロー図である。変換行列算出部27は、対応画像候補ごとに、図4のフロー図の処理を行い、対応画像候補ごとに変換行列を求める。いま、クエリ画像とある対応画像候補との間に対応点がn組あるとし、クエリ画像の対応点をai(xi,yi)、対応画像候補の対応点をAi(Xi,Yi)とする(i=1〜n)。このとき、被写体が2次元平面であると仮定すると、以下の(3)を満たす変換行列Hが存在する。

Figure 0006035173
FIG. 4 is a flowchart of the conversion matrix calculation in the conversion matrix calculation unit 27. The conversion matrix calculation unit 27 performs the processing of the flowchart of FIG. 4 for each corresponding image candidate, and obtains a conversion matrix for each corresponding image candidate. Assume that there are n pairs of corresponding points between a query image and a corresponding image candidate. The corresponding points of the query image are a i (x i , y i ), and the corresponding points of the corresponding image candidate are A i (X i , Y i ) (i = 1 to n). At this time, assuming that the subject is a two-dimensional plane, there exists a transformation matrix H that satisfies the following (3).
Figure 0006035173

(3)を展開すると、以下の(4)が得られる。

Figure 0006035173
(4)においてwを消去すると以下の(5)の連立方程式が得られる。
Figure 0006035173
When (3) is expanded, the following (4) is obtained.
Figure 0006035173
When w is eliminated in (4), the following simultaneous equations (5) are obtained.
Figure 0006035173

1組の対応点の組について、上記の(5)の2つの連立方程式が得られることから、4組の対応点の組があれば8つの連立方程式が得られ、これを解くことで変換行列Hに含まれる8つの要素(h11、h12、h13、h21、h22、h23、h31、h32)を求めることができる。 Since the two simultaneous equations of (5) above are obtained for one set of corresponding points, if there are four sets of corresponding points, eight simultaneous equations are obtained, and by solving this, a transformation matrix is obtained. Eight elements (h 11 , h 12 , h 13 , h 21 , h 22 , h 23 , h 31 , h 32 ) included in H can be obtained.

そこで、変換行列算出部27は、クエリ画像と対応画像候補との間のn組の対応点から任意の4組の対応点を選択して、上記のとおりに変換行列Hを求める(ステップS41)。次に、変換行列算出部27は、この変換行列Hを用いて、n組のすべての対応点の組について、射影誤差を求める(ステップS42)。具体的には、以下の(6)によって、各対応点の組の射影誤差eiを算出する。

Figure 0006035173
Therefore, the conversion matrix calculation unit 27 selects any four sets of corresponding points from the n sets of corresponding points between the query image and the corresponding image candidate, and obtains the conversion matrix H as described above (step S41). . Next, the transformation matrix calculation unit 27 uses this transformation matrix H to obtain a projection error for all n pairs of corresponding points (step S42). Specifically, the projection error e i of each pair of corresponding points is calculated by the following (6).
Figure 0006035173

次に、変換行列算出部27は、各対応点について、各射影誤差eiが所定の閾値(許容誤差)より小さいインライア(inlier)か、各射影誤差eiが所定の閾値以上であってアウトライア(outlier、外れ値)であるかを判定し、インライアの総数をカウントし、インライアの総数が増加したか否かを判断する(ステップS43)。インライアの総数が増加したときは(ステップS43でYES)、そのときの変換行列Hで、変換行列Hを更新する(ステップS44)。インライアの総数が増加していないときは(ステップS43でNO)、変換行列Hは更新しない。 Next, the transformation matrix calculation unit 27, for each corresponding point, the projection error e i is a predetermined threshold (tolerance) is smaller than inliers (inliers) or, each project errors e i is equal to or greater than the predetermined threshold out It is determined whether it is an outlier, the total number of inliers is counted, and it is determined whether the total number of inliers has increased (step S43). When the total number of inliers increases (YES in step S43), the transformation matrix H is updated with the transformation matrix H at that time (step S44). When the total number of inliers has not increased (NO in step S43), the transformation matrix H is not updated.

次に、ステップS41〜44の処理が規定回数に達しているかを判断し(ステップS45)、達していなければ(ステップS45にてNO)、ステップS41〜S43を繰り返す。規定回数に達した場合には(ステップS45にてYES)、そのときの変換行列Hを、クエリ画像を当該対応画像候補に変換するための変換行列と決定して出力する(ステップS46)。   Next, it is determined whether or not the processing of steps S41 to 44 has reached the specified number of times (step S45), and if not (NO in step S45), steps S41 to S43 are repeated. When the specified number of times has been reached (YES in step S45), the conversion matrix H at that time is determined as a conversion matrix for converting the query image into the corresponding image candidate and output (step S46).

射影判定部28は、変換行列算出部27にて各対応画像候補について決定された変換行列Hでもって対応画像候補のすべての対応点を射影して、クエリ画像の対応点との間の射影誤差を求める。各対応点について、射影誤差が所定の閾値(許容誤差)より小さい(インライア)か、射影誤差が所定の閾値以上である(アウトライア)であるかを判定し、インライアの総数を最終的な対応点の数とする。インライアの対応点の組は、即ち幾何的整合性を満足する対応点の組である。射影判定部28は、このような処理をすべての対応画像候補について行って、最終的な対応点が最も多い対応画像候補を、クエリ画像中の被写体と同じ被写体を含む対応画像であると判定する。   The projection determining unit 28 projects all corresponding points of the corresponding image candidate with the conversion matrix H determined for each corresponding image candidate by the conversion matrix calculating unit 27, and the projection error between the corresponding points of the query image. Ask for. For each corresponding point, it is determined whether the projection error is smaller than the predetermined threshold (allowable error) (inlier) or the projection error is equal to or greater than the predetermined threshold (outlier), and the total number of inliers is finally determined The number of points. A set of corresponding points of the inlier is a set of corresponding points satisfying the geometric consistency. The projection determination unit 28 performs such processing on all corresponding image candidates, and determines that the corresponding image candidate having the largest final corresponding points is a corresponding image including the same subject as the subject in the query image. .

射影判定部28は、対応画像であると判定した参照画像に関連付けられた関連情報を画像データベース23から読み出して、通信部24に出力する。通信部24は、クエリ画像処理装置10に関連情報を送信する。これによって、クエリ画像処理装置10のユーザは、自らが撮影した被写体に関する関連情報を検索サーバ装置20から取得できる。   The projection determining unit 28 reads related information associated with the reference image determined to be a corresponding image from the image database 23 and outputs the related information to the communication unit 24. The communication unit 24 transmits related information to the query image processing apparatus 10. As a result, the user of the query image processing apparatus 10 can acquire related information related to the subject photographed by the user from the search server apparatus 20.

以上説明したとおり、本実施の形態では、クエリ画像のデータを送信してクエリ画像に関する関連情報を受信するクエリ画像処理装置10、及びクエリ画像を受信してその対応画像を検索し、対応画像に関連付けられた関連情報をクエリ画像処理装置10に返信する検索サーバ装置20において、局所画像特徴量を抽出した特徴点の位置情報の粗量子化してデータ量を削減する構成を採用している。   As described above, in the present embodiment, the query image processing apparatus 10 that transmits query image data and receives related information related to the query image, and receives the query image and searches for the corresponding image. In the search server device 20 that returns the associated related information to the query image processing device 10, a configuration is adopted in which the amount of data is reduced by coarse quantization of the position information of the feature points extracted from the local image feature amounts.

クエリ画像処理装置10にて特徴点の位置情報のデータ量を削減することで、通信遅延を軽減ないし防止し、通信に係るコストを削減できるという利点がある。例えば、画像1枚あたり平均500点の特徴点が検出されるとし、その回線速度が1Mbpsであるとすると、画像1枚のすべての特徴点データを送信するのに要する時間は、データを圧縮しないとすると、(500×(128×4+4+8+4)/125000=)約2秒となり、局所画像特徴量のみをバイナリコードに変換して圧縮した場合は約0.08秒となり、さらに特徴点の位置情報を粗量子化して圧縮した場合は約0.02秒となる。   By reducing the amount of feature point position information in the query image processing apparatus 10, there is an advantage that communication delay can be reduced or prevented, and communication costs can be reduced. For example, if 500 average feature points are detected per image and the line speed is 1 Mbps, the time required to transmit all feature point data for one image is not compressed. Then, (500 × (128 × 4 + 4 + 8 + 4) / 125000 =) is about 2 seconds, and when only the local image feature amount is converted into a binary code and compressed, it becomes about 0.08 second, and the position information of the feature point is further obtained. When coarse quantization and compression are performed, it takes about 0.02 seconds.

また、検索サーバ装置20にて特徴点の位置情報のデータ量を削減することで、大量の参照画像を保存しておくための保存ストレージの容量を小さくでき、あるいは、限られた容量の保存ストレージにより多くの参照画像を保存できるという利点がある。例えば、1000枚の参照画像について、それぞれ500点の特徴点が検出され、画像1枚あたり平均500点の特徴点が検出されると、1000枚の参照画像の特徴点データの保存に必要な容量は、(1000×500×(128×4+4+8+4)=)264Mバイトとなり、局所画像特徴量のみをバイナリコードに変換して圧縮した場合は、(1000×500×(4+4+8+4)=)10Mバイトとなり、さらに特徴点の位置情報を粗量子化して圧縮した場合は(1000×500×(4+2)=)3Mバイトとなる。   Further, by reducing the data amount of the feature point position information in the search server device 20, the capacity of the storage for storing a large amount of reference images can be reduced, or the storage of a limited capacity There is an advantage that more reference images can be stored. For example, if 1000 feature points are detected for each of 1000 reference images, and an average of 500 feature points per image is detected, the capacity required for storing the feature point data of 1000 reference images Is (1000 × 500 × (128 × 4 + 4 + 8 + 4) =) 264 Mbytes, and when only the local image feature amount is converted into binary code and compressed, it becomes (1000 × 500 × (4 + 4 + 8 + 4) =) 10 Mbytes, When the positional information of the feature points is coarsely quantized and compressed, (1000 × 500 × (4 + 2) =) 3 MB.

以上のように、クエリ画像処理装置10及び検索サーバ装置20のそれぞれにおいて、局所画像特徴量を抽出した特徴点の位置情報の粗量子化してデータ量を削減する構成を採用したことによる効果が得られるので、クエリ画像処理装置10及び検索サーバ装置20のいずれか一方のみが局所画像特徴量を抽出した特徴点の位置情報の粗量子化してデータ量を削減する構成を採用してもよい。また、本願発明者らの実験によって、少なくとも上記のように位置情報を粗量子化下場合にも、対応画像の検索結果に影響が出ないことが確認された。   As described above, in each of the query image processing device 10 and the search server device 20, an effect is obtained by adopting a configuration in which the amount of data is reduced by rough quantization of the position information of the feature points from which the local image feature values are extracted. Therefore, only one of the query image processing device 10 and the search server device 20 may employ a configuration in which the amount of data is reduced by coarsely quantizing the position information of feature points obtained by extracting local image feature amounts. In addition, it has been confirmed by experiments by the inventors of the present application that the search result of the corresponding image is not affected even when the position information is subjected to coarse quantization at least as described above.

なお、検索サーバ装置20は、最終的な対応点が最も多い参照画像を対応画像と判定するだけでなく、最終的な対応点の数が2番目、3番目、・・・に多い参照画像についても、最終的な対応点が最も多い参照画像とともに、又はクエリ画像処理装置10からのリクエストに応じて、関連情報を画像データベース23から読み出してクエリ画像処理装置10に送信してよい。   Note that the search server device 20 not only determines the reference image with the most final corresponding points as the corresponding image, but also the reference images with the second largest number of corresponding points in the second, third,. Alternatively, the related information may be read from the image database 23 and transmitted to the query image processing apparatus 10 together with the reference image having the most final corresponding points or in response to a request from the query image processing apparatus 10.

また、上記の実施の形態では、比較マッチング部25において対応点が所定の数以上ある参照画像のみを対応画像候補として、位置情報のマッチングを行って、最終的な対応点を求めたが、対応点を少なくとも1つ含むすべての参照画像を対応画像候補としてもよい。   In the above embodiment, the comparison matching unit 25 uses only reference images having a predetermined number or more of corresponding points as corresponding image candidates to perform position information matching and obtain final corresponding points. All reference images including at least one point may be set as corresponding image candidates.

また、上記の実施の形態では、比較マッチング部25は、局所画像特徴量の差が最も小さい特徴点の組を対応点としてカウントしたが、比較マッチングの方法はこれに限られない。例えば、比較マッチング部25は、クエリ画像Cのすべての特徴点の局所画像特徴量と、参照画像R1〜R4に含まれるすべての特徴点の局所画像特徴量とを比較し、その一致度が所定の閾値を上回る特徴点の組、即ち局所画像特徴量の差が所定の誤差範囲内にある特徴点の組を検出してもよい。なお、この場合には、クエリ画像の各特徴点は、複数の参照画像に投票されることがあり、また、いずれの参照画像にも投票されないこともある。   In the above-described embodiment, the comparison matching unit 25 counts a pair of feature points having the smallest difference in local image feature values as corresponding points, but the method of comparison matching is not limited to this. For example, the comparison matching unit 25 compares the local image feature amounts of all feature points of the query image C with the local image feature amounts of all feature points included in the reference images R1 to R4, and the degree of coincidence is predetermined. A set of feature points that exceed the threshold value, that is, a set of feature points in which the difference in the local image feature amount is within a predetermined error range may be detected. In this case, each feature point of the query image may be voted for a plurality of reference images, and may not be voted for any reference image.

また、上記の実施の形態において、粗量子化レベル決定部15は、画像サイズに応じて粗量子化レベルを決定してもよい。この場合に、粗量子化レベルが画像サイズと同じであってもよい。即ち、特徴点位置粗量子部34は、特徴点検出部31にて実数で得られた特徴点位置のX座標及びY座標を切り下げ、四捨五入、又は切り上げによって整数にすることで特徴点位置を粗量子化してよい。例えば、上記の実施の形態で説明したように特徴点の位置座標が(21.568987・・・, 37.908325・・・)である場合には、特徴点位置粗量子化部34は、これを四捨五入して、粗量子化された特徴点の位置座標(22,38)としてもよい。   In the above embodiment, the coarse quantization level determination unit 15 may determine the coarse quantization level according to the image size. In this case, the coarse quantization level may be the same as the image size. That is, the feature point position rough quantum unit 34 roughly rounds the X and Y coordinates of the feature point position obtained by the feature point detection unit 31 to a whole number by rounding down or rounding up the feature point position. It may be quantized. For example, when the position coordinates of the feature points are (21.568987 ..., 37.908325 ...) as described in the above embodiment, the feature point position coarse quantization unit 34 May be rounded off to obtain the position coordinates (22, 38) of the coarsely quantized feature points.

また、粗量子化レベル決定部15は、クエリ画像処理装置10における処理状態、具体的にはメモリの利用可能容量、及び/又は計算速度(演算処理装置の利用率)を検出して、その検出値に基づいて決定されてもよい。   The coarse quantization level determination unit 15 detects the processing state in the query image processing device 10, specifically, the available memory capacity and / or the calculation speed (utilization rate of the arithmetic processing device), and detects the detected state. It may be determined based on the value.

また、上記の実施の形態では、変換行列Hは、参照画像の特徴点を射影する行列であり、参照画像の特徴点を変換行列Hで射影して、クエリ画像の対応する特徴点との射影誤差を評価したが、逆に、クエリ画像の特徴点を参照画像の特徴点に射影する行列を変換行列として、クエリ画像の特徴点を変換行列で射影して、参照画像の対応する特徴点との射影誤差を評価してもよい。   Further, in the above embodiment, the transformation matrix H is a matrix that projects the feature points of the reference image, and the feature points of the reference image are projected by the transformation matrix H and projected with the corresponding feature points of the query image. Although the error was evaluated, conversely, the matrix that projects the feature points of the query image to the feature points of the reference image is used as a transformation matrix, the feature points of the query image are projected by the transformation matrix, The projection error may be evaluated.

本発明は、局所画像特徴量が抽出された特徴点の位置情報が粗量子化されるので、位置情報のデータ量の割合を小さくでき、それによって画像検索に用いるデータの量を抑えることができるという効果を有し、大量の参照画像の中からクエリ画像に対応する対応画像を検索する検索システム及び画像検索方法等として有用である。   According to the present invention, since the position information of the feature point from which the local image feature amount is extracted is coarsely quantized, the ratio of the data amount of the position information can be reduced, thereby suppressing the amount of data used for the image search. It is useful as a search system and an image search method for searching for a corresponding image corresponding to a query image from a large number of reference images.

100 画像検索システム
10 クエリ画像処理装置
11 撮像部
12 特徴点データ生成部
13 通信部
14 通信状態測定部
15 粗量子化レベル決定部
20 検索サーバ装置
21 参照画像取得部
22 特徴点データ生成部
23 画像データベース
24 通信部
25 比較マッチング部
26 位置情報変換部
27 変換行列算出部
28 射影判定部
31 特徴点検出部
32 局所画像特徴量抽出部
33 バイナリ変換部
34 特徴点位置粗量子化部
35 データ合成部
DESCRIPTION OF SYMBOLS 100 Image search system 10 Query image processing apparatus 11 Imaging part 12 Feature point data generation part 13 Communication part 14 Communication state measurement part 15 Coarse quantization level determination part 20 Search server apparatus 21 Reference image acquisition part 22 Feature point data generation part 23 Image Database 24 Communication unit 25 Comparison matching unit 26 Location information conversion unit 27 Transformation matrix calculation unit 28 Projection determination unit 31 Feature point detection unit 32 Local image feature amount extraction unit 33 Binary conversion unit 34 Feature point position coarse quantization unit 35 Data synthesis unit

Claims (19)

クエリ画像処理装置と検索サーバ装置とからなる画像検索システムであって、
前記クエリ画像処理装置は、
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部と、
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部と、
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを送信するクエリ画像処理装置側通信部と、
を備え、
前記検索サーバ装置は、
前記特徴点データを受信する検索サーバ装置側通信部と、
受信した前記特徴点データに含まれる前記局所画像特徴量及び前記位置情報を用いて、複数の参照画像から、前記クエリ画像に対応する対応画像を検索する画像検索部と、
を備え、
前記画像検索部は、粗量子化された前記位置情報を元の画像サイズの位置情報に変換する位置情報変換部をさらに備えたことを特徴とする画像検索システム。
An image search system comprising a query image processing device and a search server device,
The query image processing device includes:
A local image feature amount extraction unit that extracts local image feature amounts of a plurality of feature points in the query image;
A feature point position coarse quantization unit for coarsely quantizing the position information of the feature points;
A query image processing device side communication unit for transmitting feature point data including the local image feature value and the coarsely quantized position information;
With
The search server device
A search server device side communication unit for receiving the feature point data;
An image search unit that searches for a corresponding image corresponding to the query image from a plurality of reference images using the local image feature amount and the position information included in the received feature point data;
With
The image retrieval unit, crude quantized images retrieval system that is characterized in that further comprising a position information converting unit that converts the position information of the original image size the position information.
クエリ画像処理装置と検索サーバ装置とからなる画像検索システムであって、
前記クエリ画像処理装置は、
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部と、
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部と、
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを送信するクエリ画像処理装置側通信部と、
を備え、
前記検索サーバ装置は、
前記特徴点データを受信する検索サーバ装置側通信部と、
受信した前記特徴点データに含まれる前記局所画像特徴量及び前記位置情報を用いて、複数の参照画像から、前記クエリ画像に対応する対応画像を検索する画像検索部と、
を備え、
前記特徴点位置粗量子化部は、前記粗量子化を行う際の粗量子化レベルを変更可能であることを特徴とする画像検索システム。
An image search system comprising a query image processing device and a search server device,
The query image processing device includes:
A local image feature amount extraction unit that extracts local image feature amounts of a plurality of feature points in the query image;
A feature point position coarse quantization unit for coarsely quantizing the position information of the feature points;
A query image processing device side communication unit for transmitting feature point data including the local image feature value and the coarsely quantized position information;
With
The search server device
A search server device side communication unit for receiving the feature point data;
An image search unit for searching for a corresponding image corresponding to the query image from a plurality of reference images using the local image feature amount and the position information included in the received feature point data;
With
The feature point position rough quantization unit images retrieval system that characterized in that it is changing the coarse quantization levels when performing the coarse quantization.
前記特徴点位置粗量子化部は、前記クエリ画像処理装置側通信部の通信状態に応じて前記粗量子化レベルを変更することを特徴とする請求項に記載の画像検索システム。 The image search system according to claim 2 , wherein the feature point position coarse quantization unit changes the coarse quantization level according to a communication state of the query image processing device side communication unit. 前記特徴点位置粗量子化部は、前記クエリ画像処理装置の処理状態に応じて前記粗量子化レベルを変更することを特徴とする請求項に記載の画像検索システム。 The image search system according to claim 2 , wherein the feature point position coarse quantization unit changes the coarse quantization level according to a processing state of the query image processing apparatus. 前記特徴点位置粗量子化部は、前記クエリ画像の画像サイズに応じて前記粗量子化レベルを変更することを特徴とする請求項に記載の画像検索システム。 The image search system according to claim 2 , wherein the feature point position coarse quantization unit changes the coarse quantization level according to an image size of the query image. クエリ画像処理装置と検索サーバ装置とからなる画像検索システムであって、
前記クエリ画像処理装置は、
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部と、
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部と、
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを送信するクエリ画像処理装置側通信部と、
を備え、
前記検索サーバ装置は、
前記特徴点データを受信する検索サーバ装置側通信部と、
受信した前記特徴点データに含まれる前記局所画像特徴量及び前記位置情報を用いて、複数の参照画像から、前記クエリ画像に対応する対応画像を検索する画像検索部と、
を備え、
前記特徴点位置粗量子化部は、前記特徴点の位置情報を2バイトのデータ量になるように粗量子化することを特徴とする画像検索システム。
An image search system comprising a query image processing device and a search server device,
The query image processing device includes:
A local image feature amount extraction unit that extracts local image feature amounts of a plurality of feature points in the query image;
A feature point position coarse quantization unit for coarsely quantizing the position information of the feature points;
A query image processing device side communication unit for transmitting feature point data including the local image feature value and the coarsely quantized position information;
With
The search server device
A search server device side communication unit for receiving the feature point data;
An image search unit for searching for a corresponding image corresponding to the query image from a plurality of reference images using the local image feature amount and the position information included in the received feature point data;
With
The feature point position coarse quantization unit coarsely quantizes the position information of the feature point so as to have a data amount of 2 bytes.
前記検索サーバ装置は、前記複数の参照画像中の複数の特徴点の局所画像特徴量及び位置情報を関連付けて保存する画像保存部をさらに備え、
前記画像検索部は、
前記クエリ画像の前記局所画像特徴量と前記参照画像の前記特徴点の局所画像特徴量とを比較することにより、互いに対応する特徴点の組を求める比較マッチング部と、
前記クエリ画像の前記位置情報及び前記参照画像の前記位置情報のいずれか一方を他方に射影することにより、互いに対応する特徴点の組を求める射影判定部と、
を備え、前記比較マッチング部にて対応すると判断され、かつ、前記射影判定部にて対応すると判断された特徴点を最も多く含む前記参照画像を前記対応画像とすることを特徴とする請求項1ないしのいずれか一項に記載の画像検索システム。
The search server device further includes an image storage unit that stores local image feature amounts and position information of a plurality of feature points in the plurality of reference images in association with each other,
The image search unit
A comparison matching unit for obtaining a set of feature points corresponding to each other by comparing the local image feature amount of the query image and the local image feature amount of the feature point of the reference image;
A projection determination unit for obtaining a pair of feature points corresponding to each other by projecting one of the position information of the query image and the position information of the reference image to the other;
The reference image including the largest number of feature points determined to correspond by the comparison matching unit and determined to correspond by the projection determination unit is defined as the corresponding image. 7. The image retrieval system according to any one of items 6 to 6 .
クエリ画像処理装置と検索サーバ装置とからなる画像検索システムであって、
前記クエリ画像処理装置は、クエリ画像中の複数の特徴点の局所画像特徴量及び位置情報を含む特徴点データを送信するクエリ画像処理装置側通信部を備え、
前記検索サーバ装置は、
前記特徴点データを受信する検索サーバ装置側通信部と、
複数の参照画像中の複数の特徴点の局所画像特徴量及び粗量子化された位置情報を関連付けて保存する画像保存部と、
前記クエリ画像の前記局所画像特徴量と前記参照画像の特徴点の前記局所画像特徴量とを比較することにより、互いに対応する特徴点の組を求める比較マッチング部と、
前記クエリ画像の前記位置情報及び前記参照画像の前記位置情報のいずれか一方を他方に射影することにより、互いに対応する特徴点の組を求める射影判定部と、
前記参照画像の粗量子化された前記位置情報を元の画像サイズの位置情報に変換する位置情報変換部と、
を備え、前記比較マッチング部にて対応すると判断され、かつ、前記射影判定部にて対応すると判断された特徴点を最も多く含む前記参照画像を、前記クエリ画像に対応する対応画像であると判定する
ことを特徴とする画像検索システム。
An image search system comprising a query image processing device and a search server device,
The query image processing device includes a query image processing device side communication unit that transmits feature point data including local image feature amounts and position information of a plurality of feature points in the query image,
The search server device
A search server device side communication unit for receiving the feature point data;
An image storage unit that associates and stores local image feature quantities and coarsely quantized position information of a plurality of feature points in a plurality of reference images;
A comparison matching unit for determining a set of feature points corresponding to each other by comparing the local image feature amount of the query image and the local image feature amount of the feature point of the reference image;
A projection determination unit for obtaining a pair of feature points corresponding to each other by projecting one of the position information of the query image and the position information of the reference image to the other;
A position information conversion unit that converts the position information roughly quantized of the reference image into position information of an original image size;
The reference image including the most feature points determined to correspond by the comparison matching unit and determined to correspond by the projection determination unit is determined to be a corresponding image corresponding to the query image. An image search system characterized by
前記クエリ画像処理装置は、撮影によって前記クエリ画像を生成する撮像部をさらに備えた携帯情報端末であることを特徴とする請求項1ないしのいずれか一項に記載の画像検索システム。 The image search system according to any one of claims 1 to 8 , wherein the query image processing device is a portable information terminal further including an imaging unit that generates the query image by photographing. 前記検索サーバ装置側通信部は、前記対応画像及び/又は前記対応画像に関連付けられた関連情報を送信し、
前記クエリ画像処理装置側通信部は、前記対応画像及び/又は前記関連情報を受信することを特徴とする請求項1ないしのいずれか一項に記載の画像検索システム。
The search server device side communication unit transmits the corresponding image and / or related information associated with the corresponding image,
The query image processing apparatus side communication unit, the corresponding image and / or image retrieval system according to any one of claims 1 to 9, characterized in that to receive the relevant information.
クエリ画像処理装置と検索サーバ装置とからなる画像検索システムにおける前記クエリ画像処理装置であって、
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部と、
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部と、
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを、前記検索サーバ装置に送信するクエリ画像処理装置側通信部と、
を備え
前記特徴点位置粗量子化部は、前記粗量子化を行う際の粗量子化レベルを変更可能であることを特徴とするクエリ画像処理装置。
The query image processing device in an image search system comprising a query image processing device and a search server device,
A local image feature amount extraction unit that extracts local image feature amounts of a plurality of feature points in the query image;
A feature point position coarse quantization unit for coarsely quantizing the position information of the feature points;
A query image processing device side communication unit for transmitting feature point data including the local image feature amount and the coarsely quantized position information to the search server device;
Equipped with a,
The query image processing apparatus, wherein the feature point position coarse quantization unit is capable of changing a coarse quantization level when performing the coarse quantization .
クエリ画像処理装置と検索サーバ装置とからなる画像検索システムにおける前記クエリ画像処理装置であって、  The query image processing device in an image search system comprising a query image processing device and a search server device,
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部と、  A local image feature amount extraction unit that extracts local image feature amounts of a plurality of feature points in the query image;
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部と、  A feature point position coarse quantization unit for coarsely quantizing the position information of the feature points;
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを、前記検索サーバ装置に送信するクエリ画像処理装置側通信部と、  A query image processing device side communication unit for transmitting feature point data including the local image feature amount and the coarsely quantized position information to the search server device;
を備え、  With
前記特徴点位置粗量子化部は、前記特徴点の位置情報を2バイトのデータ量になるように粗量子化することを特徴とするクエリ画像処理装置。  The feature point position coarse quantization unit coarsely quantizes the feature point position information so as to have a data amount of 2 bytes.
クエリ画像処理装置と検索サーバ装置とからなる画像検索システムにおける前記検索サーバ装置であって、
前記クエリ画像処理装置から、クエリ画像中の複数の特徴点の局所画像特徴量及び位置情報を含む特徴点データを受信する通信部、と、
複数の参照画像中の複数の特徴点の局所画像特徴量及び粗量子化された位置情報を関連付けて保存する画像保存部と、
前記クエリ画像の前記局所画像特徴量と前記参照画像の特徴点の前記局所画像特徴量とを比較することにより、互いに対応する特徴点の組を求める比較マッチング部と、
前記クエリ画像の前記位置情報及び前記参照画像の前記位置情報のいずれか一方を他方に射影することにより、互いに対応する特徴点の組を求める射影判定部と、
前記参照画像の粗量子化された前記位置情報を元の画像サイズの位置情報に変換する位置情報変換部と、
を備え、前記比較マッチング部にて対応すると判断され、かつ、前記射影判定部にて対応すると判断された特徴点を最も多く含む前記参照画像を、前記クエリ画像に対応する対応画像であると判定することを特徴とする検索サーバ装置。
The search server device in an image search system comprising a query image processing device and a search server device,
A communication unit that receives feature point data including local image feature amounts and position information of a plurality of feature points in the query image from the query image processing device;
An image storage unit that associates and stores local image feature quantities and coarsely quantized position information of a plurality of feature points in a plurality of reference images;
A comparison matching unit for determining a set of feature points corresponding to each other by comparing the local image feature amount of the query image and the local image feature amount of the feature point of the reference image;
A projection determination unit for obtaining a pair of feature points corresponding to each other by projecting one of the position information of the query image and the position information of the reference image to the other;
A position information conversion unit that converts the position information roughly quantized of the reference image into position information of an original image size;
The reference image including the most feature points determined to correspond by the comparison matching unit and determined to correspond by the projection determination unit is determined to be a corresponding image corresponding to the query image. And a search server device.
クエリ画像処理装置と検索サーバ装置とからなる画像検索システムにおける画像検索方法であって、
前記クエリ画像処理装置にて実行される
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出ステップと、
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化ステップと、
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを送信するクエリ画像処理装置側通信ステップと、
前記検索サーバ装置にて実行される
前記特徴点データを受信する検索サーバ装置側通信ステップと、
受信した前記特徴点データに含まれる前記局所画像特徴量及び前記位置情報を用いて、複数の参照画像から、前記クエリ画像に対応する対応画像を検索する画像検索ステップと、
を含み、
前記画像検索ステップは、粗量子化された前記位置情報を元の画像サイズの位置情報に変換する位置情報変換ステップを含むことを特徴とする画像検索方法。
An image search method in an image search system comprising a query image processing device and a search server device,
A local image feature amount extraction step for extracting local image feature amounts of a plurality of feature points in the query image, which is executed by the query image processing device;
A feature point position coarse quantization step for coarsely quantizing the position information of the feature points;
A query image processing device side communication step for transmitting feature point data including the local image feature amount and the coarsely quantized position information;
A search server device side communication step for receiving the feature point data, which is executed by the search server device;
An image search step of searching for a corresponding image corresponding to the query image from a plurality of reference images using the local image feature amount and the position information included in the received feature point data;
Only including,
The image search method includes a position information conversion step of converting the coarsely quantized position information into position information of an original image size .
クエリ画像処理装置と検索サーバ装置とからなる画像検索システムにおける画像検索方法であって、  An image search method in an image search system comprising a query image processing device and a search server device,
前記クエリ画像処理装置にて実行される  Executed by the query image processing apparatus
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出ステップと、  A local image feature amount extraction step for extracting local image feature amounts of a plurality of feature points in the query image;
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化ステップと、  A feature point position coarse quantization step for coarsely quantizing the position information of the feature points;
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを送信するクエリ画像処理装置側通信ステップと、  A query image processing device side communication step for transmitting feature point data including the local image feature amount and the coarsely quantized position information;
前記検索サーバ装置にて実行される  Executed in the search server device
前記特徴点データを受信する検索サーバ装置側通信ステップと、  A search server side communication step of receiving the feature point data;
受信した前記特徴点データに含まれる前記局所画像特徴量及び前記位置情報を用いて、複数の参照画像から、前記クエリ画像に対応する対応画像を検索する画像検索ステップと、  An image search step of searching for a corresponding image corresponding to the query image from a plurality of reference images using the local image feature amount and the position information included in the received feature point data;
を含み、  Including
前記特徴点位置粗量子化部は、前記粗量子化を行う際の粗量子化レベルを変更可能であることを特徴とする画像検索方法。  The image search method, wherein the feature point position coarse quantization unit can change a coarse quantization level when performing the coarse quantization.
クエリ画像処理装置と検索サーバ装置とからなる画像検索システムにおける画像検索方法であって、  An image search method in an image search system comprising a query image processing device and a search server device,
前記クエリ画像処理装置にて実行される  Executed by the query image processing apparatus
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出ステップと、  A local image feature amount extraction step for extracting local image feature amounts of a plurality of feature points in the query image;
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化ステップと、  A feature point position coarse quantization step for coarsely quantizing the position information of the feature points;
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを送信するクエリ画像処理装置側通信ステップと、  A query image processing device side communication step for transmitting feature point data including the local image feature amount and the coarsely quantized position information;
前記検索サーバ装置にて実行される  Executed in the search server device
前記特徴点データを受信する検索サーバ装置側通信ステップと、  A search server side communication step of receiving the feature point data;
受信した前記特徴点データに含まれる前記局所画像特徴量及び前記位置情報を用いて、複数の参照画像から、前記クエリ画像に対応する対応画像を検索する画像検索ステップと、  An image search step of searching for a corresponding image corresponding to the query image from a plurality of reference images using the local image feature amount and the position information included in the received feature point data;
を含み、  Including
前記特徴点位置粗量子化ステップは、前記特徴点の位置情報を2バイトのデータ量になるように粗量子化することを特徴とする画像検索方法。  In the feature point position coarse quantization step, the position information of the feature point is coarsely quantized so as to have a data amount of 2 bytes.
コンピュータを、
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部、
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部、及び
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを、検索サーバ装置に送信する通信部、
として機能させ
前記特徴点位置粗量子化部は、前記粗量子化を行う際の粗量子化レベルを変更可能であるクエリ画像処理プログラム。
Computer
A local image feature amount extraction unit that extracts local image feature amounts of a plurality of feature points in the query image;
A feature point position coarse quantization unit that coarsely quantizes the position information of the feature point, and a communication unit that transmits feature point data including the local image feature amount and the coarsely quantized position information to a search server device ,
To function as,
The feature point position coarse quantization unit is a query image processing program capable of changing a coarse quantization level when performing the coarse quantization .
コンピュータを、  Computer
クエリ画像中の複数の特徴点の局所画像特徴量を抽出する局所画像特徴量抽出部、  A local image feature amount extraction unit that extracts local image feature amounts of a plurality of feature points in the query image;
前記特徴点の位置情報を粗量子化する特徴点位置粗量子化部、及び  A feature point position coarse quantization unit for coarsely quantizing the position information of the feature points; and
前記局所画像特徴量と粗量子化された前記位置情報とを含む特徴点データを、検索サーバ装置に送信する通信部、  A communication unit that transmits feature point data including the local image feature value and the coarsely quantized position information to a search server device;
として機能させ、  Function as
前記特徴点位置粗量子化部は、前記特徴点の位置情報を2バイトのデータ量になるように粗量子化するクエリ画像処理プログラム。  The feature point position coarse quantization unit is a query image processing program that coarsely quantizes the position information of the feature point so as to have a data amount of 2 bytes.
複数の参照画像中の複数の特徴点の局所画像特徴量及び粗量子化された位置情報を関連付けて保存する画像保存部を含むコンピュータを、
クエリ画像処理装置から、クエリ画像中の複数の特徴点の局所画像特徴量及び位置情報を含む特徴点データを受信する通信部、
前記クエリ画像の前記局所画像特徴量と前記参照画像の特徴点の前記局所画像特徴量とを比較することにより、互いに対応する特徴点の組を求める比較マッチング部
前記クエリ画像の前記位置情報及び前記参照画像の前記位置情報のいずれか一方を他方に射影することにより、互いに対応する特徴点の組を求める射影判定部、及び
前記参照画像の粗量子化された前記位置情報を元の画像サイズの位置情報に変換する位置情報変換部、
として機能させ、前記比較マッチング部にて対応すると判断され、かつ、前記射影判定部にて対応すると判断された特徴点を最も多く含む前記参照画像を、前記クエリ画像に対応する対応画像であると判定することを特徴とする検索サーバプログラム。
A computer including an image storage unit that stores the local image feature quantities of the plurality of feature points in the plurality of reference images and the coarsely quantized position information in association with each other;
A communication unit that receives feature point data including local image feature amounts and position information of a plurality of feature points in the query image from the query image processing device;
A comparison matching unit that determines a pair of feature points corresponding to each other by comparing the local image feature amount of the query image and the local image feature amount of a feature point of the reference image ;
A projection determination unit for obtaining a pair of feature points corresponding to each other by projecting one of the position information of the query image and the position information of the reference image to the other; and
A position information conversion unit that converts the position information roughly quantized of the reference image into position information of an original image size;
The reference image including the largest number of feature points determined to correspond by the comparison matching unit and determined to correspond by the projection determination unit is a corresponding image corresponding to the query image. A search server program characterized by determining.
JP2013052074A 2013-03-14 2013-03-14 Image search system and image search method Expired - Fee Related JP6035173B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013052074A JP6035173B2 (en) 2013-03-14 2013-03-14 Image search system and image search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013052074A JP6035173B2 (en) 2013-03-14 2013-03-14 Image search system and image search method

Publications (2)

Publication Number Publication Date
JP2014178857A JP2014178857A (en) 2014-09-25
JP6035173B2 true JP6035173B2 (en) 2016-11-30

Family

ID=51698749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013052074A Expired - Fee Related JP6035173B2 (en) 2013-03-14 2013-03-14 Image search system and image search method

Country Status (1)

Country Link
JP (1) JP6035173B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6387027B2 (en) * 2016-01-18 2018-09-05 日本電信電話株式会社 Book searching apparatus, method and program
JP6387028B2 (en) * 2016-01-18 2018-09-05 日本電信電話株式会社 Search book display device, method and program
JP6387026B2 (en) * 2016-01-18 2018-09-05 日本電信電話株式会社 Book searching apparatus, method and program
KR101742115B1 (en) 2016-08-30 2017-05-31 광운대학교 산학협력단 An inlier selection and redundant removal method for building recognition of multi-view images
CN111522986B (en) * 2020-04-23 2023-10-10 北京百度网讯科技有限公司 Image retrieval method, device, equipment and medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7684594B2 (en) * 2006-02-08 2010-03-23 Fujifilm Corporation Method and apparatus for estimating object part location in digital image data using feature value analysis
JP5094682B2 (en) * 2008-10-23 2012-12-12 キヤノン株式会社 Image processing apparatus, image processing method, and program
JP5563494B2 (en) * 2011-02-01 2014-07-30 株式会社デンソーアイティーラボラトリ Corresponding reference image search device and method, content superimposing device, system and method, and computer program

Also Published As

Publication number Publication date
JP2014178857A (en) 2014-09-25

Similar Documents

Publication Publication Date Title
JP6211407B2 (en) Image search system, image search device, search server device, image search method, and image search program
JP5563494B2 (en) Corresponding reference image search device and method, content superimposing device, system and method, and computer program
KR101612212B1 (en) Local feature descriptor extracting apparatus, local feature descriptor extracting method, and computer-readable recording medium recording a program
JP6035173B2 (en) Image search system and image search method
US9626552B2 (en) Calculating facial image similarity
CN102782708A (en) Fast subspace projection of descriptor patches for image recognition
JP2014512057A (en) Robust feature matching for visual search
US9805282B2 (en) Local feature descriptor extracting apparatus, method for extracting local feature descriptor, and program
CN112819073B (en) Classification network training, image classification method and device and electronic equipment
US8164633B2 (en) Calibration apparatus and method for imaging devices and computer program
JP6460926B2 (en) System and method for searching for an object in a captured image
JP6192804B2 (en) Data compression apparatus and data compression method
CN111373393B (en) Image retrieval method and device and image library generation method and device
JP6338274B2 (en) Information processing apparatus and feature point selection method, apparatus and program thereof
JP6403201B2 (en) Image feature registration apparatus, method, and program
US20150254527A1 (en) Methods for 3d object recognition and registration
CN113128278B (en) Image recognition method and device
US10853972B2 (en) Apparatus for processing image and method thereof
Chen et al. Context-aware discriminative vocabulary learning for mobile landmark recognition
JP6244887B2 (en) Information processing apparatus, image search method, and program
JP6641396B2 (en) Article classification apparatus, article classification system, article classification method and program
JP6218237B2 (en) Image conversion program, apparatus and method for parallelizing photographed image
JP5923744B2 (en) Image search system, image search method, and search apparatus
JP2017028407A (en) Program, device and method for imaging instruction
JP7435907B2 (en) Image matching device, control method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150730

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20151113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161031

R150 Certificate of patent or registration of utility model

Ref document number: 6035173

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees