[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5967036B2 - 画像検索システム、情報処理装置及びプログラム - Google Patents

画像検索システム、情報処理装置及びプログラム Download PDF

Info

Publication number
JP5967036B2
JP5967036B2 JP2013172375A JP2013172375A JP5967036B2 JP 5967036 B2 JP5967036 B2 JP 5967036B2 JP 2013172375 A JP2013172375 A JP 2013172375A JP 2013172375 A JP2013172375 A JP 2013172375A JP 5967036 B2 JP5967036 B2 JP 5967036B2
Authority
JP
Japan
Prior art keywords
image
search
specific information
query
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013172375A
Other languages
English (en)
Other versions
JP2015041270A (ja
Inventor
裕一 大根田
裕一 大根田
健一郎 福田
健一郎 福田
晋平 野田
晋平 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2013172375A priority Critical patent/JP5967036B2/ja
Priority to CN201410081120.9A priority patent/CN104424349A/zh
Priority to US14/211,007 priority patent/US9311562B2/en
Publication of JP2015041270A publication Critical patent/JP2015041270A/ja
Application granted granted Critical
Publication of JP5967036B2 publication Critical patent/JP5967036B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、画像検索システム、情報処理装置及びプログラムに関する。
ユーザの目視による画像検索の効率を良くする技術が、特許文献1,2に開示されている。特許文献1は、画像特徴に基づいて互いに類似する検索対象の画像を同一カテゴリにし、各カテゴリの画像内容を、そのカテゴリの基準画像のラベル名と、このラベル名に対する関連度とともに表示することを開示している。特許文献2は、問い合わせ画像と検索対象画像との類似度をレイアウト特徴量及び画像性質特徴量を用いて算出し、特に、当該類似度の高い順に検索対象画像を順位付けする際には、レイアウト特徴量に画像性質特徴量より大きな重みを持たせることを開示している。
特開2010−102501号公報 特開2007−164648号公報
ところで、画像検索処理においては、登録された検索対象画像の全てではなく、クエリ画像に応じた一部を検索対象に絞ることで、画像検索処理に係る処理量が少なくなる。
本発明の目的は、検索対象の画像群をユーザが指定しなくとも、クエリ画像に応じた画像群の検索対象画像に絞って画像検索処理を行うことである。
本発明の請求項1に係る画像検索システムは、クエリ画像を取得する取得手段と、前記クエリ画像から検索対象となる画像群を特定するための特定情報を抽出する特定情報抽出手段と、前記クエリ画像から画像検索処理で必要となる特徴情報を抽出する特徴情報抽出手段であって、前記クエリ画像から検出したオブジェクト画像を、前記特定情報に対応付けて予め登録されたオブジェクト画像と比較することにより、前記特定情報を抽出する特徴情報抽出手段と、前記検出したオブジェクト画像を前記登録されたオブジェクト画像に近づけるように、前記クエリ画像に画像処理を施す画像処理手段と、前記特定情報に基づいて特定される検索対象画像に対して、前記特徴情報を用いて前記画像検索処理を行う検索手段とを備え、前記特定情報抽出手段は、前記画像処理後の前記クエリ画像から、前記特徴情報を抽出する
本発明の請求項2に係る画像検索システムは、請求項1に記載の構成において、前記検索手段は、前記特定情報に対応付けられたそれぞれのデータベース毎に記憶されている、前記特定情報に対応付けられた前記検索対象画像に対して、前記特徴情報を用いて前記画像検索処理を行うことを特徴とする。
本発明の請求項に係る画像検索システムは、請求項1又は2に記載の構成において、前記特徴情報は、特徴点の特徴量を含み、前記検索手段は、前記クエリ画像に含まれる前記特徴点のうち、前記検出したオブジェクト画像に含まれる前記特徴点の特徴量を用いないで、前記画像検索処理を行うことを特徴とする
本発明の請求項に係る画像検索システムは、請求項1からのいずれか1項に記載の構成において、互いに異なる前記特定情報に対応し、一の前記特定情報で特定される前記画像群の前記特徴情報が登録された複数の登録装置を備え、前記検索手段は、前記特定情報抽出手段が抽出した特定情報に対応する前記登録装置の前記特徴情報を用いて、前記画像検索処理を行うことを特徴とする。
本発明の請求項に係る画像検索システムは、請求項1からのいずれか1項に記載の構成において、前記特徴情報を登録する登録処理手段を備え、前記特徴情報抽出手段は、登録要求があった前記検索対象画像から、前記特徴情報を抽出し、前記特定情報抽出手段は、前記登録要求があった前記検索対象画像から、前記特定情報を抽出し、前記登録処理手段は、前記特徴情報抽出手段が抽出した前記検索対象画像の特徴情報を、前記特定情報抽出手段が抽出した当該検索対象画像の特定情報に従って、前記画像検索処理で検索対象とするように登録することを特徴とする。
本発明の請求項に係る画像検索システムは、請求項1からのいずれか1項に記載の構成において、通信端末により送信された前記クエリ画像を受信するクエリ画像受信手段と、前記クエリ画像受信手段により受信されたクエリ画像に基づいて前記画像検索処理が行われると、当該画像検索処理で検索された検索対象画像に対応付けられたコンテンツ情報を、前記通信端末へ出力する出力手段とを備えることを特徴とする。
本発明の請求項に係る情報処理装置は、クエリ画像を取得する取得手段と、前記クエリ画像から検索対象となる画像群を特定するための特定情報を抽出する特定情報抽出手段と、前記クエリ画像から画像検索処理で必要となる特徴情報を抽出する特徴情報抽出手段であって、前記クエリ画像から検出したオブジェクト画像を、前記特定情報に対応付けて予め登録されたオブジェクト画像と比較することにより、前記特定情報を抽出する特徴情報抽出手段と、前記検出したオブジェクト画像を前記登録されたオブジェクト画像に近づけるように、前記クエリ画像に画像処理を施す画像処理手段と、前記特定情報に基づいて特定される検索対象画像に対して、前記特徴情報を用いて前記画像検索処理を行う検索手段とを備え、前記特定情報抽出手段が、前記画像処理後の前記クエリ画像から、前記特徴情報を抽出する画像検索システムにおける、、前記特定情報抽出手段を備える。
本発明の請求項に係るプログラムは、クエリ画像を取得する取得手段と、前記クエリ画像から検索対象となる画像群を特定するための特定情報を抽出する特定情報抽出手段と、前記クエリ画像から画像検索処理で必要となる特徴情報を抽出する特徴情報抽出手段であって、前記クエリ画像から検出したオブジェクト画像を、前記特定情報に対応付けて予め登録されたオブジェクト画像と比較することにより、前記特定情報を抽出する特徴情報抽出手段と、前記検出したオブジェクト画像を前記登録されたオブジェクト画像に近づけるように、前記クエリ画像に画像処理を施す画像処理手段と、前記特定情報に基づいて特定される検索対象画像に対して、前記特徴情報を用いて前記画像検索処理を行う検索手段とを備え、前記特定情報抽出手段が、前記画像処理後の前記クエリ画像から、前記特徴情報を抽出する画像検索システムにおける、情報処理装置のコンピュータを、前記特定情報抽出手段として機能させるためのプログラムである。
請求項1,7,8に係る発明によれば、クエリ画像を原因とした検索精度の低下を減らしつつ、検索対象の画像群をユーザが指定しなくとも、クエリ画像に応じた画像群の検索対象画像に絞って画像検索処理を行うことができる。
請求項2に係る発明によれば、検索に用いられるデータベースをユーザが指定しなくとも、特定情報に対応付けられたそれぞれのデータベース毎に記憶されている、特定情報に対応付けられた検索対象画像に対して、特徴情報を用いて画像検索処理を行うことができる。
請求項に係る発明によれば、オブジェクト画像の存在が画像検索の結果に与える影響を軽減することができる
請求項に係る発明によれば、特定情報毎に、検索対象画像の特徴情報を登録する登録装置が異なる場合であっても、クエリ画像に応じた画像群の検索対象画像に絞って画像検索処理を行うことができる。
請求項に係る発明によれば、検索対象の画像群をユーザが指定しなくとも、特徴情報を登録することができる。
請求項に係る発明によれば、画像検索処理で検索された検索対象画像に対応付けられたコンテンツ情報を出力することができる。
第1実施形態の画像検索システムの全体構成を示す図。 EMMの概要を説明する図。 同実施形態のユーザ端末のハードウェア構成を示すブロック図。 同実施形態の画像検索サーバのハードウェア構成を示すブロック図。 同実施形態の画像検索データベースの構成例を示す図。 同実施形態のユーザ端末及び画像検索サーバの機能ブロック図。 同実施形態の画像検索システムで実行される処理を示すシーケンス図。 同実施形態の登録処理の流れを示すフローチャート。 同実施形態の登録処理の具体例を説明する図。 同実施形態の検索処理の流れを示すフローチャート。 同実施形態の検索処理の具体例を説明する図。 第2実施形態の画像検索システムの特定情報の抽出方法を説明する図。 同実施形態の変形例(1)の検索処理の具体例を説明する図。 同実施形態の変形例(2)の検索処理の流れを示すフローチャート。 同実施形態の変形例(2)の検索処理の具体例を説明する図。 変形例1の画像検索システムの全体構成を示す図。 同変形例の装置管理テーブルの構成例を示す図。 同変形例の検索処理の流れを示すシーケンス図。 変形例3の検索処理の流れを示すシーケンス図。 変形例5の登録処理及び検索処理の具体例を説明する図。 変形例5の検索処理の流れを示すシーケンス図。
本発明の実施の形態について図面を参照しつつ説明する。
[第1実施形態]
図1は、第1実施形態の画像検索システム1の全体構成を示す図である。図1に示すように、画像検索システム1は、ユーザ端末10と、画像検索サーバ20と、登録端末30とを備え、画像検索を行うための情報処理システムである。図1には、ユーザ端末10及び登録端末30をそれぞれ1つだけ図示しているが、実際にはより多数存在する。ユーザ端末10、画像検索サーバ20及び登録端末30の各々は、通信回線100に接続して相互に通信する。通信回線100は、例えばインターネットを含む通信回線であるが、通信回線の種類については特に問わない。
ユーザ端末10は、撮影機能(カメラ機能)を有する通信端末であり、図1に示す印刷物40を撮影し、画像検索を要求するクエリ画像を、画像検索サーバ20へ送信する。クエリ画像は、画像検索サーバ20で実行される画像検索の検索キーとなる画像データで、画像検索サーバ20に対する画像検索の実行要求を画像により表現したデータである。画像検索サーバ20は、ユーザ端末10から受信したクエリ画像に類似する画像(後述する検索対象画像)を検索する情報処理装置である。印刷物40は、例えば広告やパンフレット、雑誌の誌面であり、媒体(例えば紙媒体)上に文字や写真等の画像要素が印刷された印刷物である。印刷物40では、この画像要素に重ねて、埋め込み型メディアマーカ(EMM;Embedded Media Markers)と呼ばれるマーカ41が印刷されている。マーカ41は、印刷物40の画像要素にデジタルコンテンツが関連付けられていることの目印である。マーカ41は、印刷物40の画像要素をユーザが視認する際の妨げとならないように、比較的薄い色を用いて印刷される。登録端末30は、例えばコンテンツプロバイダにより使用され、EMMに関する情報及びデジタルコンテンツに関する情報を、画像検索サーバ20に登録するための通信端末である。
なお、ユーザ端末10は、ここではスマートフォンであるが、携帯電話端末やタブレット端末、ノート型パソコン、PDA(Personal Digital Assistant)、携帯型ゲーム機等の、撮影機能を有する他の通信端末であってもよい。また、登録端末30は、例えばパーソナル・コンピュータであるが、その他の通信端末であってもよい。
図2は、EMMの概要を説明する図である。
図2(a)には、マーカ41の模式図が示されている。図2(a)に示すように、マーカ41は、特徴境界411と、アンカーポイント412と、メディアアイコン413とで構成される。特徴境界411は、ここでは円形の線画像によって表され、印刷物40の画像要素を内側に含む。図2(b)に示すように、ユーザ端末10のユーザは、印刷物40を撮影する際に、マーカ41の全体が撮影範囲に含まれるように、ユーザ端末10を操作する。アンカーポイント412は、デジタルコンテンツを関連付ける画像要素の位置を特定する位置情報に相当する。メディアアイコン413は、デジタルコンテンツの種類を識別可能なアイコンである。メディアアイコン413は、ここではビデオカメラを模したアイコン画像であるが、このアイコン画像はデジタルコンテンツが動画コンテンツであることを意味する。この場合、マーカ41を撮影したユーザ端末10は、図2(c)に示すように、画像検索サーバ20から提供された動画コンテンツを再生して動画像Cを表示する。動画コンテンツは、印刷物40の画像要素に関連した内容のデジタルコンテンツである。
なお、マーカ41に関連付けられるデジタルコンテンツは、静止画コンテンツやWebコンテンツその他のデジタルコンテンツであってもよい。
図3は、ユーザ端末10のハードウェア構成を示すブロック図である。図3に示すように、ユーザ端末10は、制御部11と、UI(User Interface)部12と、通信部13と、撮影部14と、記憶部15とを備える。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)及びRAM(Random Access Memory)を有するプロセッサを備える。CPUは、ROMや記憶部15に記憶された制御プログラムをRAMに読み出して実行することにより、ユーザ端末10の各部を制御する。また、制御部11は、ASIC(Application Specific Integrated Circuit)で例示される画像処理回路を備え、この画像処理回路により画像処理を行う。UI部12は、GUI(Graphical User Interface)を提供する操作表示部であり、表示面に画像を表示する表示パネルと、この表示面に重ねて設けられユーザに操作されるタッチスクリーンとを備える。
なお、ユーザ端末10は、物理キー等の操作を受け付ける他の操作手段を有していてもよいし、音声入力操作を受け付ける機能を有していてもよい。
通信部13は、通信回線100に接続して通信するためのインタフェースを有する。撮影部14は、CCD(Charge Coupled Device)等の撮像素子を有する撮影装置であり、撮影した画像である撮影画像(静止画像又は動画像)を生成する。撮影部14の撮影レンズ(図示略)は、ここではユーザ端末10の背面側に設けられる。記憶部15は、例えばEEPROM(Electronically Erasable and Programmable ROM)やフラッシュメモリ等の記憶装置を備え、制御部11により実行されるOS(Operating System)やその他のプログラムを記憶する。
図4は、画像検索サーバ20のハードウェア構成を示すブロック図である。図4に示すように、画像検索サーバ20は、制御部21と、通信部22と、記憶部23とを備える。
制御部21は、CPU、ROM及びRAMを有するプロセッサを備える。CPUは、ROMや記憶部23に記憶された制御プログラムをRAMに読み出して実行することにより、画像検索サーバ20の各部を制御する。また、制御部21は、ASICで例示される画像処理回路を備え、この画像処理回路により画像処理を行う。通信部22は、通信回線100に接続して通信するためのインタフェースある。記憶部23は、例えばハードディスク装置を有する記憶装置であり、制御部21により実行されるプログラムを記憶する。また、記憶部23は、画像検索データベース231を有している。
なお、図4には、破線枠内に「特定情報テーブル」と記載されているが、特定情報テーブル232は後述する第2実施形態の構成要素であり、この実施形態には関係ないものとする。
図5は、画像検索データベース231の構成例を示す図である。
図5に示すように、画像検索データベース231は、特定情報と、画像識別子と、局所特徴量(特徴情報の一例)と、コンテンツ情報という各情報を対応付けて登録したデータベースである。
特定情報は、検索対象となる画像群を特定するための情報である。かかる画像群は、検索対象画像の集合によって構成され、画像検索サーバ20で検索対象となる全検索対象画像のうちの一部である。この実施形態では、検索対象画像に関連付けられたデジタルコンテンツを提供するコンテンツプロバイダ毎に、特定情報が異なる。すなわち、この実施形態の特定情報は、検索対象画像の分類を一意に識別する識別子であるが、この主旨に限定されない。
画像識別子は、検索対象画像の各々を一意に識別する識別子である。局所特徴量は、検索対象画像の特徴を表す特徴量で、より詳細には、複数の特徴点の各々の局所的な特徴を表す特徴量である。局所特徴量は、ここでは、SIFT(Scale Invariant Feature Transform)特徴量である。SIFT特徴量は、画素の代表輝度勾配方向を決定し、その方向を基準とした輝度勾配ヒストグラムを作成し、多次元ベクトル(例えば128次元のベクトル)で記述される局所特徴量である。SIFT特徴量は、例えば、“永橋、藤吉、金出「領域分割に基づくSIFT特徴を用いた物体識別」、電気学会、システム・制御研究会、pp39-44、2007年1月)”に記載されているとおり周知であり、その詳細な説明を省略する。
コンテンツ情報は、画像検索サーバ20からユーザ端末10へと提供されるデジタルコンテンツを示す情報である。コンテンツ情報は、ここでは、デジタルコンテンツの格納場所を示すURI(Uniform Resource Identifier)等のアクセス先の情報であるが、デジタルコンテンツ自体を示す情報であってもよい。
以上のとおり、画像検索データベース231では、特定情報毎に、検索対象画像から抽出された局所特徴量と、当該検索対象画像に関連付けられたデジタルコンテンツを表すコンテンツ情報とが対応付けて登録される。
図6は、ユーザ端末10及び画像検索サーバ20の機能構成を示すブロック図である。図6に示すように、画像検索サーバ20は、プログラムを実行することにより、検索対象画像受信手段201と、特徴情報抽出手段202と、特定情報抽出手段203と、登録処理手段204と、クエリ画像受信手段205と、検索手段206と、コンテンツ情報出力手段207とに相当する機能を実現する。ユーザ端末10は、プログラムを実行することにより、撮影画像取得手段101と、クエリ画像送信手段102と、コンテンツ情報受信手段103とに相当する機能を実現する。
なお、図6には、破線枠内に「画像処理手段」と記載されているが、画像処理手段208には後述する第2実施形態の変形例(2)の機能構成であり、この実施形態には関係ないものとする。
画像検索サーバ20の検索対象画像受信手段201は、登録端末30から検索対象画像の登録要求があった場合に、当該検索対象画像を受信し、これを取得する。
特徴情報抽出手段202は、検索対象画像受信手段201から供給された検索対象画像の特徴点の局所特徴量を抽出する。また、特徴情報抽出手段202は、クエリ画像受信手段205から供給されたクエリ画像の局所特徴量を抽出する。
特定情報抽出手段203は、検索対象画像受信手段201から供給された検索対象画像から、特定情報を抽出する。特定情報抽出手段203は、クエリ画像受信手段205から供給されたクエリ画像から、特定情報を抽出する。
登録処理手段204は、検索対象画像に関するデータを画像検索データベース231へ登録する登録処理を行う。具体的には、登録処理手段204は、特徴情報抽出手段202により検索対象画像から抽出された局所特徴量を、特定情報抽出手段203により抽出された当該検索対象画像の特定情報と対応付けて、画像検索データベース231へ登録する。この際、登録処理手段204は、登録端末30から取得したデジタルコンテンツを示すコンテンツ情報を、特定情報及び局所特徴量に対応付けて、画像検索データベース231へ登録する。
ユーザ端末10の撮影画像取得手段101は、撮影部14の撮影により得られた画像である撮影画像を取得する。
クエリ画像送信手段102は、撮影画像取得手段101により取得された撮影画像に基づいて、画像検索におけるクエリ画像を画像検索サーバ20へ送信する。
画像検索サーバ20のクエリ画像受信手段205(取得手段の一例)は、クエリ画像送信手段102により送信されたクエリ画像を受信し、これを取得する。
検索手段206は、特定情報に基づいて特定される検索対象画像に対して、局所特徴量を用いて検索処理を行う。検索手段206は、クエリ画像送信手段102により送信されたクエリ画像に類似する検索対象画像を、画像検索データベース231に基づいて検索する。検索手段206は、特定情報抽出手段203が抽出した特定情報に対応付けられた局所特徴量を、画像検索データベース231から取得して、特徴情報抽出手段202が抽出したクエリ画像の局所特徴量と比較することにより、特徴点毎の対応点を決定する。検索手段206は、決定した対応点に基づいて、クエリ画像に類似する検索対象画像を検索して、検索した検索対象画像の画像識別子を特定する。
コンテンツ情報出力手段207(出力手段の一例)は、検索手段206により検索された検索対象画像に応じたコンテンツ情報を、ユーザ端末10へ出力する。コンテンツ情報出力手段207は、検索手段206で検索された検索対象画像の画像識別子に対応付けられたコンテンツ情報を、画像検索データベース231から取得して、ユーザ端末10へ送信出力する。
ユーザ端末10のコンテンツ情報受信手段103は、コンテンツ情報出力手段207により出力されたコンテンツ情報を受信する。
図7は、画像検索システム1で実行される処理の流れを示すシーケンス図である。
登録端末30は、利用者により画像検索サーバ20への登録を指示する操作が行われると、検索対象画像の登録要求を、画像検索サーバ20へ送信する(ステップS1)。この登録要求は、検索対象画像と、コンテンツ情報と、登録端末30にデータを送信するための送信先アドレスとを含む。登録端末30が登録要求の送信先を特定するための送信先アドレスは、例えば、登録端末30が実行するプログラムに予め設定されている。画像検索サーバ20の制御部21は、通信部22により登録要求を受信すると、登録処理を実行する(ステップS2)。
図8は、登録処理の流れを示すフローチャートである。図9は、登録処理の具体例を説明する図である。
画像検索サーバ20の制御部21は、登録要求に含まれる検索対象画像を取得する(ステップS21)。次に、制御部21は、取得した検索対象画像から特定情報を抽出する(ステップS22)。ここで、制御部21が、図9(a)に示す検索対象画像Isを取得した場合を考える。この場合、図9(b)に示すように、制御部21は、電子透かしdw1から情報を復号するための画像処理を検索対象画像Isに施すことにより、特定情報を抽出する。電子透かしdw1は、登録端末30で行われた処理により、検索対象画像に付加されている。ここでは、制御部21は、特定情報「G001」を抽出したものとする。
次に、制御部21は、取得した検索対象画像から特徴点を検出し、検出した特徴点の局所特徴量を抽出する(ステップS23)。ここでは、図9(c)に示すように、制御部21は、検索対象画像Isのエッジやコーナー等の特徴点ps(「●」(黒丸印)で表す。)を検出して、検出した特徴点psの局所特徴量を抽出する。図9(c)には、図面が煩雑になるのを防ぐために、ひとつの特徴点のみに「ps」という符号を付している。
なお、検索対象画像には電子透かしdw1が重畳されているが、特徴点の検出及び局所特徴量に与える影響は無視してよい。
次に、制御部21は、ステップS23の処理で抽出した特徴点毎の局所特徴量を、画像検索データベース231へ登録する(ステップS24)。ここにおいて、制御部21は、ステップS22の処理で抽出した特定情報に対応付けて、画像識別子及び局所特徴量を登録する。この際、制御部21は、ステップS21の処理で取得した検索対象画像Isに画像識別子を割り当てて、この検索対象画像Isから抽出した複数の局所特徴量を登録する。図5を用いて説明すると、特定情報「G001」及び画像識別子「IMG−1」に対応付けられた局所特徴量「Vs1」,・・・,「Vsk」の各々は、画像識別子「IMG−1」の検索対象画像から抽出された局所特徴量である。ステップS24の処理では、制御部21は、登録要求に含まれるコンテンツ情報も、画像検索データベース231へ登録する。
登録処理の説明は以上である。
画像検索サーバ20は、登録処理を行った検索対象画像Isを、ステップS1の処理で送信された送信先アドレスを用いて、登録端末30へ送信する。登録端末30は、この検索対象画像Isを印刷出力することによって、印刷物40を生成する。画像検索サーバ20は、検索対象画像の登録要求を受け付けるたびに、上記手順で登録処理を実行する。
図7の説明に戻る。
ユーザ端末10のユーザが、ユーザ端末10を使用して、印刷物40を撮影したとする。この場合、ユーザ端末10の制御部11は、撮影部14により印刷物40を撮影し、この撮影により得られた撮影画像を取得する(ステップS3)。そして、制御部11は、取得したクエリ画像を、通信部13により画像検索サーバ20へ送信する(ステップS4)。ユーザ端末10がクエリ画像の送信先を特定するための送信先アドレスは、例えば、ユーザ端末10の制御部11が実行するプログラムに予め設定されている。また、ステップS3の処理では、ユーザ端末10は、登録端末30にデータを送信するための送信先アドレスも送信する。画像検索サーバ20の制御部21は、クエリ画像を通信部22により受信すると、このクエリ画像に基づいて検索処理を実行する(ステップS5)。
図10は、検索処理の流れを示すフローチャートである。図11は、検索処理の具体例を説明する図である。
まず、制御部21は、クエリ画像を取得すると(ステップS51)、取得したクエリ画像から特徴点を検出し、検出した特徴点の局所特徴量を抽出する(ステップS52)。ここで、制御部21が、図11(a)に示すクエリ画像Iqを取得した場合を考える。図11(b)に示すように、クエリ画像Iqには、このクエリ画像の特定情報が電子透かしdw2により重畳されている。この場合、図11(c)に示すように、制御部21は、クエリ画像Iqから特徴点pqの局所特徴量を抽出する。図11(c)では、図面が煩雑になるのを防ぐために、ひとつの特徴点のみに「pq」という符号を付している。
次に、制御部21は、取得したクエリ画像から特定情報を抽出する(ステップS53)。ここでは、制御部21は、電子透かしdw2から情報を復号するための画像処理をクエリ画像Iqに施すことにより、特定情報を抽出する。この画像処理は、検索対象画像から特定情報を抽出するときに実行される画像処理と同じでよい。ここでは、制御部21が特定情報「G001」を抽出したものとする。
次に、制御部21は、画像検索データベース231から、検索処理に用いる局所特徴量を取得し、クエリ画像の局所特徴量と比較する(ステップS54)。制御部21は、特徴点pqの局所特徴量を、ステップS53の処理で抽出した特定情報に対応付けて画像検索データベース231に登録された局所特徴量の各々と比較する。図11(c)に示すように、制御部21は、特定情報「G001」に対応付けられた画像識別子「IMG−1」,「IMG−2」,・・・,「IMG−N」に対応する局所特徴量をそれぞれ取得し、特徴点pqの局所特徴量と比較する。すなわち、制御部21は、特定情報「G001」によって特定される画像群を検索対象とする。他方、制御部21は、特定情報「G002」や「G0003」等の、ステップS53の処理で抽出した特定情報以外の特定情報に対応付けられた局所特徴量(つまり、画像群)については、検索処理に用いない(例えば、画像検索データベース231から取得しない)。
次に、制御部21は、ステップS54での比較結果に基づいて、クエリ画像に類似する検索対象画像を検索する画像検索処理を行う(ステップS55)。ここで、制御部21は、クエリ画像Iqの特徴点pq毎に、ステップS54の処理で取得した局所特徴量との類似度を算出する。局所特徴量同士の類似度を算出するためのアルゴリズムは、周知のアルゴリズムでよい。制御部21は、算出した類似度に基づいて検索対象画像の対応点を決定することにより、クエリ画像に類似する検索対象画像を検索する。例えば、制御部21は、対応点の数が最大であり、且つ、当該対応点の数が閾値以上である検索対象画像を検索する。
制御部21は、検索した検索対象画像の画像識別子に対応付けられたコンテンツ情報を、画像検索データベース231から取得する(ステップS56)。例えば、画像識別子「IMG−1」の検索対象画像が検索結果である場合、制御部21は、コンテンツ情報「Ct−1」を取得する。
検索処理の説明は以上である。画像検索サーバ20は、クエリ画像を受信するたびに上記手順の処理を実行する。
図7の説明に戻る。
検索処理を終了すると、画像検索サーバ20の制御部21は、ステップS56の処理で取得したコンテンツ情報を、ステップS4の処理で送信された送信先アドレスを用いて、通信部22によりユーザ端末10へ送信出力する(ステップS6)。ユーザ端末10の制御部11は、通信部13によりコンテンツ情報を受信すると、受信したコンテンツ情報に基づいてデジタルコンテンツを取得して表示する(ステップS7)。
画像検索システム1の動作説明は以上である。
以上説明した第1実施形態の画像検索システム1では、画像検索サーバ20は、検索処理において、検索対象の画像群を特定するための特定情報をクエリ画像から抽出する。そして、画像検索サーバ20は、この特定情報に対応した検索対象画像の局所特徴量を画像検索データベース231から取得して、クエリ画像の局所特徴量と比較する。よって、画像検索システム1では、ユーザ端末10のユーザが検索対象の画像群(検索対象画像)を指定しなくとも、特定情報に基づいて検索対象画像を絞って画像検索が行われる。この検索対象画像の絞り込みにより、特定情報が異なる画像群が検索結果とならず、また、検索処理の処理量が減る。
[第2実施形態]
次に、本発明の第2実施形態を説明する。
この第2実施形態の画像検索システム1では、アイコン画像等の、人間によって視認されるオブジェクトの画像に基づいて、クエリ画像から特定情報を抽出する。
この第2実施形態の画像検索システム1を構成する装置及び各装置のハードウェア構成は、上述した第1実施形態と同じでよい。また、この第2実施形態の画像検索システム1の機能構成は、特定情報を抽出するための機能に関する部分を除いて、上述した第1実施形態と同じでよい。
以下の説明において、上述した第1実施形態と重複する部分の説明については省略する。また、上述した第1実施形態の構成要素及び処理ステップについては同一の符号を付して表し、その説明を省略する。
図12は、この実施形態の画像検索システム1の特定情報の抽出方法を説明する図である。図12(a)には、この実施形態の印刷物40の一例が示されている。図12(a)に示すように、印刷物40には、特定情報を示す画像であるアイコン画像414が、特徴境界411の内側に含まれる。アイコン画像414は、ここでは矩形画像の内側に星を配置した画像であり、特定情報を象徴する画像(例えば、コンテンツプロバイダ等のロゴマーク)である。図12(b)には、この印刷物40を撮影したときのクエリ画像Iq1が示されている。アイコン画像414は特徴境界411の内側に配置されるため、クエリ画像Iq1には、アイコン画像414を撮影したオブジェクト画像Aが含まれている。
画像検索サーバ20の制御部21は、検索処理のステップS51の処理で、図12(b)に示すクエリ画像Iq1を取得した場合、ステップS53の処理では、クエリ画像Iq1から、特定情報を示すオブジェクト画像を検出する。制御部21は、図12(c)に示す特定情報テーブル232を記憶部23に記憶しており、特定情報テーブル232に基づいて、クエリ画像に含まれるオブジェクト画像を検出する。特定情報テーブル232は、特定情報と、この特定情報を一意に識別するオブジェクト画像とが対応付けて登録されたデータテーブルである。制御部21は、特定情報テーブル232に登録されたオブジェクト画像を、例えばパターンマッチング等の周知の方法で、クエリ画像Iq1から検出する。この際、オブジェクト画像の目印となる目印画像(例えば、前述した矩形画像)が印刷物40に含まれる場合には、制御部21は、この目印画像を認識してオブジェクト画像を検出してもよい。
そして、制御部21は、クエリ画像Iq1から検出したオブジェクト画像に対応付けられた特定情報を、特定情報テーブル232に基づいて抽出する。制御部21は、抽出した特定情報に基づいて、検索処理のステップS54以降の処理を実行する。
登録処理においては、画像検索サーバ20は、特定情報に一意に対応付けられたオブジェクト画像を含む検索対象画像を用いる。このため、登録端末30は、ユーザに指定された特定情報に対応したオブジェクト画像を含む検索対象画像を、画像検索サーバ20へ送信する。画像検索サーバ20は、検索対象画像を取得すると、特定情報テーブル232に基づいてこの検索対象画像に含まれるオブジェクト画像を検出して、特定情報を抽出する。特定情報を抽出した後は、画像検索サーバ20は、上述した第1実施形態と同じ方法で登録処理を行う。
<第2実施形態の変形例>
以下に示す変形例は、各々を適宜に組み合わせてもよい。
(1)上述した第2実施形態の画像検索システム1において、クエリ画像に含まれるオブジェクト画像から特徴点を検出した場合に、この特徴点を検索処理に用いないようにしてもよい。こうすれば、画像検索システム1では、アイコン画像414の影響を受けないで、画像検索処理が実行される。
図12(b)で説明したように、制御部21が、クエリ画像Iq1からオブジェクト画像Aを検出し、更に、図13に示すように、オブジェクト画像Aの特徴を表す特徴点pqjを検出した場合を考える。この場合、制御部21は、クエリ画像Iq1のオブジェクト画像A以外の領域から検出した特徴点については、画像検索データベース231の局所特徴量に基づいて対応点を決定する。他方、制御部21は、オブジェクト画像Aから検出した特徴点pqjについては画像検索処理から除外し、対応点を決定しない。制御部21は、オブジェクト画像A以外の領域から検出した特徴点の局所特徴量に基づいて、画像検索処理を行う。ステップS55の画像検索処理以降の画像検索システム1の動作は、上述した第2実施形態と同じでよい。
登録処理を行う際には、画像検索サーバ20は、検索対象画像においてオブジェクト画像以外の領域から検出した特徴点の局所特徴量を、画像検索データベース231へ登録してもよい。
(2)上述した第2実施形態の画像検索システム1において、クエリ画像にユーザ端末10での印刷物40の撮影方法や撮影環境に起因した画像変化(つまりノイズ)が含まれる場合には、この画像変化を少なくする画像処理をクエリ画像に施してから、特徴点を検出し局所特徴量を抽出してもよい。この画像変化は、例えば、撮影方法に起因してクエリ画像に含まれる画像歪みである。カメラ撮影をしたときにユーザ端末10が水平方向に傾いていると、水平方向に平行四辺形状又は台形状の歪みが発生した撮影画像が得られ、撮影装置が垂直方向に傾いていると、垂直方向に平行四辺形状又は台形状の歪みが発生した撮影画像が得られることがある。この種の画像歪みの有無や画像歪みの大小によって、クエリ画像から検出される特徴点や局所特徴量が変化することがある。このため、クエリ画像に画像歪みが生じると、画像検索処理の精度を低下させる原因となることがある。
この変形例の画像検索サーバ20は、図6で説明した機能構成に加え、画像処理手段208に相当する機能を実現する。画像処理手段208は、クエリ画像から検出したオブジェクト画像を、特定情報テーブル232に登録された当該オブジェクト画像に対応する特定情報のオブジェクト画像に近づけるように、当該クエリ画像に画像処理を施す。特徴情報抽出手段202は、画像処理手段208による画像処理後のクエリ画像に基づいて、特徴点を検出し局所特徴量を抽出する。
図14は、画像検索サーバ20が実行する検索処理の流れを示すフローチャートである。
画像検索サーバ20の制御部21は、ステップS51の処理で取得したクエリ画像からオブジェクト画像を検出すると、検出したオブジェクト画像と、特定情報テーブル232に登録されたオブジェクト画像とを比較して、クエリ画像における画像変化を特定する。画像歪みの場合、制御部21は、クエリ画像内のオブジェクト画像の大きさや形状を参照して、画像歪みの発生方向や発生度合いを特定するとよい。図15(a)に示すように、水平方向に台形状の画像歪みが含まれるクエリ画像Iq2が得られた場合を考える。この場合、オブジェクト画像Aにおいては、特定情報テーブル232に登録されたオブジェクト画像とは異なり、画像歪みに応じて変形している。そこで、制御部21は、検出したオブジェクト画像を、特定情報テーブル232に登録されたオブジェクト画像に近づけるための画像処理(幾何変換)をクエリ画像に施す(ステップS57)。これにより、図15(b)に示すように、画像歪みが軽減されたクエリ画像Iqrが得られる。このクエリ画像Iqrには、画像処理により画像歪みが少なくなったオブジェクト画像Arが含まれる。
なお、SIFT特徴量を用いた画像検索では、クエリ画像と検索対象画像との寸法の違いによる検索精度の低下の影響を受けにくいことが知られている。そこで、制御部21は、検出したオブジェクト画像の形状を、特定情報テーブル232に登録されたオブジェクト画像の形状(相似形)に近づけるための画像処理をクエリ画像に施してもよい。
次に、制御部21は、ステップS52の処理で、画像処理後のクエリ画像から局所特徴量を抽出する。そして、ステップS53の処理で、画像処理後のクエリ画像から特定情報を抽出する。以降、制御部21は、上述した第2実施形態で説明した手順で、画像検索処理を行う。
この変形例のように、オブジェクト画像に基づいてクエリ画像の画像変化を少なくする画像処理を行ってから、局所特徴量を抽出する構成については、例えば、特定情報をユーザの指定なしに抽出する画像検索以外の画像検索にも適用しうる。
また、この変形例では、クエリ画像に含まれる画像変化として画像歪みを説明したが、この画像変化は画像歪みに限られない。例えば、クエリ画像内のオブジェクト画像が、登録されたオブジェクト画像から或る角度だけ回転している場合には、画像検索サーバ20は、この角度だけクエリ画像を逆方向に回転させる画像処理を施してから、特徴点を検出し局所特徴量を抽出する。また、クエリ画像に明暗の変化が含まれることをオブジェクト画像に基づいて特定した場合には、画像検索サーバ20は、このクエリ画像の明暗の変化を小さくする画像処理を施してから、特徴点を検出し局所特徴量を抽出する。
[変形例]
本発明は、上述した実施形態と異なる形態で実施してもよい。また、以下に示す変形例は、各々を組み合わせてもよい。
(変形例1)
上述した実施形態の画像検索システムが、以下のように変形されてもよい。
図16は、この変形例の画像検索システム1aの全体構成を示す図である。
図16に示すように、画像検索システム1aは、ユーザ端末10と、画像検索サーバ20と、登録端末30と、登録サーバ50a,50b及び50cを備え、画像検索を行うための情報処理システムである。ユーザ端末10及び登録端末30は、上述した各実施形態と同じ構成を有し、同じ動作をする。登録サーバ50a,50b及び50cは、互いに異なる特定情報に対応し、一の特定情報で特定される画像群を構成する検索対象画像についての局所特徴量及びコンテンツ情報が登録された登録装置である。特定情報は、ここでは、当該特定情報で特定される画像群(検索対象画像)の局所特徴量が登録された登録サーバを特定するための情報である。
登録サーバ50aは、図5に示す画像検索データベース231のうちの、特定情報「G001」に対応付けられたデータを登録したデータベースを有する。登録サーバ50bは、図5に示す画像検索データベース231のうちの、特定情報「G002」に対応付けられたデータを登録したデータベースを有する。登録サーバ50cは、図5に示す画像検索データベース231のうちの、特定情報「G003」に対応付けられたデータを登録したデータベースを有する。画像検索サーバ20は、ユーザ端末10及び登録端末30のそれぞれと通信し、また、登録サーバ50a,50b及び50cのそれぞれと通信する。すなわち、画像検索サーバ20は、ユーザ端末10及び登録端末30と、登録サーバ50a,50b及び50cとの通信を仲介するサーバとして機能する。以下、登録サーバ50a,50b及び50cの各々を特に区別する必要のないときには、これらを「登録サーバ50」と総称する。
この変形例においては、登録サーバ50が登録処理を行って、データベースに局所特徴量及びコンテンツ情報を登録してもよいし、画像検索サーバ20が登録処理を行って、登録サーバ50のデータベースに局所特徴量及びコンテンツ情報を登録してもよい。また、この変形例では、登録サーバ50a,50b及び50cの3台としているが、登録サーバ50は2台又は4台以上存在していてもよい。
画像検索サーバ20は、画像検索データベース231を有さず、代わりに、図17に示す233を記憶部23に記憶する。装置管理テーブル233は、特定情報と、登録サーバ50を一意に識別する識別子(以下、「装置識別子」という。)とを対応付けたデータテーブルである。図17では、登録サーバ50a,50b,50cの符号を用いて、装置識別子を表している。すなわち、装置管理テーブル233には、特定情報と、当該特定情報で特定される画像群の局所特徴量が登録された登録サーバ50を識別する装置識別子との対応関係が指定されている。
装置識別子は、登録サーバ50の各々にアクセスするためのアクセス先情報(通信アドレス)であってもよい。このアクセス先情報は、例えば、各検索処理を伴うサービスのURL(Uniform Resource Locator)やクエリ画像の送信先を示す送信先情報である。
図18は、この変形例の検索処理の流れを示すシーケンス図である。
画像検索サーバ20の制御部21は、ステップS51〜S53の処理を実行して、クエリ画像から局所特徴量を抽出するとともに、特定情報を抽出する。
次に、制御部21は、装置管理テーブル233を参照して、ステップS53の処理で抽出した特定情報に対応した登録サーバ50を特定し、特定した登録サーバ50へクエリ画像の局所特徴量を送信する(ステップS58)。例えば、クエリ画像に基づいて取得した特定情報が「G001」である場合、制御部21は、登録サーバ50aを検索処理の要求先とする。
登録サーバ50は、画像検索サーバ20から受信した局所特徴量と、自装置のデータベースに登録された局所特徴量とを比較し(ステップS54)、クエリ画像に類似する検索対象画像を検索する画像検索処理を行う(ステップS55)。すなわち、この変形例の登録サーバ50は、本発明の画像検索装置(画像検索サーバ)としても機能する。
登録サーバ50は、クエリ画像に類似する検索対象画像を検索すると、この検索した検索対象画像の画像識別子に対応付けられたコンテンツ情報をデータベースから取得して、画像検索サーバ20へ送信する(ステップS59)。例えば、登録サーバ50が、画像識別子「IMG−1」を検索結果とした場合、この画像識別子「IMG−1」に対応付けられたコンテンツ情報「Ct−1」を、画像検索サーバ20へ送信する。画像検索サーバ20の制御部21は、登録サーバ50からコンテンツ情報を取得して、検索処理を終了する(ステップS56)。
なお、この変形例の画像検索システム1aにおいて、画像検索サーバ20が、登録サーバ50から局所特徴量を取得して検索処理を行ってもよい。この場合、画像検索サーバ20は、検索処理の結果である画像識別子を登録サーバ50に通知して、この画像識別子に対応付けられたコンテンツ情報を登録サーバ50から取得する。
(変形例2)
上述した変形例1の画像検索システム1aにおいて、特定情報が、アプリケーションプログラム毎に異なっていてもよい。この場合の特定情報としては、例えば、アプリケーションプログラムを一意に識別する識別子(アプリケーション識別子)が使用される。
登録端末30の動作を説明すると、登録端末30が、一のアプリケーションプログラムを実行して、登録処理を画像検索サーバ20に要求する場合には、当該アプリケーションプログラムから取得した特定情報を、ステップS1の処理で画像検索サーバ20へ送信する。ユーザ端末10の動作を説明すると、ユーザ端末10の制御部11が、一のアプリケーションプログラムを実行して、検索処理を画像検索サーバ20に要求する場合には、当該アプリケーションプログラムから取得した特定情報を、ステップS4の処理で画像検索サーバ20へ送信する。
この変形例の構成を上述した変形例1に適用した場合、アプリケーションプログラムの提供者、又は、アプリケーションプログラムに基づくサービスの提供者毎に、登録サーバ50が異なる場合であっても、ユーザ端末10が実行するアプリケーションプログラムに対応した登録サーバ50が、検索処理を伴うサービスを提供し得る。
この変形例の画像検索システム1aにおいては、特定情報が、検索対象画像やクエリ画像(つまり印刷物40)に含まれていなくてもよい。
(変形例3)
上述した変形例1又は変形例2の画像検索システム1aが、以下のように変形されてもよい。この変形例では、登録サーバ50がクエリ画像から局所特徴量を抽出して検索処理を行う。
図19に示すように、画像検索サーバ20の制御部21は、ユーザ端末10からクエリ画像を取得すると(ステップS51)、取得したクエリ画像から特定情報を抽出する(ステップS53)。そして、制御部21は、抽出した特定情報と装置管理テーブル233とに基づいて、当該特定情報に対応した登録サーバ50へ、クエリ画像を送信(転送)する(ステップS60)。登録サーバ50は、画像検索サーバ20から受信したクエリ画像から局所特徴量を抽出し(ステップS52)、抽出した局所特徴量と自装置に登録された局所特徴量とを比較して、画像検索処理を行う(ステップS54,S55)。そして、登録サーバ50は、画像検索処理の結果に応じたコンテンツ情報をデータベースから取得して、画像検索サーバ20へ送信する(ステップS61)。制御部21は、登録サーバ50からコンテンツ情報を取得すると(ステップS56)、画像検索システム1aでの検索処理が終了する。
この変形例の画像検索システム1aによれば、画像検索サーバ20における検索処理に係る処理量が、上述した変形例1又は変形例2の場合に比べて軽減される。
(変形例4)
画像検索システムにおいて、ユーザ端末10がクエリ画像から特定情報を抽出し、このクエリ画像とともに、画像検索サーバ20へ特定情報を送信してもよい。この場合、画像検索サーバ20は、ユーザ端末10から受信した特定情報を用いて、検索処理を行う。
また、ユーザ端末10が、クエリ画像から局所特徴量を抽出して、画像検索サーバ20へ送信してもよい。この場合、画像検索サーバ20は、ユーザ端末10から受信した局所特徴量を用いて、検索処理を行う。
また、登録端末30は、検索対象画像とは別に、この検索対象画像を検索対象として特定するための特定情報を、画像検索サーバ20へ送信してもよい。この場合、画像検索サーバ20は、登録端末30から受信した特定情報を取得して、登録処理を行う。
(変形例5)
画像検索システム1において、検索対象画像やクエリ画像の一部分の画像である部分画像から抽出した局所特徴量を、特定情報としてもよい。以下、登録端末30やユーザ端末10がクエリ画像から局所特徴量と特定情報とを抽出する場合を例に挙げて、画像検索システム1の動作を説明する。
画像検索サーバ20に登録処理を要求する際、登録端末30は、まず、検索対象画像の一部分である部分画像を特定する。例えば、登録端末30は、図20(a)に示すように、検索対象画像Isの画像領域を2×2の格子状に4等分して、決められた位置にある画像領域(ここでは右下部分の画像領域)を、部分画像Ispとして特定する。次に、登録端末30は、部分画像Ispから抽出した局所特徴量を特定情報として、ステップS1の処理で画像検索サーバ20へ送信する。画像検索サーバ20は、ステップS2の処理の登録処理では、特定情報として登録端末30により送信された局所特徴量を、画像検索データベース231へ登録する。ここでは、登録端末30は、図20(b)に示すように、部分画像Ispから抽出された局所特徴量を特定情報として、画像検索データベース231へ登録する。
次に、検索処理に関する画像検索システム1の動作を説明する。図21は、この動作の流れを示すシーケンス図である。
ユーザ端末10の制御部11は、撮影部14により印刷物40を撮影し、この撮影により得られた撮影画像を取得する(ステップS3)。次に、制御部11は、この撮影画像に基づいて、クエリ画像から局所特徴量を抽出する(ステップS52)。ここでは、制御部11が、図11(a)で説明したクエリ画像Iqを取得したものとする。次に、制御部11は、クエリ画像の一部分の画像である部分画像の局所特徴量を、特定情報として抽出する(ステップS53a)。ステップS53aの処理では、制御部11は、クエリ画像において、検索対象画像の部分画像に対応する位置にある部分画像を特定する。ここでは、制御部11は、登録端末30の場合と同じく、クエリ画像の画像領域を2×2の格子状に4等分し、決められた位置にある画像領域(ここでは右下部分の画像領域)を、部分画像Iqpとして特定する(図20(c)参照)。
ステップS53aの処理では、制御部11は、クエリ画像に含まれる画像要素(つまり、印刷物40を撮影した画像要素)の天地方向を特定してから、クエリ画像の部分画像を特定することが望ましい。図20(c)に示すように、クエリ画像に含まれる画像要素の天地方向とクエリ画像の天地方向とが一致して印刷物40が撮影された場合と、図20(d)にドット部で示すように、クエリ画像Iq3に含まれる画像要素の天地方向と、クエリ画像Iq3の天地方向とが一致しない(ここでは、クエリ画像に含まれる画像要素が右回りに90度回転した状態)で印刷物40が撮影された場合とでは、部分画像として特定される画像領域が異なるからである。
そこで、制御部11は、例えば、クエリ画像に含まれる文字やマーカ41(例えばメディアアイコン413)等の、クエリ画像に含まれる画像要素の天地方向を特定するための情報(方向情報)を、当該クエリ画像から検出する。そして、制御部11は、検出した方向情報に基づいて、クエリ画像に含まれる画像要素の天地方向を、クエリ画像の天地方向に一致させるように、当該クエリ画像に対し回転処理を施す。制御部11は、この回転処理後のクエリ画像から部分画像を特定し、特定情報を抽出する。又は、制御部11は、クエリ画像に回転処理を施さないで、クエリ画像に含まれる画像要素の天地方向をクエリ画像の天地方向に一致させた場合に、決められた位置に存在することとなる画像領域を、部分画像として特定してもよい。こうすれば、制御部11は、クエリ画像Iq3に含まれる画像要素の天地方向と、クエリ画像Iq3の天地方向とが不一致である場合であっても、図20(d)に示すように、部分画像Iqpを正しく特定し得る。
なお、前述した方向情報は、クエリ画像の天地方向が、当該クエリ画像に含まれる画像要素の天地方向とどの程度ずれているかを把握し得る情報であればよい。
そして、制御部11は、クエリ画像から抽出した局所特徴量と、部分画像の局所特徴量である特定情報とを、通信部13により画像検索サーバ20へ送信する(ステップS4a)。画像検索サーバ20の制御部21は、クエリ画像から抽出した局所特徴量と、特定情報とを通信部22により受信すると、画像検索処理を実行する(ステップS54,S55)。画像検索処理の流れは、特定情報を部分画像の局所特徴量としている以外は、上述した第1実施形態と同じでよい。そして、制御部21は、画像検索処理の結果に応じたコンテンツ情報をデータベースから取得して、ユーザ端末10へ送信する(ステップS56,S6)。
この変形例の画像検索システム1によれば、検索対象画像やクエリ画像に、特定情報が含まれていなくてもよい。
なお、クエリ画像の部分画像から抽出した局所特徴量を特定情報とする構成は、ユーザ端末10以外の装置が主体となって、局所特徴量や特定情報を抽出する場合にも適用し得る。また、部分画像のサイズや形状、検索対象画像又はクエリ画像における部分画像の位置は、前述した例に限られない。例えば、2以上の検索対象画像の部分画像の局所特徴量が共通することがあるように、部分画像を特定するための条件が決められているとよい。
(変形例6)
本発明の検索対象画像又はクエリ画像の特定情報は、コンテンツプロバイダに応じて決められるものでなくてもよい。特定情報は、例えば、コンテンツプロバイダによって提供されるサービスの種類や、クエリ画像の撮影日時や検索対象画像の登録日時等の日時を示す情報であってもよい。また、特定情報は、前述したアプリケーション識別子であってもよい。
以上のとおり、本発明の特定情報は、検索対象となる画像群を特定するために使用される情報であればよい。この変形例の画像検索システムによれば、クエリ画像や検索対象画像の特定情報に関わらず、ユーザによる検索対象の画像群の指定なしに、検索処理に使用する検索対象画像が絞り込まれる。
(変形例7)
画像検索データベース231の特定情報と、クエリ画像から抽出される特定情報とは必ずしも一致しなくてもよい。すなわち、画像検索データベース231では、クエリ画像の特定情報を用いないで、検索対象画像に対応した局所特徴量やコンテンツ情報が登録されていてもよい。この場合も、画像検索サーバ20は、クエリ画像から抽出した特定情報に対応する検索対象画像の各々についての局所特徴量を取得し、検索処理を行う。
例えば、検索対象画像よりもクエリ画像の方が細かいカテゴリに分類されている場合、画像検索サーバ20は、クエリ画像のカテゴリを包含する分類の検索対象画像の局所特徴量を、検索処理に用いるとよい。反対に、検索対象画像よりもクエリ画像の方が広く分類されている場合、画像検索サーバ20は、クエリ画像のカテゴリに包含されるカテゴリの検索対象画像の局所特徴量を、検索処理に用いるとよい。また、画像検索サーバ20は、クエリ画像のカテゴリと意味上のつながりを有するカテゴリの検索対象画像の局所特徴量を、特定情報に基づいて特定し検索処理に用いてもよい。
(変形例8)
上述した第2実施形態の画像検索システム1において、特定情報に一意に対応付けられたオブジェクト画像は、アイコン画像に限られず、バーコードや二次元コード等の符号化情報を含む符号化画像であってもよい。また、オブジェクト画像は、特定情報を一意に識別する1文字以上の文字列であってもよい。すなわち、クエリ画像の特定情報を示す情報が、当該クエリ画像に含まれているとよい。
また、上述した第2実施形態の画像検索システム1において、メディアアイコン413に代えて、特定情報に一意に対応付けられたオブジェクト画像が使用されてもよい。
(変形例9)
上述した各実施形態において、印刷物40に代えて、画像要素に重ねてマーカ41を配置した画像を表示した表示装置が使用されてもよい。この場合、ユーザ端末10は、当該表示装置が表示した画像(画面)を撮影する。
(変形例10)
上述した各実施形態では、特徴点の特徴量(局所特徴量)として、SIFT特徴量を使用していたが、SURF(Speeded Up Robust Features)特徴量その他の特徴量が使用されてもよい。すなわち、本発明の特徴情報は、輝度勾配の特徴ではなく、特徴点の位置(座標)その他の特徴点の特徴量を表すものであってもよい。
また、本発明の特徴情報は、特徴点の局所的な特徴量以外の、画像検索に使用し得る他の特徴量を表してもよい。
(変形例11)
上述した各実施形態では、画像検索サーバ20は、クエリ画像に類似する検索対象画像に応じたコンテンツ情報を出力していたが、出力対象となる情報はコンテンツ情報に限られない。例えば、類似画像を検索する情報処理システムに本発明を適用した場合には、画像検索サーバ20は、検索データベースから検索した類似画像の画像データを、ユーザ端末10へ送信出力するとよい。この場合、コンテンツ情報に代えて、画像識別子で識別される検索対象画像が、画像検索データベース231へ登録されるとよい。
(変形例12)
画像検索サーバ20は、画像検索データベース231に局所特徴量を登録する機能を備えなくてもよい。この場合、画像検索サーバ20とは別に設けられた画像登録装置が、画像検索データベース231に、局所特徴量やコンテンツ情報を登録する登録処理を行えばよい。
また、画像検索サーバ20は、1台のサーバ装置で実現されるのではなく、複数のサーバ装置の協働によって実現されてもよい。また、画像検索サーバ20が実現していた機能が、ユーザにより使用される通信端末(例えばユーザ端末10)により実現されてもよい。
上述した各実施形態のユーザ端末10や画像検索サーバ20、登録端末30、登録サーバ50が実現する各機能は、1又は複数のハードウェア回路により実現されてもよいし、1又は複数のプログラムを演算装置が実行することにより実現されてよいし、これらの組み合わせにより実現されてもよい。ユーザ端末10や画像検索サーバ20、登録端末30、登録サーバ50の機能がプログラムを用いて実現される場合、このプログラムは、磁気記録媒体(磁気テープ、磁気ディスク(HDD(Hard Disk Drive)、FD(Flexible Disk))等)、光記録媒体(光ディスク等)、光磁気記録媒体、半導体メモリ等のコンピュータ読取可能な記録媒体に記憶した状態で提供されてもよいし、ネットワークを介して配信されてもよい。また、本発明は、コンピュータが行う情報処理方法として把握し得る。
1,1a…画像検索システム、10…ユーザ端末、100…ネットワーク、101…クエリ画像取得手段、102…クエリ画像送信手段、103…コンテンツ情報受信手段、11…制御部、12…UI部、13…通信部、14…撮影部、15…記憶部、20…画像検索サーバ、201…検索対象画像受信手段、202…抽出手段、203…特定情報抽出手段、204…登録処理手段、205…クエリ画像受信手段、206…検索手段、207…コンテンツ情報出力手段、208…画像処理手段、21…制御部、22…通信部、23…記憶部、231…画像検索データベース、232…特定情報テーブル、232…装置管理テーブル、30…登録端末、40…印刷物、41…マーカ、50,50a,50b,50c…登録サーバ。

Claims (8)

  1. クエリ画像を取得する取得手段と、
    前記クエリ画像から検索対象となる画像群を特定するための特定情報を抽出する特定情報抽出手段と、
    前記クエリ画像から画像検索処理で必要となる特徴情報を抽出する特徴情報抽出手段であって、前記クエリ画像から検出したオブジェクト画像を、前記特定情報に対応付けて予め登録されたオブジェクト画像と比較することにより、前記特定情報を抽出する特徴情報抽出手段と、
    前記検出したオブジェクト画像を前記登録されたオブジェクト画像に近づけるように、前記クエリ画像に画像処理を施す画像処理手段と、
    前記特定情報に基づいて特定される検索対象画像に対して、前記特徴情報を用いて前記画像検索処理を行う検索手段と
    を備え
    前記特定情報抽出手段は、
    前記画像処理後の前記クエリ画像から、前記特徴情報を抽出する
    画像検索システム。
  2. 前記検索手段は、前記特定情報に対応付けられたそれぞれのデータベース毎に記憶されている、前記特定情報に対応付けられた前記検索対象画像に対して、前記特徴情報を用いて前記画像検索処理を行う
    ことを特徴とする請求項1に記載の画像検索システム。
  3. 前記特徴情報は、特徴点の特徴量を含み、
    前記検索手段は、
    前記クエリ画像に含まれる前記特徴点のうち、前記検出したオブジェクト画像に含まれる前記特徴点の特徴量を用いないで、前記画像検索処理を行う
    ことを特徴とする請求項1又は2に記載の画像検索システム。
  4. 互いに異なる前記特定情報に対応し、一の前記特定情報で特定される前記画像群の前記特徴情報が登録された複数の登録装置を備え、
    前記検索手段は、
    前記特定情報抽出手段が抽出した特定情報に対応する前記登録装置の前記特徴情報を用いて、前記画像検索処理を行う
    ことを特徴とする請求項1からのいずれか1項に記載の画像検索システム。
  5. 前記特徴情報を登録する登録処理手段を備え、
    前記特徴情報抽出手段は、
    登録要求があった前記検索対象画像から、前記特徴情報を抽出し、
    前記特定情報抽出手段は、
    前記登録要求があった前記検索対象画像から、前記特定情報を抽出し、
    前記登録処理手段は、
    前記特徴情報抽出手段が抽出した前記検索対象画像の特徴情報を、前記特定情報抽出手段が抽出した当該検索対象画像の特定情報に従って、前記画像検索処理で検索対象とするように登録する
    ことを特徴とする請求項1からのいずれか1項に記載の画像検索システム。
  6. 通信端末により送信された前記クエリ画像を受信するクエリ画像受信手段と、
    前記クエリ画像受信手段により受信されたクエリ画像に基づいて前記画像検索処理が行われると、当該画像検索処理で検索された検索対象画像に対応付けられたコンテンツ情報を、前記通信端末へ出力する出力手段と
    を備えることを特徴とする請求項1からのいずれか1項に記載の画像検索システム。
  7. クエリ画像を取得する取得手段と、
    前記クエリ画像から検索対象となる画像群を特定するための特定情報を抽出する特定情報抽出手段と、
    前記クエリ画像から画像検索処理で必要となる特徴情報を抽出する特徴情報抽出手段であって、前記クエリ画像から検出したオブジェクト画像を、前記特定情報に対応付けて予め登録されたオブジェクト画像と比較することにより、前記特定情報を抽出する特徴情報抽出手段と、
    前記検出したオブジェクト画像を前記登録されたオブジェクト画像に近づけるように、前記クエリ画像に画像処理を施す画像処理手段と、
    前記特定情報に基づいて特定される検索対象画像に対して、前記特徴情報を用いて前記画像検索処理を行う検索手段と
    を備え
    前記特定情報抽出手段が、前記画像処理後の前記クエリ画像から、前記特徴情報を抽出する画像検索システムにおける、
    前記特定情報抽出手段を備える情報処理装置。
  8. クエリ画像を取得する取得手段と、
    前記クエリ画像から検索対象となる画像群を特定するための特定情報を抽出する特定情報抽出手段と、
    前記クエリ画像から画像検索処理で必要となる特徴情報を抽出する特徴情報抽出手段であって、前記クエリ画像から検出したオブジェクト画像を、前記特定情報に対応付けて予め登録されたオブジェクト画像と比較することにより、前記特定情報を抽出する特徴情報抽出手段と、
    前記検出したオブジェクト画像を前記登録されたオブジェクト画像に近づけるように、前記クエリ画像に画像処理を施す画像処理手段と、
    前記特定情報に基づいて特定される検索対象画像に対して、前記特徴情報を用いて前記画像検索処理を行う検索手段と
    を備え
    前記特定情報抽出手段が、前記画像処理後の前記クエリ画像から、前記特徴情報を抽出する画像検索システムにおける、情報処理装置のコンピュータを、
    前記特定情報抽出手段として機能させるためのプログラム。
JP2013172375A 2013-08-22 2013-08-22 画像検索システム、情報処理装置及びプログラム Expired - Fee Related JP5967036B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013172375A JP5967036B2 (ja) 2013-08-22 2013-08-22 画像検索システム、情報処理装置及びプログラム
CN201410081120.9A CN104424349A (zh) 2013-08-22 2014-03-06 图像检索系统、信息处理装置和图像检索方法
US14/211,007 US9311562B2 (en) 2013-08-22 2014-03-14 Image retrieval system, information processing apparatus, image retrieval method, and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013172375A JP5967036B2 (ja) 2013-08-22 2013-08-22 画像検索システム、情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2015041270A JP2015041270A (ja) 2015-03-02
JP5967036B2 true JP5967036B2 (ja) 2016-08-10

Family

ID=52480448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013172375A Expired - Fee Related JP5967036B2 (ja) 2013-08-22 2013-08-22 画像検索システム、情報処理装置及びプログラム

Country Status (3)

Country Link
US (1) US9311562B2 (ja)
JP (1) JP5967036B2 (ja)
CN (1) CN104424349A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6831769B2 (ja) * 2017-11-13 2021-02-17 株式会社日立製作所 画像検索装置、画像検索方法、及び、それに用いる設定画面

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6345104B1 (en) * 1994-03-17 2002-02-05 Digimarc Corporation Digital watermarks and methods for security documents
US6519627B1 (en) * 1999-09-27 2003-02-11 International Business Machines Corporation System and method for conducting disconnected transactions with service contracts for pervasive computing devices
US6664976B2 (en) * 2001-04-18 2003-12-16 Digimarc Corporation Image management system and methods using digital watermarks
JP4251629B2 (ja) * 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
CN100501728C (zh) * 2003-01-31 2009-06-17 佳能株式会社 图像处理方法、系统、程序、程序存储介质以及信息处理设备
US7391917B2 (en) * 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
JP3862694B2 (ja) * 2003-11-20 2006-12-27 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US8335789B2 (en) * 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
JP4641414B2 (ja) * 2004-12-07 2011-03-02 キヤノン株式会社 文書画像検索装置、文書画像検索方法、プログラム、記憶媒体
CN101297319B (zh) * 2005-08-23 2013-02-27 株式会社理光 在电子文档中嵌入热点
EP1917636B1 (en) * 2005-08-23 2019-04-10 Ricoh Company, Ltd. Method and system for image matching in a mixed media environment
JP4859025B2 (ja) 2005-12-16 2012-01-18 株式会社リコー 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
DE102008012426A1 (de) * 2007-10-31 2009-05-07 Bundesdruckerei Gmbh Sicherung von Dokumenten
JP5147640B2 (ja) 2008-10-23 2013-02-20 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP2010211262A (ja) 2009-03-06 2010-09-24 Panasonic Corp 画像検索用情報表示装置

Also Published As

Publication number Publication date
US20150055878A1 (en) 2015-02-26
JP2015041270A (ja) 2015-03-02
CN104424349A (zh) 2015-03-18
US9311562B2 (en) 2016-04-12

Similar Documents

Publication Publication Date Title
JP5181888B2 (ja) グラフィカルユーザインターフェースを生成する方法及びシステム
JP5621897B2 (ja) 処理方法、コンピュータプログラム及び処理装置
US10073859B2 (en) System and methods for creation and use of a mixed media environment
CN106462728B (zh) 用于基于图像特征的识别的系统和方法
US7669148B2 (en) System and methods for portable device for mixed media system
US8184155B2 (en) Recognition and tracking using invisible junctions
JP5095535B2 (ja) 画像処理方法、画像処理システム、画像処理装置及びプログラム
US9171202B2 (en) Data organization and access for mixed media document system
US8949287B2 (en) Embedding hot spots in imaged documents
US8335789B2 (en) Method and system for document fingerprint matching in a mixed media environment
US8838591B2 (en) Embedding hot spots in electronic documents
US7991778B2 (en) Triggering actions with captured input in a mixed media environment
US8521737B2 (en) Method and system for multi-tier image matching in a mixed media environment
US7885955B2 (en) Shared document annotation
WO2007130688A2 (en) Mobile computing device with imaging capability
JP2010518507A (ja) 特徴マッチング方法
Chen et al. Building book inventories using smartphones
JP6365024B2 (ja) サービス提供装置、方法、及びプログラム
CN104603833A (zh) 用于将印刷对象与电子内容链接的方法和系统
JP2013109773A (ja) 特徴マッチング方法及び商品認識システム
JP6171660B2 (ja) 情報処理装置、情報処理システム及びプログラム
EP1917635A1 (en) Embedding hot spots in electronic documents
JP5967036B2 (ja) 画像検索システム、情報処理装置及びプログラム
JP6244887B2 (ja) 情報処理装置、画像探索方法、及びプログラム
JP5410372B2 (ja) コンテンツ検索装置及び方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160620

R150 Certificate of patent or registration of utility model

Ref document number: 5967036

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees