[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2004503017A - 画像中のオブジェクトを表現および探索する方法および装置 - Google Patents

画像中のオブジェクトを表現および探索する方法および装置 Download PDF

Info

Publication number
JP2004503017A
JP2004503017A JP2002508670A JP2002508670A JP2004503017A JP 2004503017 A JP2004503017 A JP 2004503017A JP 2002508670 A JP2002508670 A JP 2002508670A JP 2002508670 A JP2002508670 A JP 2002508670A JP 2004503017 A JP2004503017 A JP 2004503017A
Authority
JP
Japan
Prior art keywords
view
image
images
descriptor
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002508670A
Other languages
English (en)
Other versions
JP4632627B2 (ja
JP2004503017A5 (ja
Inventor
ボバー、ミロスロー
クーパー、ジェイムズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Elecric Information Technology Centre Europe BV
Original Assignee
Mitsubishi Elecric Information Technology Centre Europe BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Elecric Information Technology Centre Europe BV filed Critical Mitsubishi Elecric Information Technology Centre Europe BV
Publication of JP2004503017A publication Critical patent/JP2004503017A/ja
Publication of JP2004503017A5 publication Critical patent/JP2004503017A5/ja
Application granted granted Critical
Publication of JP4632627B2 publication Critical patent/JP4632627B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

画像に出現するオブジェクトを表現する方法であって、本方法は、オブジェクトの複数のビュー記述子を導出することを含み、各ビュー記述子はオブジェクトの異なるビューに対応し、2つ以上のビュー記述子を関連付けることを含み、さらに、本方法は、それぞれのビューが画像に出現するオブジェクトのビューに対応するときに各ビュー記述子に対して示すことを含む。

Description

【0001】
本発明は、例えばマルチメディア・データベースにおいて、特に探索に使用するための、画像中のオブジェクトを表現する方法および装置に関する。また、本発明は、画像中のオブジェクトを探索する方法および装置に関する。
【0002】
画像に出現するオブジェクトの表現を使用して、静止画像またはビデオ画像を、例えば画像ライブラリに記憶することが知られている。表現は、注目のオブジェクトを含んでいる画像を取り出すことを可能にするために、探索方法において使用される。表現は、色、テクスチャ、および形状を含む、オブジェクトの様々な特徴に基づく可能性がある。
【0003】
画像中のオブジェクトの形状を表現する様々な方法が、知られている。既知の方法には、チェーン符号化、四分木法、および曲率スケール空間表現方法が含まれる。
【0004】
画像探索システムにおいて探索を実施するために、ユーザは、求めるオブジェクトのスケッチまたは画像をシステムに提示することによって、または、システム上に記憶されたオブジェクトのビューを選択することによって、クエリを入力する。次いで、システムは、クエリオブジェクトの表現を導出または獲得し、適切な整合方法を使用して、クエリ表現をデータベースに記憶された画像の表現と比較する。最も近い整合が、表示ユニット上に表示される。
【0005】
ほとんどの場合、ビデオ画像に出現するオブジェクトは、3次元の実際のオブジェクトを2次元の像平面上に投影したものである。したがって、画像に出現する、オブジェクトの2次元の形状または輪郭と、可視であるオブジェクト表面の色およびテクスチャとは、視点位置、視角、カメラおよび光学システムのパラメータなどの要因に依存する。したがって、オブジェクトは、輪郭、形状、色、テクスチャなど、異なるビューに関連する異なる特徴を有することになる。
【0006】
本出願人の同時係属中の特許出願であるPCT/GB00/01662は、その内容を参照により本明細書に組み込んでおり、複数の異なる2次元ビューのオブジェクトの表現を導出し、関連付けて、オブジェクト表現を形成する、画像に出現するオブジェクトを表現する方法および装置について開示している。表現は、オブジェクトの形状に関することが好ましいが、例えば、異なるビューの色またはテクスチャに関する可能性もある。
【0007】
上述した方法を、静止画像または映画などの内部のオブジェクトに適用するとき、異なるビューに関連するオブジェクトの特徴を表現するため、画像に関連付けられたいくつかの形状または他の記述子が存在する。しかし、通常、これらのビューのいずれも、元の画像内で可視である。特徴のいくつかは、オブジェクトの可視でない部分に関連し、オブジェクトの3D特性を記述するためのみのものである可能性がある。
【0008】
オブジェクトの複数のビューのどれが可視で、どれが可視でないかを決定することができない場合、探索方法は、指定のビューを正確に見つけることができない。例えば、側面ビューを使用して、自動車を描写している画像を探索すると、自動車の上面および前面のビューも見つけることになる。
【0009】
本発明の概念は、どの記述子が、その記述子が連結される画像または映画の内部の可視特徴に実際に関係するかを示す可視フラグを使用することである。
【0010】
したがって、本発明は、画像に出現するオブジェクトを表現する方法を提供する。本方法は、オブジェクトの複数のビュー記述子を導出することを含み、各ビュー記述子は、オブジェクトの異なるビューに対応し、さらに、ビューが、画像に出現するオブジェクトのビューに対応するときに示すことを備える。
【0011】
PCT/GB00/01662に開示された発明では、形状記述子は、1つのマルチメディアコンテントの内部に存在するオブジェクトに関連付けられる。そのような記述子は、異なるビューからオブジェクトの形状を記述した。これらのビューは、マルチメディア素材内で、可視または可視でないことがあり得る。可視フラグは、この可視情報を記憶する。
【0012】
各ビューの可視データが、使用可能であるとき、探索方法は、必要なときに、可視でないビューを有するオブジェクトをフィルタリングすることができる。
【0013】
本発明の一実施の形態について、添付の図面を参照して説明する。
【0014】
本発明の一実施の形態によるシステムを図1に示す。システムは、システムの動作を制御するコンピュータなどの制御ユニット2と、画像およびテキストを含む出力を表示する制御ユニット2に接続されたモニタなどの表示ユニット4と、制御ユニット2に命令を入力するマウスなどのポインティングデバイス6とを含む。また、システムは、複数の静止画像およびビデオ・シーケンスの形態の画像のグループのデジタル・バージョンを記憶する画像データベース8と、画像データベース8に記憶された静止画像およびビデオ・シーケンスのそれぞれに出現するオブジェクトに対し、以下でより詳細に説明する記述子の情報を記憶する記述子データベース10とを含む。画像データベース8と記述子データベース10のそれぞれは、制御ユニット2に接続される。
【0015】
この実施の形態では、システムの要素は、画像ライブラリなど、システムの構成要素が永続的に連結される、単一のサイト上に提供される。
【0016】
本発明の一実施の形態によるオブジェクトに対する記述子を導出する方法について、以下で説明する。まず、この場合は円柱状のオブジェクトである、比較的単純な形状を有するオブジェクトについて、方法を説明する。
【0017】
この例では、画像データベース8に記憶されたビデオ・シーケンスに、円柱状のオブジェクトは、2度出現する。図2を参照すると、第1の出現では、オブジェクトの輪郭は、側方からのビューであるビュー1に対応し、第2の出現では、オブジェクトの輪郭は、側方かつ上方からの斜視ビューであるビュー3に対応する。
【0018】
データベース・インデクサは、2つの輪郭が同じオブジェクトのものであり、かつ、それらの輪郭に対応する3次元のオブジェクトが円柱であることを認識する。ビュー1およびビュー3のそれぞれに対して、曲率スケール空間(CSS)表現を使用する形状記述子が導出される。また、データベース・インデクサは、オブジェクトを表現していると見なされる追加のビューを、それらが考慮中のビデオ・シーケンスに出現しない場合でも、選択する。この例では、上方からの円柱のビューであるビュー2が、表現しているとして選択される。そのビューのCSS表現も、獲得される。
【0019】
Farzin Mokhtarian、Sadegh AbbassiおよびJosef Kittlerによる論文「Robust and Efficient Shape Indexing through Curvature Scale Space」(Proc. British Machine Vision Conference, pp.53−62, Edinburgh, UK 1996)は、曲率スケール空間表現の方法について記載しており、これは、参照により、本明細書に組み込まれている。簡潔には、形状の輪郭を表現する曲線は、曲線を平滑化することによって展開される。曲線は、展開の多数の異なる段階において考察される。より具体的には、曲率ゼロの交差は、展開段階のそれぞれにおける曲率関数において識別される。曲率ゼロの交差のグラフが、展開の全段階からゼロの交差を組み合わせることによって獲得される。グラフの一方の軸は、曲線の展開パラメータを表すσに対応し、他方の軸は、曲線の弧の長さのパラメータuに対応する。次いで、形状が、グラフの輪郭の極大点(maxima)の位置によって表現される。
【0020】
各ビューに対し、適切なCSS表現を含むビュー記述子が形成される。ビュー記述子は、PCT/GB00/01662に記載されたグローバルパラメータ、または、対応する可視表面の色/テクスチャの特性など、他の情報を含む可能性がある。
【0021】
ビュー形状記述子は、3Dオブジェクト形状記述子を形成するように、組み合わされる。さらに、所与のビューが、ビデオ・シーケンスの少なくとも1つのフレームにおいて、可視であるか否かを示す可視フラグが、オブジェクト記述子に関連付けられる。この例では、可視フラグは、各ビュー記述子の一部を形成する。したがって、ここでは、ビュー1とビュー3のそれぞれのビュー記述子は、そのビューがビデオのフレームにおいて可視であることを示す可視フラグ「1」を含み、ビュー2のビュー記述子は、そのビューがいずれのフレームにおいても可視でないことを示す可視フラグ「0」を有する。
【0022】
3Dオブジェクト形状記述子が、画像データベース8の画像または画像のグループに出現する注目のすべてのオブジェクトに対して、上記の方式で獲得される。
【0023】
他の例として、図3を参照すると、3つのビューが、写真に出現する自動車に対して導出される。CSS表現を含んでいる対応するビュー記述子が、各ビューの自動車の輪郭に対して、上述したように獲得される。第1のビューは、写真のビューに対応し、したがって、関連するビュー記述子は、可視ビューを示す可視フラグ「1」を有する。他の2つのビューに対するビュー記述子は、それらが写真には示されていないビューに対応することを示す可視フラグ「0」を有する。この例では、可視フラグは、写真から輪郭を抽出するときに決定される。すなわち、形状が写真から直接抽出される場合、それには「1」の可視フラグが与えられるが、形状がインデクサによって選択される場合、それは「0」の可視フラグを有する。代替として、可視フラグは、検査によって、後に手作業で追加することができる。
【0024】
また、各ビュー記述子は、どの画像、またはどのビデオ・シーケンスのどのフレームにそれが出現するかを示し、また、画像またはフレームのどのオブジェクトがそれであるかをも示す、参照ポインタを有する。例えば、オブジェクトのビューは、それが、ビデオ181のフレーム1000に出現し、かつ、オブジェクト番号3であることを示すポインタを有する可能性がある。
【0025】
記述子データベース10は、画像データベース8に記憶された画像およびビデオ・シーケンスのオブジェクトに対する3Dオブジェクト形状記述子を記憶する。
【0026】
上述した実施の形態では、ビデオ・シーケンスに出現するオブジェクトに対し、1組のビュー記述子が、シーケンス全体に対して導出され、このビュー記述子は、関連するビューが、シーケンスの少なくとも1つのフレームに出現するか否かを示すために使用される。代替実施の形態では、各フレームは、別々に処理される。より詳細には、1組のビュー記述子が、フレームに出現するオブジェクトに対して導出され、可視フラグは、関連するビューが、シーケンスの別のフレームに出現するか否かに関係なく、そのフレームに出現するか否かを示す。別の代替実施の形態では、1組のビュー記述子が、ビデオ・シーケンスに出現するオブジェクトに対して導出され、1組の対応する可視フラグが、各フレームに対して、導出され、記憶される。
【0027】
可視フラグは、以下で説明するように、画像のオブジェクトを探索する方法において使用される。
【0028】
ユーザは、クエリを入力することによって、探索を開始する。クエリは、ポインティングデバイス6を使用して、表示ユニット4上に1つまたは複数の形状の輪郭を描くことによって入力される。次いで、制御ユニット2は、そのクエリビューに対するCSSビュー記述子を導出する。代替として、ユーザは、制御ユニット2によって表示ユニット4上に表示された形状のメニューから、1つまたは複数のクエリ形状を選択することによって、クエリを入力することが可能である。そのような場合、ビュー記述子は、記述子データベース10において、すでに使用可能である可能性がある。また、ユーザは、ボックスをチェックすることによって、探索が、クエリビューと同じビューに限定されるべきであるか否かを示す。探索が、そのように限定されない場合、探索と整合の手続きが、クエリオブジェクト記述子と、これ以降モデルオブジェクト記述子と呼ぶ、記述子データベース10に記憶されたオブジェクト記述子との類似性を判定することによって、本質的にPCT/GB00/01662に記述されているように実施される。
【0029】
簡潔には、ビュー類似性測度を導出すべく、整合関数を使用したコンパレータにおいて、各クエリビュー記述子は考慮中のモデルオブジェクト記述子に対する各モデル・ビュー記述子と比較される。i番目のクエリビュー記述子とj番目のモデル・ビュー記述子の比較により、ビュー類似性測度s が得られる。2つ以上のクエリビューが存在する場合は、ビュー類似性測度の中央値を、オブジェクト類似性測度Sとして取る。
【0030】
整合手続きにより、nの類似性測度Sが得られる。nは、記述子データベースの3Dオブジェクト記述子の数である。次いで、nの類似性測度は、最も近い整合を示す最低値から開始して順序付けられる。次いで、mの最低値(ここで、mはユーザよって選択された値、または制御ユニットの設定によって決定された値である)が選択され、オブジェクトを含んでいる対応するmの画像(そのいくつかは、ビデオ・シーケンスからの画像である可能性がある)が、表示ユニット4上に表示される。
【0031】
探索が、クエリビューと同じであるビューに限定される場合、可視でないモデル・ビューは、探索プロセス中にフィルタリングにより除去される。これは、整合関数を使用して、クエリビュー記述子を、対応するビューが画像において可視であることを示すモデル・ビュー記述子とのみ整合することによって、行うことができる。すなわち、整合関数を使用して類似性測度を計算するとき、可視フラグ「0」を有するモデル・ビュー記述子は、省かれる。代替として、ビュー類似性測度は、すべてのモデル・ビュー記述子に対して計算することが可能であるが、可視フラグがゼロであるモデル・ビュー記述子に対する結果は、さらなる処理から省かれる。代替として、可視フラグは、表示する探索結果を選択するときに考慮することができる。整合手続きの結果を表示するとき、ビデオ・シーケンスの場合、整合されたビューを含んでいるフレームが表示される。
【0032】
図4は、PCT/GB00/01662に開示された複数のビューを探索する方法が、クエリ項目と同じ形状であるが、同じビューではない結果を見つけ、それを返す方法の一例を示す。一方、図5は、ビュー記述子のそれぞれの内部にある可視フラグが、クエリ項目と同じ形状であり、かつ同じビューである結果を返す助けとなることができる方法を示す。
【0033】
本発明によるシステムは、例えば、画像ライブラリにおいて提供することが可能である。代替として、データベースは、システムの制御ユニットから遠隔して配置し、電話線など一時的な連結によって、またはインターネットなどのネットワークによって、制御ユニットに接続することが可能である。画像および記述子データベースは、例えば、永続的な記憶装置において、または、CD−ROMあるいはDVDなどの携帯型データ記憶媒体上に提供することが可能である。
【0034】
セレクタおよびコンパレータなど、記述したシステムの構成要素は、ソフトウエアまたはハードウエアの形態で提供することが可能である。本発明をコンピュータ・システムの形態において説明してきたが、例えば専用チップを使用して、他の形態で実施することができる。
【0035】
特定の例を、オブジェクトの2D形状を表現する方法と、2つの形状の類似性を表現する値を計算する方法とについて与えたが、任意の適切なそのような方法を使用することができる。
【0036】
完全または準完全な形状記述を作成するオブジェクトの様々なビューは、例えば、フィルム・プロデューサによって提供することが可能である。例えば、自動車を含んでいるフィルムでは、プロデューサは、自動車の20の異なるビューを撮影して、データベースのフィルムを指標付けすることに使用するように構成することが可能である。代替として、ビューを見つけることを可能にするように、シーケンスにおけるオブジェクトのすべての異なるビュー間を連結することが可能であり、また、シーケンスに出現していないあらゆる有用なビューに対する形状を、例えば、オブジェクトの第1のビューのデータが含まれているとき、提供することが可能である。
【0037】
また、本発明は、例えば、確認の目的で、またはフィルタリングするために、オブジェクトの画像を整合することに使用することができる。
【0038】
本発明は、単一の画像、および、フィルムまたはビデオからの画像など、画像シーケンスの画像、または、同じウエッブ・ページ上にあるような、何らかの方法で関連付けられる画像の集合に適用可能である。
【0039】
上述した実施の形態では、ビュー記述子は、異なるビューのオブジェクトの形状から導出される。ビュー記述子は、形状からの代わりに、または形状からの他に、色またはテクスチャなど、オブジェクトの他の特徴から導出することができる。形状、色、テクスチャなど、オブジェクトの様々な特徴は、単独でまたは組み合わされて、ビュー記述子の基盤を形成することができ、ビュー記述子は、異なるビューの異なる特徴に基づくことができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態によるシステムのブロック図である。
【図2】ビデオ・シーケンス中のオブジェクトの表現を示す図である。
【図3】静止画像中のオブジェクトの表現を示す図である。
【図4】第1の探索方法の結果を示す図である。
【図5】第2の探索方法の結果を示す図である。

Claims (19)

  1. 画像に出現するオブジェクトを表現する方法であって、前記オブジェクトの複数のビュー記述子を導出することを含み、各ビュー記述子は前記オブジェクトの異なるビューに対応し、それぞれのビューが前記画像に出現する前記オブジェクトのビューに対応するときに各ビュー記述子に対して示すことを含む方法。
  2. 前記それぞれのビューが前記画像に出現する前記オブジェクトのビューに対応するか否かを示すためにフラグを前記各ビュー記述子に関連付けることを含む、請求項1に記載の方法。
  3. 画像のグループに出現するオブジェクトを表現する方法であって、前記オブジェクトの複数のビュー記述子を導出することを含み、各ビュー記述子は前記オブジェクトの異なるビューに対応し、それぞれのビューが前記画像のグループに出現する前記オブジェクトのビューに対応するときに各ビュー記述子に対して示すことを含む方法。
  4. 前記それぞれのビューが前記画像のグループの少なくとも1つの画像に出現するか否かを示すためにフラグを前記各ビュー記述子に関連付けることを含む、請求項3に記載の方法。
  5. 画像のグループの各画像について、前記それぞれのビューが前記画像に出現する前記オブジェクトのビューに対応するか否かを前記各ビュー記述子に対して示すことを含む、請求項3に記載の方法。
  6. 前記画像のグループは、画像のシーケンスである、請求項3ないし5のいずれか一項に記載の方法。
  7. 前記画像のシーケンスは、ビデオまたはフィルムからのものである、請求項6に記載の方法。
  8. 少なくとも1つのビュー記述子が、前記それぞれのビューにおける前記オブジェクトの可視特徴の表現を備える、請求項1ないし7のいずれか一項に記載の方法。
  9. 少なくとも1つのビュー記述子が、前記それぞれのビューにおける前記オブジェクトの形状の表現を備える、請求項8に記載の方法。
  10. 形状ビュー記述子は、曲率スケール空間表現を使用して導出される、請求項9に記載の方法。
  11. 少なくとも1つのビュー記述子が、前記それぞれのビューにおける前記オブジェクトの色の表現を備える、請求項8に記載の方法。
  12. 少なくとも1つのビュー記述子が、前記それぞれのビューにおける前記オブジェクトのテクスチャの表現を備える、請求項8に記載の方法。
  13. 探索の目的で、画像または画像の集合に指標付けするためのものである、請求項1ないし12のいずれか一項に記載の方法。
  14. 探索の目的で、データベースに記憶された画像または画像のグループに指標付けする方法であって、画像または画像のグループに出現するオブジェクトを識別すること、前記オブジェクトの複数の異なるビューの表現を導出すること、および、表現されたビューが前記オブジェクトの前記ビューに対応するときにそれが画像に出現するように示すことを含む方法。
  15. 画像または画像のグループに記憶されたクエリオブジェクトを探索する方法であって、クエリを入力すること、前記クエリを、請求項1ないし14のいずれか一項に記載された方法を使用して導出された記憶画像の表現と整合すること、および、最も近い整合を取り出すことを備え、クエリ入力は、クエリビューと同じビューに前記クエリオブジェクトを示す画像または画像のグループに前記探索が限定されるべきであるか否かを示すことを含む方法。
  16. 請求項1ないし15のいずれか一項に記載された方法を実施するように適合された画像探索および取出しシステム。
  17. 請求項1ないし15のいずれか一項に記載された方法を実施するためのコンピュータ・プログラム。
  18. 請求項1ないし15のいずれか一項に記載された方法により動作するようにプログラミングされたコンピュータ・システム。
  19. 請求項1ないし15のいずれか一項に記載された方法を実施するためのコンピュータ実行可能プロセス・ステップを記憶するコンピュータ読取り可能記憶媒体。
JP2002508670A 2000-07-07 2001-07-06 画像中のオブジェクトを表現および探索する方法および装置 Expired - Lifetime JP4632627B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0016809A GB2364590B (en) 2000-07-07 2000-07-07 Method and apparatus for representing and searching for an object in an image
PCT/GB2001/003044 WO2002005129A1 (en) 2000-07-07 2001-07-06 Method and apparatus for representing and searching for an object in an image

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010169455A Division JP2011028757A (ja) 2000-07-07 2010-07-28 画像に出現するオブジェクトを表現する方法、前記方法を実施するように適合された装置、及び前記方法を実施するためのコンピュータ実行可能プロセス・ステップを記憶するコンピュータで読み取り可能な記憶媒体

Publications (3)

Publication Number Publication Date
JP2004503017A true JP2004503017A (ja) 2004-01-29
JP2004503017A5 JP2004503017A5 (ja) 2008-04-17
JP4632627B2 JP4632627B2 (ja) 2011-02-16

Family

ID=9895287

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002508670A Expired - Lifetime JP4632627B2 (ja) 2000-07-07 2001-07-06 画像中のオブジェクトを表現および探索する方法および装置
JP2010169455A Pending JP2011028757A (ja) 2000-07-07 2010-07-28 画像に出現するオブジェクトを表現する方法、前記方法を実施するように適合された装置、及び前記方法を実施するためのコンピュータ実行可能プロセス・ステップを記憶するコンピュータで読み取り可能な記憶媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010169455A Pending JP2011028757A (ja) 2000-07-07 2010-07-28 画像に出現するオブジェクトを表現する方法、前記方法を実施するように適合された装置、及び前記方法を実施するためのコンピュータ実行可能プロセス・ステップを記憶するコンピュータで読み取り可能な記憶媒体

Country Status (8)

Country Link
US (6) US7269285B2 (ja)
EP (5) EP1299822B1 (ja)
JP (2) JP4632627B2 (ja)
KR (5) KR100957888B1 (ja)
CN (5) CN1242351C (ja)
AU (1) AU2001269289A1 (ja)
GB (1) GB2364590B (ja)
WO (1) WO2002005129A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193398A (ja) * 2008-02-15 2009-08-27 Seiko Epson Corp 画像検索装置、画像検索方法、及び画像検索プログラム

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2364590B (en) * 2000-07-07 2004-06-02 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
AR031202A1 (es) 2000-11-03 2003-09-10 Wyeth Corp Ciclopenta(b) (1,4)diazepino(6,7,1-hi) indoles y derivados
US7624123B2 (en) * 2004-02-26 2009-11-24 Ati Technologies, Inc. Image processing system and method
US7812986B2 (en) 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US9373029B2 (en) 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US7702673B2 (en) * 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US10192279B1 (en) 2007-07-11 2019-01-29 Ricoh Co., Ltd. Indexed document modification sharing with mixed media reality
US9495385B2 (en) 2004-10-01 2016-11-15 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US7430322B1 (en) * 2005-05-02 2008-09-30 Nanostellar, Inc. Particle shape characterization from 2D images
US7561756B1 (en) 2005-05-02 2009-07-14 Nanostellar, Inc. Particle shape characterization from 2D images
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US9063952B2 (en) * 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US7856380B1 (en) * 2006-12-29 2010-12-21 Amazon Technologies, Inc. Method, medium, and system for creating a filtered image set of a product
SE533185C2 (sv) * 2007-02-16 2010-07-13 Scalado Ab Metod för behandling av en digital bild samt bildrepresentationsformat
US8125481B2 (en) 2008-03-21 2012-02-28 Google Inc. Lightweight three-dimensional display
US8886669B2 (en) * 2008-03-21 2014-11-11 Trimble Navigation Limited File access via conduit application
JP4770960B2 (ja) * 2009-03-30 2011-09-14 カシオ計算機株式会社 画像検索システム及び画像検索方法
US7953245B2 (en) * 2009-08-18 2011-05-31 General Electric Company System, method and program product for camera-based object analysis
JP4850278B2 (ja) * 2009-11-20 2012-01-11 株式会社ソニー・コンピュータエンタテインメント コンテンツ作成支援装置、コンテンツ作成支援方法、およびシナリオファイル生成方法
US8687898B2 (en) * 2010-02-01 2014-04-01 Toyota Motor Engineering & Manufacturing North America System and method for object recognition based on three-dimensional adaptive feature detectors
US9652462B2 (en) * 2010-04-29 2017-05-16 Google Inc. Identifying responsive resources across still images and videos
US8555192B2 (en) * 2010-06-03 2013-10-08 Microsoft Corporation Sketching and searching application for idea generation
US9449026B2 (en) 2010-08-31 2016-09-20 Microsoft Technology Licensing, Llc Sketch-based image search
US8619124B2 (en) * 2010-10-14 2013-12-31 Industrial Technology Research Institute Video data processing systems and methods
WO2012079617A1 (de) * 2010-12-13 2012-06-21 Incca Gmbh Vorrichtung und verfahren zur unterstuetzung der durchfuehrung eines wartungs- und/oder bedienvorgangs
US8799201B2 (en) 2011-07-25 2014-08-05 Toyota Motor Engineering & Manufacturing North America, Inc. Method and system for tracking objects
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US8655016B2 (en) * 2011-07-29 2014-02-18 International Business Machines Corporation Example-based object retrieval for video surveillance
CN108197631B (zh) * 2012-07-23 2022-06-28 苹果公司 提供图像特征描述符的方法
CN103870485B (zh) * 2012-12-13 2017-04-26 华为终端有限公司 实现增强现实应用的方法及设备
US9147125B2 (en) 2013-05-03 2015-09-29 Microsoft Technology Licensing, Llc Hand-drawn sketch recognition
US9355123B2 (en) 2013-07-19 2016-05-31 Nant Holdings Ip, Llc Fast recognition algorithm processing, systems and methods
CN106462774B (zh) * 2014-02-14 2020-01-24 河谷控股Ip有限责任公司 通过规范形状的对象摄取、系统和方法
WO2015123647A1 (en) 2014-02-14 2015-08-20 Nant Holdings Ip, Llc Object ingestion through canonical shapes, systems and methods
WO2015127117A1 (en) * 2014-02-19 2015-08-27 Nant Holdings Ip, Llc Invariant-based dimensional reduction of object recognition features, systems and methods
US9827714B1 (en) 2014-05-16 2017-11-28 Google Llc Method and system for 3-D printing of 3-D object models in interactive content items
CN107077590B (zh) * 2014-10-13 2021-03-30 意大利电信股份公司 用于比较视频镜头的方法和系统
WO2016183020A1 (en) 2015-05-11 2016-11-17 Magic Leap, Inc. Devices, methods and systems for biometric user recognition utilizing neural networks
CA3015658A1 (en) 2016-03-11 2017-09-14 Magic Leap, Inc. Structure learning in convolutional neural networks
CN113874883A (zh) 2019-05-21 2021-12-31 奇跃公司 手部姿势估计
US11775617B1 (en) * 2021-03-15 2023-10-03 Amazon Technologies, Inc. Class-agnostic object detection

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61231630A (ja) * 1985-04-05 1986-10-15 Mitsubishi Electric Corp デ−タ検索装置
JPS6278684A (ja) * 1985-10-02 1987-04-10 Fujitsu Ltd 物体検索方式
JPS6423379A (en) * 1987-07-20 1989-01-26 Agency Ind Science Techn Object recognizing device
JPH11338876A (ja) * 1998-05-27 1999-12-10 Hitachi Ltd 映像検索方法及び装置ならびに記録媒体

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4270229A (en) * 1980-01-17 1981-06-02 Louisville Manufacturing Co., Inc. Method of surface ornamented cap
US4548704A (en) * 1982-07-19 1985-10-22 E. I. Du Pont De Nemours And Company Pitch for direct spinning into carbon fibers derived from a steam cracker tar feedstock
US4584704A (en) 1984-03-01 1986-04-22 Bran Ferren Spatial imaging system
JPS6423379U (ja) 1987-07-31 1989-02-07
GB9322260D0 (en) * 1993-10-28 1993-12-15 Pandora Int Ltd Digital video processor
US5465353A (en) * 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
US6205231B1 (en) * 1995-05-10 2001-03-20 Identive Corporation Object identification in a moving video image
US5710877A (en) * 1995-12-29 1998-01-20 Xerox Corporation User-directed interaction with an image structure map representation of an image
US5907846A (en) * 1996-06-07 1999-05-25 Electronic Data Systems Corporation Method and system for accessing relational databases using objects
US5809505A (en) * 1996-06-14 1998-09-15 Lo; Thomas System and method for relational to object mapping
US6006214A (en) * 1996-12-04 1999-12-21 International Business Machines Corporation Database management system, method, and program for providing query rewrite transformations for nested set elimination in database views
US6122627A (en) * 1997-05-09 2000-09-19 International Business Machines Corporation System, method, and program for object building in queries over object views
US6038074A (en) * 1997-05-20 2000-03-14 Ricoh Company, Ltd. Three-dimensional measuring apparatus and method, image pickup apparatus, and apparatus and method for inputting image
AUPO894497A0 (en) * 1997-09-02 1997-09-25 Xenotech Research Pty Ltd Image processing method and apparatus
KR19990025292A (ko) * 1997-09-11 1999-04-06 정선종 필터링 과정에 의한 이미지 데이터 베이스의 효과적 검색 방법
FI103417B1 (fi) * 1997-09-16 1999-06-30 Metsae Serla Oyj Paperiraina ja menetelmä sen valmistamiseksi
US6249600B1 (en) * 1997-11-07 2001-06-19 The Trustees Of Columbia University In The City Of New York System and method for generation of a three-dimensional solid model
JP3383563B2 (ja) * 1997-12-18 2003-03-04 富士通株式会社 物体移動シミュレーション装置
US6301370B1 (en) * 1998-04-13 2001-10-09 Eyematic Interfaces, Inc. Face recognition from video images
KR20000016778A (ko) * 1998-12-18 2000-03-25 윌리암 아메스 커트라이트 균일 포맷의 디지탈 맵 이미지를 생성시키는 방법 및 장치
US6819797B1 (en) * 1999-01-29 2004-11-16 International Business Machines Corporation Method and apparatus for classifying and querying temporal and spatial information in video
KR100390866B1 (ko) * 1999-02-05 2003-07-12 삼성전자주식회사 컬러 영상 처리 방법 및 그 장치
GB2375212B (en) * 1999-04-29 2003-06-11 Mitsubishi Electric Inf Tech Method and apparatus for searching for an object using shape
GB2394350B (en) * 1999-07-05 2004-06-16 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
KR100422697B1 (ko) * 1999-12-27 2004-03-12 엘지전자 주식회사 색공간 양자화 묘사자
GB2364590B (en) * 2000-07-07 2004-06-02 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61231630A (ja) * 1985-04-05 1986-10-15 Mitsubishi Electric Corp デ−タ検索装置
JPS6278684A (ja) * 1985-10-02 1987-04-10 Fujitsu Ltd 物体検索方式
JPS6423379A (en) * 1987-07-20 1989-01-26 Agency Ind Science Techn Object recognizing device
JPH11338876A (ja) * 1998-05-27 1999-12-10 Hitachi Ltd 映像検索方法及び装置ならびに記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193398A (ja) * 2008-02-15 2009-08-27 Seiko Epson Corp 画像検索装置、画像検索方法、及び画像検索プログラム

Also Published As

Publication number Publication date
CN1904892B (zh) 2010-11-10
US20100239175A1 (en) 2010-09-23
KR100931740B1 (ko) 2009-12-14
KR100957888B1 (ko) 2010-05-13
GB0016809D0 (en) 2000-08-30
US7756339B2 (en) 2010-07-13
US20080187227A1 (en) 2008-08-07
US7388986B2 (en) 2008-06-17
JP2011028757A (ja) 2011-02-10
EP2299374A1 (en) 2011-03-23
CN1790342A (zh) 2006-06-21
EP1299822A1 (en) 2003-04-09
AU2001269289A1 (en) 2002-01-21
KR20080050537A (ko) 2008-06-05
US7940987B2 (en) 2011-05-10
CN1896993A (zh) 2007-01-17
CN100555281C (zh) 2009-10-28
KR100955980B1 (ko) 2010-05-04
US7269285B2 (en) 2007-09-11
KR20060095577A (ko) 2006-08-31
US7593577B2 (en) 2009-09-22
JP4632627B2 (ja) 2011-02-16
CN1904892A (zh) 2007-01-31
US20080013834A1 (en) 2008-01-17
EP2302530A1 (en) 2011-03-30
KR20090006873A (ko) 2009-01-15
US20080187226A1 (en) 2008-08-07
EP2299373A1 (en) 2011-03-23
KR100820510B1 (ko) 2008-04-10
KR20070122585A (ko) 2007-12-31
WO2002005129A1 (en) 2002-01-17
KR100901911B1 (ko) 2009-06-10
EP2296097A1 (en) 2011-03-16
CN1790342B (zh) 2010-05-12
EP1299822B1 (en) 2019-09-04
KR20030051594A (ko) 2003-06-25
US20030147555A1 (en) 2003-08-07
GB2364590B (en) 2004-06-02
CN1242351C (zh) 2006-02-15
US20080187177A1 (en) 2008-08-07
US7689041B2 (en) 2010-03-30
GB2364590A (en) 2002-01-30
CN1451128A (zh) 2003-10-22
EP2296097B1 (en) 2019-10-02
CN1963812A (zh) 2007-05-16

Similar Documents

Publication Publication Date Title
JP4632627B2 (ja) 画像中のオブジェクトを表現および探索する方法および装置
JP5121086B2 (ja) 物体を表現する方法、物体を探索する方法
US7761438B1 (en) Method and apparatus for representing and searching for an object using shape

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080227

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100628

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101116

R150 Certificate of patent or registration of utility model

Ref document number: 4632627

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S631 Written request for registration of reclamation of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313631

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

EXPY Cancellation because of completion of term
R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350