JP2004503017A - 画像中のオブジェクトを表現および探索する方法および装置 - Google Patents
画像中のオブジェクトを表現および探索する方法および装置 Download PDFInfo
- Publication number
- JP2004503017A JP2004503017A JP2002508670A JP2002508670A JP2004503017A JP 2004503017 A JP2004503017 A JP 2004503017A JP 2002508670 A JP2002508670 A JP 2002508670A JP 2002508670 A JP2002508670 A JP 2002508670A JP 2004503017 A JP2004503017 A JP 2004503017A
- Authority
- JP
- Japan
- Prior art keywords
- view
- image
- images
- descriptor
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000004590 computer program Methods 0.000 claims 1
- 230000000007 visual effect Effects 0.000 claims 1
- 238000011524 similarity measure Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 239000003086 colorant Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/752—Contour matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
本発明は、例えばマルチメディア・データベースにおいて、特に探索に使用するための、画像中のオブジェクトを表現する方法および装置に関する。また、本発明は、画像中のオブジェクトを探索する方法および装置に関する。
【0002】
画像に出現するオブジェクトの表現を使用して、静止画像またはビデオ画像を、例えば画像ライブラリに記憶することが知られている。表現は、注目のオブジェクトを含んでいる画像を取り出すことを可能にするために、探索方法において使用される。表現は、色、テクスチャ、および形状を含む、オブジェクトの様々な特徴に基づく可能性がある。
【0003】
画像中のオブジェクトの形状を表現する様々な方法が、知られている。既知の方法には、チェーン符号化、四分木法、および曲率スケール空間表現方法が含まれる。
【0004】
画像探索システムにおいて探索を実施するために、ユーザは、求めるオブジェクトのスケッチまたは画像をシステムに提示することによって、または、システム上に記憶されたオブジェクトのビューを選択することによって、クエリを入力する。次いで、システムは、クエリオブジェクトの表現を導出または獲得し、適切な整合方法を使用して、クエリ表現をデータベースに記憶された画像の表現と比較する。最も近い整合が、表示ユニット上に表示される。
【0005】
ほとんどの場合、ビデオ画像に出現するオブジェクトは、3次元の実際のオブジェクトを2次元の像平面上に投影したものである。したがって、画像に出現する、オブジェクトの2次元の形状または輪郭と、可視であるオブジェクト表面の色およびテクスチャとは、視点位置、視角、カメラおよび光学システムのパラメータなどの要因に依存する。したがって、オブジェクトは、輪郭、形状、色、テクスチャなど、異なるビューに関連する異なる特徴を有することになる。
【0006】
本出願人の同時係属中の特許出願であるPCT/GB00/01662は、その内容を参照により本明細書に組み込んでおり、複数の異なる2次元ビューのオブジェクトの表現を導出し、関連付けて、オブジェクト表現を形成する、画像に出現するオブジェクトを表現する方法および装置について開示している。表現は、オブジェクトの形状に関することが好ましいが、例えば、異なるビューの色またはテクスチャに関する可能性もある。
【0007】
上述した方法を、静止画像または映画などの内部のオブジェクトに適用するとき、異なるビューに関連するオブジェクトの特徴を表現するため、画像に関連付けられたいくつかの形状または他の記述子が存在する。しかし、通常、これらのビューのいずれも、元の画像内で可視である。特徴のいくつかは、オブジェクトの可視でない部分に関連し、オブジェクトの3D特性を記述するためのみのものである可能性がある。
【0008】
オブジェクトの複数のビューのどれが可視で、どれが可視でないかを決定することができない場合、探索方法は、指定のビューを正確に見つけることができない。例えば、側面ビューを使用して、自動車を描写している画像を探索すると、自動車の上面および前面のビューも見つけることになる。
【0009】
本発明の概念は、どの記述子が、その記述子が連結される画像または映画の内部の可視特徴に実際に関係するかを示す可視フラグを使用することである。
【0010】
したがって、本発明は、画像に出現するオブジェクトを表現する方法を提供する。本方法は、オブジェクトの複数のビュー記述子を導出することを含み、各ビュー記述子は、オブジェクトの異なるビューに対応し、さらに、ビューが、画像に出現するオブジェクトのビューに対応するときに示すことを備える。
【0011】
PCT/GB00/01662に開示された発明では、形状記述子は、1つのマルチメディアコンテントの内部に存在するオブジェクトに関連付けられる。そのような記述子は、異なるビューからオブジェクトの形状を記述した。これらのビューは、マルチメディア素材内で、可視または可視でないことがあり得る。可視フラグは、この可視情報を記憶する。
【0012】
各ビューの可視データが、使用可能であるとき、探索方法は、必要なときに、可視でないビューを有するオブジェクトをフィルタリングすることができる。
【0013】
本発明の一実施の形態について、添付の図面を参照して説明する。
【0014】
本発明の一実施の形態によるシステムを図1に示す。システムは、システムの動作を制御するコンピュータなどの制御ユニット2と、画像およびテキストを含む出力を表示する制御ユニット2に接続されたモニタなどの表示ユニット4と、制御ユニット2に命令を入力するマウスなどのポインティングデバイス6とを含む。また、システムは、複数の静止画像およびビデオ・シーケンスの形態の画像のグループのデジタル・バージョンを記憶する画像データベース8と、画像データベース8に記憶された静止画像およびビデオ・シーケンスのそれぞれに出現するオブジェクトに対し、以下でより詳細に説明する記述子の情報を記憶する記述子データベース10とを含む。画像データベース8と記述子データベース10のそれぞれは、制御ユニット2に接続される。
【0015】
この実施の形態では、システムの要素は、画像ライブラリなど、システムの構成要素が永続的に連結される、単一のサイト上に提供される。
【0016】
本発明の一実施の形態によるオブジェクトに対する記述子を導出する方法について、以下で説明する。まず、この場合は円柱状のオブジェクトである、比較的単純な形状を有するオブジェクトについて、方法を説明する。
【0017】
この例では、画像データベース8に記憶されたビデオ・シーケンスに、円柱状のオブジェクトは、2度出現する。図2を参照すると、第1の出現では、オブジェクトの輪郭は、側方からのビューであるビュー1に対応し、第2の出現では、オブジェクトの輪郭は、側方かつ上方からの斜視ビューであるビュー3に対応する。
【0018】
データベース・インデクサは、2つの輪郭が同じオブジェクトのものであり、かつ、それらの輪郭に対応する3次元のオブジェクトが円柱であることを認識する。ビュー1およびビュー3のそれぞれに対して、曲率スケール空間(CSS)表現を使用する形状記述子が導出される。また、データベース・インデクサは、オブジェクトを表現していると見なされる追加のビューを、それらが考慮中のビデオ・シーケンスに出現しない場合でも、選択する。この例では、上方からの円柱のビューであるビュー2が、表現しているとして選択される。そのビューのCSS表現も、獲得される。
【0019】
Farzin Mokhtarian、Sadegh AbbassiおよびJosef Kittlerによる論文「Robust and Efficient Shape Indexing through Curvature Scale Space」(Proc. British Machine Vision Conference, pp.53−62, Edinburgh, UK 1996)は、曲率スケール空間表現の方法について記載しており、これは、参照により、本明細書に組み込まれている。簡潔には、形状の輪郭を表現する曲線は、曲線を平滑化することによって展開される。曲線は、展開の多数の異なる段階において考察される。より具体的には、曲率ゼロの交差は、展開段階のそれぞれにおける曲率関数において識別される。曲率ゼロの交差のグラフが、展開の全段階からゼロの交差を組み合わせることによって獲得される。グラフの一方の軸は、曲線の展開パラメータを表すσに対応し、他方の軸は、曲線の弧の長さのパラメータuに対応する。次いで、形状が、グラフの輪郭の極大点(maxima)の位置によって表現される。
【0020】
各ビューに対し、適切なCSS表現を含むビュー記述子が形成される。ビュー記述子は、PCT/GB00/01662に記載されたグローバルパラメータ、または、対応する可視表面の色/テクスチャの特性など、他の情報を含む可能性がある。
【0021】
ビュー形状記述子は、3Dオブジェクト形状記述子を形成するように、組み合わされる。さらに、所与のビューが、ビデオ・シーケンスの少なくとも1つのフレームにおいて、可視であるか否かを示す可視フラグが、オブジェクト記述子に関連付けられる。この例では、可視フラグは、各ビュー記述子の一部を形成する。したがって、ここでは、ビュー1とビュー3のそれぞれのビュー記述子は、そのビューがビデオのフレームにおいて可視であることを示す可視フラグ「1」を含み、ビュー2のビュー記述子は、そのビューがいずれのフレームにおいても可視でないことを示す可視フラグ「0」を有する。
【0022】
3Dオブジェクト形状記述子が、画像データベース8の画像または画像のグループに出現する注目のすべてのオブジェクトに対して、上記の方式で獲得される。
【0023】
他の例として、図3を参照すると、3つのビューが、写真に出現する自動車に対して導出される。CSS表現を含んでいる対応するビュー記述子が、各ビューの自動車の輪郭に対して、上述したように獲得される。第1のビューは、写真のビューに対応し、したがって、関連するビュー記述子は、可視ビューを示す可視フラグ「1」を有する。他の2つのビューに対するビュー記述子は、それらが写真には示されていないビューに対応することを示す可視フラグ「0」を有する。この例では、可視フラグは、写真から輪郭を抽出するときに決定される。すなわち、形状が写真から直接抽出される場合、それには「1」の可視フラグが与えられるが、形状がインデクサによって選択される場合、それは「0」の可視フラグを有する。代替として、可視フラグは、検査によって、後に手作業で追加することができる。
【0024】
また、各ビュー記述子は、どの画像、またはどのビデオ・シーケンスのどのフレームにそれが出現するかを示し、また、画像またはフレームのどのオブジェクトがそれであるかをも示す、参照ポインタを有する。例えば、オブジェクトのビューは、それが、ビデオ181のフレーム1000に出現し、かつ、オブジェクト番号3であることを示すポインタを有する可能性がある。
【0025】
記述子データベース10は、画像データベース8に記憶された画像およびビデオ・シーケンスのオブジェクトに対する3Dオブジェクト形状記述子を記憶する。
【0026】
上述した実施の形態では、ビデオ・シーケンスに出現するオブジェクトに対し、1組のビュー記述子が、シーケンス全体に対して導出され、このビュー記述子は、関連するビューが、シーケンスの少なくとも1つのフレームに出現するか否かを示すために使用される。代替実施の形態では、各フレームは、別々に処理される。より詳細には、1組のビュー記述子が、フレームに出現するオブジェクトに対して導出され、可視フラグは、関連するビューが、シーケンスの別のフレームに出現するか否かに関係なく、そのフレームに出現するか否かを示す。別の代替実施の形態では、1組のビュー記述子が、ビデオ・シーケンスに出現するオブジェクトに対して導出され、1組の対応する可視フラグが、各フレームに対して、導出され、記憶される。
【0027】
可視フラグは、以下で説明するように、画像のオブジェクトを探索する方法において使用される。
【0028】
ユーザは、クエリを入力することによって、探索を開始する。クエリは、ポインティングデバイス6を使用して、表示ユニット4上に1つまたは複数の形状の輪郭を描くことによって入力される。次いで、制御ユニット2は、そのクエリビューに対するCSSビュー記述子を導出する。代替として、ユーザは、制御ユニット2によって表示ユニット4上に表示された形状のメニューから、1つまたは複数のクエリ形状を選択することによって、クエリを入力することが可能である。そのような場合、ビュー記述子は、記述子データベース10において、すでに使用可能である可能性がある。また、ユーザは、ボックスをチェックすることによって、探索が、クエリビューと同じビューに限定されるべきであるか否かを示す。探索が、そのように限定されない場合、探索と整合の手続きが、クエリオブジェクト記述子と、これ以降モデルオブジェクト記述子と呼ぶ、記述子データベース10に記憶されたオブジェクト記述子との類似性を判定することによって、本質的にPCT/GB00/01662に記述されているように実施される。
【0029】
簡潔には、ビュー類似性測度を導出すべく、整合関数を使用したコンパレータにおいて、各クエリビュー記述子は考慮中のモデルオブジェクト記述子に対する各モデル・ビュー記述子と比較される。i番目のクエリビュー記述子とj番目のモデル・ビュー記述子の比較により、ビュー類似性測度si 、 jが得られる。2つ以上のクエリビューが存在する場合は、ビュー類似性測度の中央値を、オブジェクト類似性測度Sとして取る。
【0030】
整合手続きにより、nの類似性測度Sが得られる。nは、記述子データベースの3Dオブジェクト記述子の数である。次いで、nの類似性測度は、最も近い整合を示す最低値から開始して順序付けられる。次いで、mの最低値(ここで、mはユーザよって選択された値、または制御ユニットの設定によって決定された値である)が選択され、オブジェクトを含んでいる対応するmの画像(そのいくつかは、ビデオ・シーケンスからの画像である可能性がある)が、表示ユニット4上に表示される。
【0031】
探索が、クエリビューと同じであるビューに限定される場合、可視でないモデル・ビューは、探索プロセス中にフィルタリングにより除去される。これは、整合関数を使用して、クエリビュー記述子を、対応するビューが画像において可視であることを示すモデル・ビュー記述子とのみ整合することによって、行うことができる。すなわち、整合関数を使用して類似性測度を計算するとき、可視フラグ「0」を有するモデル・ビュー記述子は、省かれる。代替として、ビュー類似性測度は、すべてのモデル・ビュー記述子に対して計算することが可能であるが、可視フラグがゼロであるモデル・ビュー記述子に対する結果は、さらなる処理から省かれる。代替として、可視フラグは、表示する探索結果を選択するときに考慮することができる。整合手続きの結果を表示するとき、ビデオ・シーケンスの場合、整合されたビューを含んでいるフレームが表示される。
【0032】
図4は、PCT/GB00/01662に開示された複数のビューを探索する方法が、クエリ項目と同じ形状であるが、同じビューではない結果を見つけ、それを返す方法の一例を示す。一方、図5は、ビュー記述子のそれぞれの内部にある可視フラグが、クエリ項目と同じ形状であり、かつ同じビューである結果を返す助けとなることができる方法を示す。
【0033】
本発明によるシステムは、例えば、画像ライブラリにおいて提供することが可能である。代替として、データベースは、システムの制御ユニットから遠隔して配置し、電話線など一時的な連結によって、またはインターネットなどのネットワークによって、制御ユニットに接続することが可能である。画像および記述子データベースは、例えば、永続的な記憶装置において、または、CD−ROMあるいはDVDなどの携帯型データ記憶媒体上に提供することが可能である。
【0034】
セレクタおよびコンパレータなど、記述したシステムの構成要素は、ソフトウエアまたはハードウエアの形態で提供することが可能である。本発明をコンピュータ・システムの形態において説明してきたが、例えば専用チップを使用して、他の形態で実施することができる。
【0035】
特定の例を、オブジェクトの2D形状を表現する方法と、2つの形状の類似性を表現する値を計算する方法とについて与えたが、任意の適切なそのような方法を使用することができる。
【0036】
完全または準完全な形状記述を作成するオブジェクトの様々なビューは、例えば、フィルム・プロデューサによって提供することが可能である。例えば、自動車を含んでいるフィルムでは、プロデューサは、自動車の20の異なるビューを撮影して、データベースのフィルムを指標付けすることに使用するように構成することが可能である。代替として、ビューを見つけることを可能にするように、シーケンスにおけるオブジェクトのすべての異なるビュー間を連結することが可能であり、また、シーケンスに出現していないあらゆる有用なビューに対する形状を、例えば、オブジェクトの第1のビューのデータが含まれているとき、提供することが可能である。
【0037】
また、本発明は、例えば、確認の目的で、またはフィルタリングするために、オブジェクトの画像を整合することに使用することができる。
【0038】
本発明は、単一の画像、および、フィルムまたはビデオからの画像など、画像シーケンスの画像、または、同じウエッブ・ページ上にあるような、何らかの方法で関連付けられる画像の集合に適用可能である。
【0039】
上述した実施の形態では、ビュー記述子は、異なるビューのオブジェクトの形状から導出される。ビュー記述子は、形状からの代わりに、または形状からの他に、色またはテクスチャなど、オブジェクトの他の特徴から導出することができる。形状、色、テクスチャなど、オブジェクトの様々な特徴は、単独でまたは組み合わされて、ビュー記述子の基盤を形成することができ、ビュー記述子は、異なるビューの異なる特徴に基づくことができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態によるシステムのブロック図である。
【図2】ビデオ・シーケンス中のオブジェクトの表現を示す図である。
【図3】静止画像中のオブジェクトの表現を示す図である。
【図4】第1の探索方法の結果を示す図である。
【図5】第2の探索方法の結果を示す図である。
Claims (19)
- 画像に出現するオブジェクトを表現する方法であって、前記オブジェクトの複数のビュー記述子を導出することを含み、各ビュー記述子は前記オブジェクトの異なるビューに対応し、それぞれのビューが前記画像に出現する前記オブジェクトのビューに対応するときに各ビュー記述子に対して示すことを含む方法。
- 前記それぞれのビューが前記画像に出現する前記オブジェクトのビューに対応するか否かを示すためにフラグを前記各ビュー記述子に関連付けることを含む、請求項1に記載の方法。
- 画像のグループに出現するオブジェクトを表現する方法であって、前記オブジェクトの複数のビュー記述子を導出することを含み、各ビュー記述子は前記オブジェクトの異なるビューに対応し、それぞれのビューが前記画像のグループに出現する前記オブジェクトのビューに対応するときに各ビュー記述子に対して示すことを含む方法。
- 前記それぞれのビューが前記画像のグループの少なくとも1つの画像に出現するか否かを示すためにフラグを前記各ビュー記述子に関連付けることを含む、請求項3に記載の方法。
- 画像のグループの各画像について、前記それぞれのビューが前記画像に出現する前記オブジェクトのビューに対応するか否かを前記各ビュー記述子に対して示すことを含む、請求項3に記載の方法。
- 前記画像のグループは、画像のシーケンスである、請求項3ないし5のいずれか一項に記載の方法。
- 前記画像のシーケンスは、ビデオまたはフィルムからのものである、請求項6に記載の方法。
- 少なくとも1つのビュー記述子が、前記それぞれのビューにおける前記オブジェクトの可視特徴の表現を備える、請求項1ないし7のいずれか一項に記載の方法。
- 少なくとも1つのビュー記述子が、前記それぞれのビューにおける前記オブジェクトの形状の表現を備える、請求項8に記載の方法。
- 形状ビュー記述子は、曲率スケール空間表現を使用して導出される、請求項9に記載の方法。
- 少なくとも1つのビュー記述子が、前記それぞれのビューにおける前記オブジェクトの色の表現を備える、請求項8に記載の方法。
- 少なくとも1つのビュー記述子が、前記それぞれのビューにおける前記オブジェクトのテクスチャの表現を備える、請求項8に記載の方法。
- 探索の目的で、画像または画像の集合に指標付けするためのものである、請求項1ないし12のいずれか一項に記載の方法。
- 探索の目的で、データベースに記憶された画像または画像のグループに指標付けする方法であって、画像または画像のグループに出現するオブジェクトを識別すること、前記オブジェクトの複数の異なるビューの表現を導出すること、および、表現されたビューが前記オブジェクトの前記ビューに対応するときにそれが画像に出現するように示すことを含む方法。
- 画像または画像のグループに記憶されたクエリオブジェクトを探索する方法であって、クエリを入力すること、前記クエリを、請求項1ないし14のいずれか一項に記載された方法を使用して導出された記憶画像の表現と整合すること、および、最も近い整合を取り出すことを備え、クエリ入力は、クエリビューと同じビューに前記クエリオブジェクトを示す画像または画像のグループに前記探索が限定されるべきであるか否かを示すことを含む方法。
- 請求項1ないし15のいずれか一項に記載された方法を実施するように適合された画像探索および取出しシステム。
- 請求項1ないし15のいずれか一項に記載された方法を実施するためのコンピュータ・プログラム。
- 請求項1ないし15のいずれか一項に記載された方法により動作するようにプログラミングされたコンピュータ・システム。
- 請求項1ないし15のいずれか一項に記載された方法を実施するためのコンピュータ実行可能プロセス・ステップを記憶するコンピュータ読取り可能記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0016809A GB2364590B (en) | 2000-07-07 | 2000-07-07 | Method and apparatus for representing and searching for an object in an image |
PCT/GB2001/003044 WO2002005129A1 (en) | 2000-07-07 | 2001-07-06 | Method and apparatus for representing and searching for an object in an image |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010169455A Division JP2011028757A (ja) | 2000-07-07 | 2010-07-28 | 画像に出現するオブジェクトを表現する方法、前記方法を実施するように適合された装置、及び前記方法を実施するためのコンピュータ実行可能プロセス・ステップを記憶するコンピュータで読み取り可能な記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004503017A true JP2004503017A (ja) | 2004-01-29 |
JP2004503017A5 JP2004503017A5 (ja) | 2008-04-17 |
JP4632627B2 JP4632627B2 (ja) | 2011-02-16 |
Family
ID=9895287
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002508670A Expired - Lifetime JP4632627B2 (ja) | 2000-07-07 | 2001-07-06 | 画像中のオブジェクトを表現および探索する方法および装置 |
JP2010169455A Pending JP2011028757A (ja) | 2000-07-07 | 2010-07-28 | 画像に出現するオブジェクトを表現する方法、前記方法を実施するように適合された装置、及び前記方法を実施するためのコンピュータ実行可能プロセス・ステップを記憶するコンピュータで読み取り可能な記憶媒体 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010169455A Pending JP2011028757A (ja) | 2000-07-07 | 2010-07-28 | 画像に出現するオブジェクトを表現する方法、前記方法を実施するように適合された装置、及び前記方法を実施するためのコンピュータ実行可能プロセス・ステップを記憶するコンピュータで読み取り可能な記憶媒体 |
Country Status (8)
Country | Link |
---|---|
US (6) | US7269285B2 (ja) |
EP (5) | EP1299822B1 (ja) |
JP (2) | JP4632627B2 (ja) |
KR (5) | KR100957888B1 (ja) |
CN (5) | CN1242351C (ja) |
AU (1) | AU2001269289A1 (ja) |
GB (1) | GB2364590B (ja) |
WO (1) | WO2002005129A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009193398A (ja) * | 2008-02-15 | 2009-08-27 | Seiko Epson Corp | 画像検索装置、画像検索方法、及び画像検索プログラム |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2364590B (en) * | 2000-07-07 | 2004-06-02 | Mitsubishi Electric Inf Tech | Method and apparatus for representing and searching for an object in an image |
AR031202A1 (es) | 2000-11-03 | 2003-09-10 | Wyeth Corp | Ciclopenta(b) (1,4)diazepino(6,7,1-hi) indoles y derivados |
US7624123B2 (en) * | 2004-02-26 | 2009-11-24 | Ati Technologies, Inc. | Image processing system and method |
US7812986B2 (en) | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US7702673B2 (en) * | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US10192279B1 (en) | 2007-07-11 | 2019-01-29 | Ricoh Co., Ltd. | Indexed document modification sharing with mixed media reality |
US9495385B2 (en) | 2004-10-01 | 2016-11-15 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US7430322B1 (en) * | 2005-05-02 | 2008-09-30 | Nanostellar, Inc. | Particle shape characterization from 2D images |
US7561756B1 (en) | 2005-05-02 | 2009-07-14 | Nanostellar, Inc. | Particle shape characterization from 2D images |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US9063952B2 (en) * | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US7856380B1 (en) * | 2006-12-29 | 2010-12-21 | Amazon Technologies, Inc. | Method, medium, and system for creating a filtered image set of a product |
SE533185C2 (sv) * | 2007-02-16 | 2010-07-13 | Scalado Ab | Metod för behandling av en digital bild samt bildrepresentationsformat |
US8125481B2 (en) | 2008-03-21 | 2012-02-28 | Google Inc. | Lightweight three-dimensional display |
US8886669B2 (en) * | 2008-03-21 | 2014-11-11 | Trimble Navigation Limited | File access via conduit application |
JP4770960B2 (ja) * | 2009-03-30 | 2011-09-14 | カシオ計算機株式会社 | 画像検索システム及び画像検索方法 |
US7953245B2 (en) * | 2009-08-18 | 2011-05-31 | General Electric Company | System, method and program product for camera-based object analysis |
JP4850278B2 (ja) * | 2009-11-20 | 2012-01-11 | 株式会社ソニー・コンピュータエンタテインメント | コンテンツ作成支援装置、コンテンツ作成支援方法、およびシナリオファイル生成方法 |
US8687898B2 (en) * | 2010-02-01 | 2014-04-01 | Toyota Motor Engineering & Manufacturing North America | System and method for object recognition based on three-dimensional adaptive feature detectors |
US9652462B2 (en) * | 2010-04-29 | 2017-05-16 | Google Inc. | Identifying responsive resources across still images and videos |
US8555192B2 (en) * | 2010-06-03 | 2013-10-08 | Microsoft Corporation | Sketching and searching application for idea generation |
US9449026B2 (en) | 2010-08-31 | 2016-09-20 | Microsoft Technology Licensing, Llc | Sketch-based image search |
US8619124B2 (en) * | 2010-10-14 | 2013-12-31 | Industrial Technology Research Institute | Video data processing systems and methods |
WO2012079617A1 (de) * | 2010-12-13 | 2012-06-21 | Incca Gmbh | Vorrichtung und verfahren zur unterstuetzung der durchfuehrung eines wartungs- und/oder bedienvorgangs |
US8799201B2 (en) | 2011-07-25 | 2014-08-05 | Toyota Motor Engineering & Manufacturing North America, Inc. | Method and system for tracking objects |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
US8655016B2 (en) * | 2011-07-29 | 2014-02-18 | International Business Machines Corporation | Example-based object retrieval for video surveillance |
CN108197631B (zh) * | 2012-07-23 | 2022-06-28 | 苹果公司 | 提供图像特征描述符的方法 |
CN103870485B (zh) * | 2012-12-13 | 2017-04-26 | 华为终端有限公司 | 实现增强现实应用的方法及设备 |
US9147125B2 (en) | 2013-05-03 | 2015-09-29 | Microsoft Technology Licensing, Llc | Hand-drawn sketch recognition |
US9355123B2 (en) | 2013-07-19 | 2016-05-31 | Nant Holdings Ip, Llc | Fast recognition algorithm processing, systems and methods |
CN106462774B (zh) * | 2014-02-14 | 2020-01-24 | 河谷控股Ip有限责任公司 | 通过规范形状的对象摄取、系统和方法 |
WO2015123647A1 (en) | 2014-02-14 | 2015-08-20 | Nant Holdings Ip, Llc | Object ingestion through canonical shapes, systems and methods |
WO2015127117A1 (en) * | 2014-02-19 | 2015-08-27 | Nant Holdings Ip, Llc | Invariant-based dimensional reduction of object recognition features, systems and methods |
US9827714B1 (en) | 2014-05-16 | 2017-11-28 | Google Llc | Method and system for 3-D printing of 3-D object models in interactive content items |
CN107077590B (zh) * | 2014-10-13 | 2021-03-30 | 意大利电信股份公司 | 用于比较视频镜头的方法和系统 |
WO2016183020A1 (en) | 2015-05-11 | 2016-11-17 | Magic Leap, Inc. | Devices, methods and systems for biometric user recognition utilizing neural networks |
CA3015658A1 (en) | 2016-03-11 | 2017-09-14 | Magic Leap, Inc. | Structure learning in convolutional neural networks |
CN113874883A (zh) | 2019-05-21 | 2021-12-31 | 奇跃公司 | 手部姿势估计 |
US11775617B1 (en) * | 2021-03-15 | 2023-10-03 | Amazon Technologies, Inc. | Class-agnostic object detection |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61231630A (ja) * | 1985-04-05 | 1986-10-15 | Mitsubishi Electric Corp | デ−タ検索装置 |
JPS6278684A (ja) * | 1985-10-02 | 1987-04-10 | Fujitsu Ltd | 物体検索方式 |
JPS6423379A (en) * | 1987-07-20 | 1989-01-26 | Agency Ind Science Techn | Object recognizing device |
JPH11338876A (ja) * | 1998-05-27 | 1999-12-10 | Hitachi Ltd | 映像検索方法及び装置ならびに記録媒体 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4270229A (en) * | 1980-01-17 | 1981-06-02 | Louisville Manufacturing Co., Inc. | Method of surface ornamented cap |
US4548704A (en) * | 1982-07-19 | 1985-10-22 | E. I. Du Pont De Nemours And Company | Pitch for direct spinning into carbon fibers derived from a steam cracker tar feedstock |
US4584704A (en) | 1984-03-01 | 1986-04-22 | Bran Ferren | Spatial imaging system |
JPS6423379U (ja) | 1987-07-31 | 1989-02-07 | ||
GB9322260D0 (en) * | 1993-10-28 | 1993-12-15 | Pandora Int Ltd | Digital video processor |
US5465353A (en) * | 1994-04-01 | 1995-11-07 | Ricoh Company, Ltd. | Image matching and retrieval by multi-access redundant hashing |
US6205231B1 (en) * | 1995-05-10 | 2001-03-20 | Identive Corporation | Object identification in a moving video image |
US5710877A (en) * | 1995-12-29 | 1998-01-20 | Xerox Corporation | User-directed interaction with an image structure map representation of an image |
US5907846A (en) * | 1996-06-07 | 1999-05-25 | Electronic Data Systems Corporation | Method and system for accessing relational databases using objects |
US5809505A (en) * | 1996-06-14 | 1998-09-15 | Lo; Thomas | System and method for relational to object mapping |
US6006214A (en) * | 1996-12-04 | 1999-12-21 | International Business Machines Corporation | Database management system, method, and program for providing query rewrite transformations for nested set elimination in database views |
US6122627A (en) * | 1997-05-09 | 2000-09-19 | International Business Machines Corporation | System, method, and program for object building in queries over object views |
US6038074A (en) * | 1997-05-20 | 2000-03-14 | Ricoh Company, Ltd. | Three-dimensional measuring apparatus and method, image pickup apparatus, and apparatus and method for inputting image |
AUPO894497A0 (en) * | 1997-09-02 | 1997-09-25 | Xenotech Research Pty Ltd | Image processing method and apparatus |
KR19990025292A (ko) * | 1997-09-11 | 1999-04-06 | 정선종 | 필터링 과정에 의한 이미지 데이터 베이스의 효과적 검색 방법 |
FI103417B1 (fi) * | 1997-09-16 | 1999-06-30 | Metsae Serla Oyj | Paperiraina ja menetelmä sen valmistamiseksi |
US6249600B1 (en) * | 1997-11-07 | 2001-06-19 | The Trustees Of Columbia University In The City Of New York | System and method for generation of a three-dimensional solid model |
JP3383563B2 (ja) * | 1997-12-18 | 2003-03-04 | 富士通株式会社 | 物体移動シミュレーション装置 |
US6301370B1 (en) * | 1998-04-13 | 2001-10-09 | Eyematic Interfaces, Inc. | Face recognition from video images |
KR20000016778A (ko) * | 1998-12-18 | 2000-03-25 | 윌리암 아메스 커트라이트 | 균일 포맷의 디지탈 맵 이미지를 생성시키는 방법 및 장치 |
US6819797B1 (en) * | 1999-01-29 | 2004-11-16 | International Business Machines Corporation | Method and apparatus for classifying and querying temporal and spatial information in video |
KR100390866B1 (ko) * | 1999-02-05 | 2003-07-12 | 삼성전자주식회사 | 컬러 영상 처리 방법 및 그 장치 |
GB2375212B (en) * | 1999-04-29 | 2003-06-11 | Mitsubishi Electric Inf Tech | Method and apparatus for searching for an object using shape |
GB2394350B (en) * | 1999-07-05 | 2004-06-16 | Mitsubishi Electric Inf Tech | Method and apparatus for representing and searching for an object in an image |
KR100422697B1 (ko) * | 1999-12-27 | 2004-03-12 | 엘지전자 주식회사 | 색공간 양자화 묘사자 |
GB2364590B (en) * | 2000-07-07 | 2004-06-02 | Mitsubishi Electric Inf Tech | Method and apparatus for representing and searching for an object in an image |
-
2000
- 2000-07-07 GB GB0016809A patent/GB2364590B/en not_active Expired - Lifetime
-
2001
- 2001-07-06 AU AU2001269289A patent/AU2001269289A1/en not_active Abandoned
- 2001-07-06 EP EP01947643.1A patent/EP1299822B1/en not_active Expired - Lifetime
- 2001-07-06 CN CNB018123260A patent/CN1242351C/zh not_active Expired - Lifetime
- 2001-07-06 KR KR1020087011953A patent/KR100957888B1/ko active IP Right Grant
- 2001-07-06 KR KR1020077029346A patent/KR100901911B1/ko active IP Right Grant
- 2001-07-06 CN CNA2006100944935A patent/CN1963812A/zh active Pending
- 2001-07-06 EP EP10182344A patent/EP2299373A1/en not_active Withdrawn
- 2001-07-06 KR KR1020067013655A patent/KR100931740B1/ko active IP Right Grant
- 2001-07-06 WO PCT/GB2001/003044 patent/WO2002005129A1/en active Application Filing
- 2001-07-06 EP EP10182325.0A patent/EP2296097B1/en not_active Expired - Lifetime
- 2001-07-06 JP JP2002508670A patent/JP4632627B2/ja not_active Expired - Lifetime
- 2001-07-06 CN CN2006100934596A patent/CN1904892B/zh not_active Expired - Lifetime
- 2001-07-06 CN CN2005101370223A patent/CN1790342B/zh not_active Expired - Lifetime
- 2001-07-06 EP EP10183022A patent/EP2302530A1/en not_active Withdrawn
- 2001-07-06 EP EP10182402A patent/EP2299374A1/en not_active Withdrawn
- 2001-07-06 US US10/220,636 patent/US7269285B2/en not_active Expired - Lifetime
- 2001-07-06 CN CNB2006100934581A patent/CN100555281C/zh not_active Expired - Lifetime
- 2001-07-06 KR KR1020037000150A patent/KR100820510B1/ko active IP Right Grant
- 2001-07-06 KR KR1020087029686A patent/KR100955980B1/ko active IP Right Grant
-
2007
- 2007-07-12 US US11/777,135 patent/US7388986B2/en not_active Expired - Lifetime
-
2008
- 2008-04-03 US US12/062,377 patent/US7756339B2/en not_active Expired - Fee Related
- 2008-04-03 US US12/062,382 patent/US7593577B2/en not_active Expired - Fee Related
- 2008-04-03 US US12/062,371 patent/US7689041B2/en not_active Expired - Fee Related
-
2010
- 2010-06-02 US US12/792,205 patent/US7940987B2/en not_active Expired - Fee Related
- 2010-07-28 JP JP2010169455A patent/JP2011028757A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61231630A (ja) * | 1985-04-05 | 1986-10-15 | Mitsubishi Electric Corp | デ−タ検索装置 |
JPS6278684A (ja) * | 1985-10-02 | 1987-04-10 | Fujitsu Ltd | 物体検索方式 |
JPS6423379A (en) * | 1987-07-20 | 1989-01-26 | Agency Ind Science Techn | Object recognizing device |
JPH11338876A (ja) * | 1998-05-27 | 1999-12-10 | Hitachi Ltd | 映像検索方法及び装置ならびに記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009193398A (ja) * | 2008-02-15 | 2009-08-27 | Seiko Epson Corp | 画像検索装置、画像検索方法、及び画像検索プログラム |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4632627B2 (ja) | 画像中のオブジェクトを表現および探索する方法および装置 | |
JP5121086B2 (ja) | 物体を表現する方法、物体を探索する方法 | |
US7761438B1 (en) | Method and apparatus for representing and searching for an object using shape |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080227 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100330 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100628 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101109 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4632627 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131126 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S631 | Written request for registration of reclamation of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313631 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131126 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
EXPY | Cancellation because of completion of term | ||
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |