[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5607261B2 - オブジェクト認識における特徴生成を改善するためのシステム及び方法 - Google Patents

オブジェクト認識における特徴生成を改善するためのシステム及び方法 Download PDF

Info

Publication number
JP5607261B2
JP5607261B2 JP2013536846A JP2013536846A JP5607261B2 JP 5607261 B2 JP5607261 B2 JP 5607261B2 JP 2013536846 A JP2013536846 A JP 2013536846A JP 2013536846 A JP2013536846 A JP 2013536846A JP 5607261 B2 JP5607261 B2 JP 5607261B2
Authority
JP
Japan
Prior art keywords
image
value
electronic device
variance
variation measurement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013536846A
Other languages
English (en)
Other versions
JP2013541119A (ja
Inventor
チ、インギョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2013541119A publication Critical patent/JP2013541119A/ja
Application granted granted Critical
Publication of JP5607261B2 publication Critical patent/JP5607261B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Description

本願の実施形態は、マシンビジョンに関し、より詳細には、改善された特徴生成のための方法、装置、システムに関する。
モバイル無線通信機器、携帯情報端末(PDA)、ラップトップコンピュータ、デスクトップコンピュータ、デジタルカメラ、デジタル記録機器等を含む広範囲の電子機器は、マシンビジョン技術を採用して、多用途の画像化性能を提供する。これらの性能は、被写体認識プロセス/技術を含み、それによって、これらのシステムは、ユーザが、ユーザの現在地にあるランドマークを認識すること、友達と他人を識別することを、他の様々なタスクと共に支援することができる。
これらの被写体認識プロセス/技術は、被写体の画像を重要な「特徴」の集合に制限することによって、画像内の又は1つ以上の被写体を識別しうる。原画像(raw image)の画素データから被写体の認識を試みるというよりはむしろ、これらのプロセス/技術は、代わりに、被写体を含む「トレーニング」画像のこれらの特徴を、被写体を含みうるか、あるいは、含まない可能性のある新しい画像と比較することによって被写体を認識する。新しい画像が、「トレーニング」画像の特徴に対応する特徴を有する場合、プロセスは、同じ被写体が両方の画像に存在していると決定しうる。プロセス/技術は、被写体が多種多様のオリエンテーション(方向性)下、及び、多様な照明条件下で認識されうる方法で、特徴を選択しうる。
モバイルデバイス(モバイル機器)がますます小型になるにつれ、特徴生成及び認識を実行するためのより効率的な方法が必要である。そのような改善された方法は、これらの認識プロセス/技術に依存する様々な画像化アプリケーションの機能を改善しうる。
本願の実施形態のうちの幾つかは、特徴を生成するための方法を備え、それは、少なくとも1つのプロセッサ上で実行されうる。方法は、分散値(dispersion value)を画像の少なくとも一部に関連付けることと、画像の少なくとも一部における分散が閾値を上回ることを分散値が示す場合に、画像の少なくとも一部の少なくとも一部分を特徴生成プロセスの少なくとも一部から除外することとを備えうる。幾つかの実施形態において、一部を除外することは、異なる値を有する画像の少なくとも一部を、この画像の少なくとも一部が特徴生成プロセスの少なくとも一部によって処理される前に、差し引くことを備えうる。幾つかの実施形態において、分散値は、画像の一部内の画素値のエントロピの測定を備えうる。特定の実施形態において、分散値は、画像の一部の周波数特性を備えうる。特定の実施形態において、分散値は、画像の少なくとも一部における画素値の級間変動(between class variation)及び級内変動(within class variation)に基づきうる。特定の実施形態において、分散値を関連付けることは、画像の少なくとも一部内の画素を、量子化値と関連付けることと、同一の量子化値を有する画素の集合についての1次モーメントを決定することと、少なくとも2つの集合の1次モーメントの間の距離を測定することとを備えうる。特定の実施形態において、少なくとも2つの集合の1次モーメントの間の距離は、分散値の値に反比例しうる。幾つかの実施形態において、特徴生成プロセスは、少なくとも、SIFT(scale-invariant feature transform)の一部を備えうる。幾つかの実施形態において、特徴生成プロセスは、画像の尺度空間(scale-space)差分を計算するように構成されたモジュールを備えうる。
幾つかの実施形態は、非一時的なコンピュータ読取可能な媒体を備え、非一時的なコンピュータ読取可能な媒体は、分散値を画像の少なくとも一部に関連付けることと、画像の少なくとも一部における分散が閾値を上回ることを分散値が示す場合に、画像の少なくとも一部の少なくとも一部分を特徴生成プロセスの少なくとも一部から除外することとからなるステップを電子機器に実行させるように構成された命令を備えうる。幾つかの実施形態において、一部を除外することは、異なる値を有する画像の少なくとも一部を、この画像の少なくとも一部が特徴生成プロセスの少なくとも一部によって処理される前に、差し引くことを備えうる。幾つかの実施形態において、分散値は、画像の一部内の画素値のエントロピの測定を備えうる。特定の実施形態において、分散値は、画像の一部の周波数特性を備えうる。特定の実施形態において、分散値は、画像の少なくとも、一部における画素値の級間変動及び級内変動に基づきうる。幾つかの実施形態において、分散値を関連付けることは、画像の少なくとも一部内の画素を、量子化値と関連付けることと、同一の量子化値を有する画素の集合についての1次モーメントを決定することと、少なくとも2つの集合の1次モーメントの間の距離を測定することとを備えうる。幾つかの実施形態において、少なくとも2つの集合の1次モーメントの間の距離は、分散値の値に反比例しうる。特定の実施形態において、特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備えうる。幾つかの実施形態において、特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備えうる。幾つかの実施形態において、電子機器は、無線電話を備えうる。
幾つかの実施形態は、電子機器を備え、電子機器は、分散値を画像の少なくとも一部と関連付けることと、画像の少なくとも一部における分散が閾値を上回ることを分散値が示す場合に、画像の少なくとも一部の少なくとも一部分を特徴生成プロセスの少なくとも一部から除外することとからなるステップを実行するように構成された命令を備えうる。特定の実施形態において、一部を除外することは、異なる値を有する画像の少なくとも一部を、この画像の少なくとも一部が特徴生成プロセスの少なくとも一部によって処理される前に差し引くことを備えうる。幾つかの実施形態において、分散値は、画像の一部内の画素値のエントロピの測定を備えうる。幾つかの実施形態において、分散値は、画像の一部の周波数特性を備えうる。幾つかの実施形態において、分散値は、少なくとも、画像の一部における画素値の級間変動及び級内変動に基づきうる。特定の実施形態において、分散値を関連付けることは、画像の少なくとも一部内の画素を、量子化値と関連付けることと、同一の量子化値を有する画素の集合についての1次モーメントを決定することと、少なくとも2つの集合の1次モーメントの間の距離を測定することとを備えうる。幾つかの実施形態において、少なくとも2つの集合の1次モーメントの間の距離は、分散値の値に反比例しうる。幾つかの実施形態において、特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備えうる。幾つかの実施形態において、特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備えうる。特定の実施形態において、電子機器は、無線電話を備えうる。
幾つかの実施形態は、電子機器を備え、電子機器は、分散値を画像の少なくとも一部と関連付ける手段と、画像の少なくとも一部における分散が閾値を上回ることを分散値が示す場合に、画像の少なくとも一部の少なくとも一部分を、特徴生成プロセスの少なくとも一部から除外する手段とを備えうる。特定の実施形態において、関連付ける手段は、級間分散(between class variance)と級内分散(within class variance)とを決定するように構成された分散判別器(dispersion discriminator)ソフトウェアモジュールを備え、除外する手段はスイッチを備えうる。特定の実施形態において、一部を除外することは、異なる値を有する画像の少なくとも一部を、この画像の少なくとも一部が特徴生成プロセスの少なくとも一部によって処理される前に、差し引くことを備えうる。幾つかの実施形態において、分散値は、画像の一部内の画素値のエントロピの測定を備えうる。幾つかの実施形態において、分散値は、画像の一部の周波数特性を備えうる。幾つかの実施形態において、分散値は、少なくとも、画像の一部における画素値の級間変動及び級内変動に基づきうる。幾つかの実施形態において、分散値を関連付ける手段は、画像の少なくとも一部内の画素を、量子化値と関連付ける手段と、同一の量子化値を有する画素の集合についての1次モーメントを決定する手段と、少なくとも2つの集合の1次モーメントの間の距離を測定する手段とを備えうる。幾つかの実施形態において、少なくとも2つの集合の1次モーメントの間の距離は、分散値の値に反比例しうる。幾つかの実施形態において、特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備えうる。幾つかの実施形態において、特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備えうる。幾つかの実施形態において、電子機器は、無線電話を備えうる。
開示された態様は、以下、添付された図面に関連して説明され、開示される態様を限定するためではなく例示するために提供される。ここにおいて、同様の表記は同様のエレメントを表す。
図1は、サーバ、データベース、及びネットワーク送信システムに関して、モバイル機器を示している一般ブロック図であり、機器のうちの又は1つ以上は、本願の実施形態のうちの幾つかを実現する。 図2は、本願の実施形態のうちの幾つかに関連付けられた特定の画像化アプリケーションが採用しうるモバイル機器の様々なコンポーネントのブロック図である。 図3は、特定の実施形態の特徴生成モジュールで実現されうるような、様々なSIFTファミリ特徴生成にみられる幾つかのステップを示しているフロー図である。 図4は、モバイル機器の特徴認識システムの他のコンポーネントに関して図3のフロー図の配置を示す一般ブロック図である。 図5は、図4のコンポーネントに関して特定の実施形態で使用されるような分散判別器の配置及び動作を描写する。 図6は、図4のコンポーネントに関して特定の実施形態で使用されるような分散判別器の配置及び動作を描写する。 図7は、特定の実施形態における分散判別器の様々な動作を示すフロー図である。 図8Aは、6×6の画素ブロックに対する色相ベースの量子化レベルの1つの可能なセットを示す。 図8Bは、6×6の画素ブロックに対する色相ベースの量子化レベルの1つの可能なセットを示す。 図8Cは、6×6の画素ブロックに対する強度ベースの量子化レベルの別の可能なセットを示す。 図9Aは、分散判別器の特定の実施形態で使用されるような、級間パラメータの可能な配置を示し、級間分散は、図9Bのパラメータ間の分散と比べて大きい。 図9Bは、分散判別器の特定の実施形態で使用されるような、級間パラメータの可能な配置を示し、級間分散は、図9Aのパラメータ間の分散と比べて小さい。 図10Aは、比較的高い級内分散及び比較的低い級間分散を有するサンプル分布を示す。 図10Bは、比較的低い級内分散及び比較的高い級間分散を有するサンプル分布を示す。
本明細書に開示される実施例(implementation)は、被写体認識システムにおける改善された特徴生成のためのシステム、方法、装置を提供する。特に、本願の実施形態は、好ましくない被写体認識特徴を生成する画像の一部を除外するために、様々な特徴生成プロセスを変更することを意図する。当業者は、これらの実施形態がハードウェア、ソフトウェア、ファームウェア、又はそれらのあらゆる組み合わせで実現されうることを認識するだろう。
幾つかの実施形態は、画像の特徴を生成するための方法又はシステムに関し、それは、少なくとも1つのコンピュータプロセッサ上で実行される。この方法において、画像の少なくとも一部に関連付けられた分散値が生成されうる。分散は、一般的に、画像領域において、互いに対する類似画素の分離を指す。類似画素が互いの近くに存在する場合、分散はより低い。介在する多くの異なる画素が類似画素を分離する場合、分散はより高い。画素が非常に類似しているために区別可能なグループが存在しないとみなされる場合もまた、当業者は分散を「高い」と定義しうる。個々の類似画素が、画像内の広く分離した「群れ(clumps)」又はグループにおいて互いのそばに存在する場合でさえ、類似画素は全体として「分散された(dispersed)」状態でありうることに注意されたい。「分散値(dispersion value)」は、分散の程度を示しうる。
方法は、画像部分における画素分散が閾値を上回ることを分散値が示す場合、特徴生成プロセスの少なくとも一部から画像の一部を除外する。当業者は、本明細書で参照される閾値が、分散の程度に関すること、並びに、実際の実施例が閾値を様々な形態(逆数又は範囲など)で表しうることを容易に認識するだろう。このように、「閾値を上回る(exceeding a threshold)」は、その条件を説明するためにどのような実施例が採用されるかにかかわらず、十分な量の分散が存在することを示す。例えば、撮影された画像に対して画像認識を実行しているセルラ電話において、この特徴生成方法は有益でありうる。閾値を上回る、分散された画素分布を有する画像の一部を除外することで、システムは、それら一部を特徴生成プロセスから除去することができる。区別可能な画素グループが存在しないため、実質的に類似した画素の領域のような他の領域も除去されうる。後で撮影された画像において特徴が生成されることも認識されることもないため、この方法は計算的リソースを確保しうる。
以下の説明において、例の完全な理解を提供するために、特定の詳細が示される。しかしながら、これらの特定の詳細なく例が実施されうることは、当業者によって理解されるだろう。例えば、電気コンポーネント/機器は、不必要な詳細で例を不明瞭にしないために、ブロック図で示されうる。別の例において、そのようなコンポーネント、他の構造、及び技術は、例をさらに説明するために詳細に示されうる。
例がプロセスとして説明され、それが、フローチャート、フロー図、有限状態図、構造図、又はブロック図で描写されうることにも注意されたい。フローチャートは、動作を一連のプロセスとして説明しうるが、大半の動作は、並列して又は同時に実行され、プロセスは繰り返されうる。加えて、動作の順序は再配列されうる。プロセスは、その動作が完了すると終了する。プロセスは、方法、関数、手順、サブルーチン、サブプログラム等に対応しうる。プロセスが、ソフトウェア関数に対応する場合、その終了は、呼出し関数又は主要関数への関数の戻りに対応しうる。
当業者は、情報及び信号が多種多様な技法及び技術のいずれかを用いて表されうることを理解するだろう。例えば、上記説明の全体にわたって参照されうるデータ、命令、コマンド、情報、信号、ビット、シンボル、及びチップは、電圧、電流、電磁波、磁場又は磁性粒子、光場又は光粒子、もしくはこれらのあらゆる組み合わせによって表されうる。
被写体認識システムは、コンピュータ機器が画像内の又は1つ以上の被写体を識別することを可能にする。これらのシステムは、一般的に、画像の第1のセット内の被写体の視覚的特徴を学習する(learn)ためのプロセスの第1のセットと、その後、新しい画像の第2のセット内のそれらの特徴を認識するためのプロセスの第2のセットとを備える。画像の第1のセットは、本明細書では、「トレーニング」画像と呼ばれ、第2のセットは、「テスト」、「ライブ」、又は「フィールド内」画像と呼ばれうる。プロセスの第1のセットは、特徴をトレーニング画像から抽出し、それは、認識されるべき被写体を表現する。第2のステップにおいて、システムは、テスト又はライブ画像内のこれらの特徴を認識することで被写体を識別しうる。
特徴生成プロセスは、トレーニング画像内の特徴を識別し、それは、そこに含まれる被写体を識別するために有益である。被写体の認識を複雑にする特徴、又は、被写体の認識に関連性をほとんど有さない特徴は、除外されるべきである。本願の実施形態は、特徴生成を改善するための新しいシステム及び方法を意図する。特に、本願の実施形態は、望ましくない特徴を生成しうる画像の一部を特徴生成プロセスから除外する。具体的に、実施形態は、特徴生成システムが定期的に、テキスチャ、ランダム画素、又は、「分散された」画素分布の他のエリアを描写する画像領域内の好ましくない特徴を識別するという事実を修正する。幾つかの実施形態は、さらに、同一画素又は実質的に類似した画素しか備えない領域のような、特徴を生成する可能性の低い画像部分をプロセスから除去することによって計算を改善しうる。特徴生成プロセス内でこれらの領域を除外及び/又は変更することによって、好ましくない特徴の生成はより少なくなり、及び/又は、計算時間及びリソースが確保されるだろう。本願の実施形態は、「トレーニング」画像の原画素(raw pixel)内のこれらの領域を認識しうるが、周波数、尺度空間、n次元表現(支援ベクトルマシンで使用されるような)などの代替的な表現、あるいは、当業者には馴染みがあり、異なる特徴生成プロセスに共通した他の表現でそれらを認識しうる。この方法において、システムは、これらの特徴を生成するようにリソースに指示しないこと、及び、後の認識の間にこれらの特徴を使用しないことのいずれによっても利益がもたらされる。これらの改善により、特徴生成プロセスを採用するあらゆるシステムにおいて利益が生み出され、それらは、特に、計算時間及び効率性が重んじられるモバイル機器にとって有益である。
図1は、サーバ102、データベース103、及び、セルラネットワークのようなネットワーク104に関してモバイルデバイス(モバイル機器)101を備える通信システム100のハイレベルなブロック図を描写する。モバイル機器101は、携帯電話、ラップトップ、携帯情報端末等を備えうる。モバイル機器101は、サーバ102と通信状態にあり、それ自体がデータベース103と通信状態にありうる。サーバ102は、セルラ基地局に位置付けられるか、あるいは、ローカルネットワークのサーバ又はルータに位置付けられる。データベース103は、同様に、サーバ102の内側、又は、離れた位置に位置付けられうる。モバイル機器101は、カメラを備えるか、あるいは、USB、WI−FI、又はブルートゥース(登録商標)接続のような、画像を受信するための他の手段を含みうる。複数のアプリケーションが、モバイル機器101上でユーザに対して利用可能でありうる。これらのアプリケーションは、メッセージングサービス、撮像アプリケーション、及び、当業者に知られている他の共通アプリケーションを含みうる。モバイル機器101上のアプリケーションのうちの幾つかは、リモート位置から受信された画像に対して動作するか、又はモバイル機器101のカメラによって局所的に生成された画像に対して動作する。幾つかの実施形態において、データベース103は、画像記憶装置を備え、モバイル機器101は、サーバ102を介して画像をデータベース103に及び/又はデータベース103から送信及び/又は受信しうる。これらの画像は、モバイル機器101上で動くアプリケーションによって生成されるか、使用されうる。
上述されたように、特徴生成プロセスは、後に、画像内の被写体を認識するために使用されうる「特徴」を生成する。幾つかの実施形態において、データベース103は、画像内の被写体を識別するために使用される特徴の集合を備えうる。これらの特徴は、以下でより詳細に説明されるように、「トレーニング」画像を受信した特徴生成プロセスから生成されうる。モバイル機器101上のアプリケーションが画像内の被写体の識別を望む場合、モバイル機器101は、データベース103から特徴を検索し、この特徴を、特徴認識プロセスの一部分として適用する。代替的に、特徴は、モバイル機器101に局所的に記憶されうる。特徴は、トレーニング画像を受信した後、モバイル機器101によってデータベース103にアップロードされうる。サーバ102は、ネットワーク104とも通信状態にあり、ネットワークから遠隔的に画像又は特徴を受信しうる。このように、モバイル機器101又はデータベース103のいずれかが、認識用に記憶された画像又は特徴を含みうる。
図1はモバイルシステムを描写しているが、当業者は、本願の実施形態が他の画像化システムにも適用されうることを容易に認識するだろう。局所画像記憶装置を備えるデスクトップシステムは、例えば、局所的に実行中の特徴生成プロセスの一部分として、本願の実施形態の大部分を実現しうる。
図2は、幾つかの実施形態の画像化アプリケーションで採用されうるモバイル機器101の様々なコンポーネントのブロック図を描写する。モバイル機器101は、画像キャプチャ(撮像)システム201を備え、それは、レンズ200を介して画像を撮影する。これらの画像は、画像バッファ205に記憶され、それは、当技術分野で知られているRAM、SRAM、動的又は静的メモリを備えうる。代替的に、画像又は特徴は、コネクタ206を介して受信され、それは、ファイアワイヤ、USB、IRトランシーバ、ブルートゥースインターフェースなどを備えうる。これらの画像又は特徴は、例えば、他のユーザが別の機器からそれらを送信した場合、あるいは、モバイル機器101のユーザが、ローカルネットワーク、又はデスクトップコンピュータのような記憶機器に接続された場合に受信されうる。
モバイル機器101はさらに、アンテナ208又はコネクタ207を介して画像及び特徴データを含む情報を送信又は受信するためのモデム204を備えうる。アンテナ208は、WI−FI、セルラネットワークなどに接続するために使用される無線アンテナでありうる。特徴が識別されると、ユーザは、モデム204を介してそれらをデータベース103にアップロードし、それによって、それらは、後の認識の試み中に再度呼び出しされうる。代替的に、特徴は、局所的に記憶されうる。
撮像システム201は、独立型ハードウェア、ソフトウェア、又は、ファームウェアモジュールを備えうる。しかしながら、幾つかの実施形態において、撮像システムは、図2に示されるように、プロセッサ内のコンポーネントとして、又は、プロセッサ202上で実行中のソフトウェアとして、モバイル機器101のプロセッサ202に統合されうる。撮像システムは、画像を生成するためにレンズ200を操作する。プロセッサ202は、汎用処理ユニット又は画像化アプリケーション用に特別に設計されたプロセッサでありうる。
プロセッサ202は、それ自体が、プロセッサ202上で実行中のソフトウェア、プロセッサ内の専用コンポーネント、又は、個別の独立型ハードウェア、ソフトウェア、若しくはファームウェアモジュール等を備えうる特徴生成モジュール203を備えうる。特徴生成モジュール203は、SIFT(scale-invariant feature transform)コアモジュールを備えうる。SIFTは、本願の実施形態から利益を得る1つの可能な特徴生成プロセスを備える。特徴生成モジュール203は、1つ以上のさらなる特徴認識プロセスを実行するように設計されたソフトウェア、ファームウェア、又はハードウェアを備えうる。例えば、SIFTプロセスの変化形は、本明細書において、「SIFTプロセスファミリ」と呼ばれ、「典型的な」SIFT、PCA−SIFT、SURF、FIT、アフィン不変SIFT、RIFT(Rotational Invariant SIFT)、G−RIF(generalized robust invariant feature)、及びGLOH(gradient location and orientation histogram)などを備えうる。特徴生成モジュール203は、特定のセットの状況を考えて、様々な特徴生成プロセスの中から選択することができる。例えば、典型的なSIFTは、リソースの第1のセットを処理するアプリケーションに採用され、それに対して、SURFは、第2のセットの状況下で採用されうる。理解を容易にするために、以下の説明は、主に、SIFT特徴生成プロセスについて記載しているが、当業者は、他の特徴生成プロセスへの本願の実施形態の適用を容易に認識するだろう。
モバイル機器101の動作の例として、モバイル機器のユーザがその人の顔を忘れた場合であっても、後日その人を認識できるように、モバイル機器のユーザは、他の人の顔の画像を撮影することを望みうる。モバイル機器のユーザはまた、DVDカバーのような被写体の写真を撮影すること、及び、そのDVDカバーの画像又はテキスト(若しくは画像とテキスト)のすべて又は一部分の特徴を抽出すること望む。同様に、ユーザは、ワインボトル又は音楽CD上にあるもののような製品ラベルを認識することを望みうる。これらの例において、ユーザが事前に「トレーニング」画像自体を獲得してあるか、又は、「トレーニング」画像がデータベース103のようなデータベースに事前に記憶されうる。モバイル機器101は、レンズ200及び撮像システム201を使用して画像をキャプチャしうる。画像は、バッファ205に記憶され、次に、モデム204及びアンテナ208を介してサーバ102に送信される特徴を抽出するために、特徴生成モジュール203によって処理されうる。次に、サーバ102は、この特徴をデータベース103に記憶しうる。後に、ユーザが同じ人に再度遭遇した場合、ユーザは、モバイル機器101を用いて再度その人の写真を撮影しうる。モバイル機器101は、アンテナ208及びモデム204を介して特徴をデータベース103から検索し、この特徴を使用して、新たに撮影された画像に対して特徴認識を実行する。代替的に、画像は、データベース103にアップロードされうる。この方法で、ユーザは、第2の遭遇においてその人のアイデンティティを決定しうる。当業者は、上で説明された動作の幾つかが、代替的にモバイル機器又はサーバ上で実行されうることを容易に認識するだろう。例えば、特徴生成モジュール203は、代わりに、サーバ102上に位置付けられ、モバイル機器101は、局所的に特徴認識動作を実行するというよりはむしろ特徴認識のための原画像を送信しうる。
上述されたように、特定の実施形態についての以下の説明は、特徴生成プロセスのSIFTファミリと関連してなされる。しかしながら、当業者は、図5及び6で説明された実施形態が、ヌル空間PCA、支援ベクトルマシン、神経ネットワーク等として、そのような特徴生成プロセスに対してなされることを容易に認識するだろう。
図3は、特徴生成プロセスのSIFTファイミリにおける多数のステップを描写するフロー図である。描写されたステップの幾つかは、大部分のプロセスと共通しており、他の幾つかは、特定のファミリメンバにのみ特有である。例えば、「典型的な」SIFTは、ガウスカーネルを使用して、尺度空間表現(scale space representation)301を生成し、それに対し、SURFは、その代わりに、ボックス機能(box function)302を使用しうる。一般的に言えば、プロセスのSIFTファミリは、「尺度空間極値検出」、「キーポイント局所化」、「オリエンテーション割当」、及び「キーポイント記述子の生成」からなるステップを備える。SIFTのバージョンは、David G. Lowe, “Distinctive image features from scale-invariant keypoints,” International Journal of Computer Vision, 60, 2 (2004), pp. 91-110(以下、Lowe)という出版物で詳細に説明されている。当業者は、Loweの用語が、本願の用語と正確に対応するわけではないことを認識しうる。
プロセスのSIFTファミリは一般的に、カメラから又は記憶装置からの入力311として原画像の画素データ300を受信することで開始する。これらの原画素は、「尺度空間表現」301、302に変換される。尺度空間は、当業者には容易に知られている信号処理技術であり、原画像300は、様々な尺度で「ぼやけた(blurred)」表現を生成するために「ぼやけている(blurred)」。様々な尺度での表現は、「ピラミッド」表現とも呼ばれ、複数のバージョンの画像が多様な尺度及びぼやけの程度で生成される。この方法において、画像は、画像尺度に対して変換が不変である形態に変換される。即ち、原画素情報を「一般化(generalizing)」する。
尺度空間表現を構築することは、例えば畳み込みなどによって、様々な尺度の画像に対して「カーネル(kernel)」を適用することを含みうる。前述されたように、典型的なSIFTなどの幾つかのプロセスは、ガウスカーネル301を使用して尺度空間画像表現を構築しうる。SURFのような他のプロセスは、ボックス機能302を用いて尺度空間表現を構築しうる。尺度空間への変換の後、システムは、尺度空間画像と原画像との差分をとりうる。この「画像の差分」303は、ハイコントラストの領域を示しうる。これらのハイコントラストの領域、即ち「極値(extrema)」は、幾つかの尺度にわたる画像の差分の局所的な最小値/最大値として識別されうる。例えば、異なる画像内の各画素は、同一の尺度にある隣接画素と、及び、他の様々な尺度にある隣接画素と比較されうる。画素値が、比較されたすべての画素の中で最大又は最小である場合、それは、「キーポイント」として知られる関心領域として識別されうる。これは、一般的に、「キーポイント局所化」と呼ばれ、Loweでより詳細に説明されている。キーポイントは、特徴を生成するために使用されうる。
例えば、キーポイントの回りでサブ画素補間305が実行され、画素サイズには及ばない正確性でキーポイントの位置を決定しうる。次に、システムは、エッジ及び低いコントラストの領域にあるキーポイント306をフィルタリングして、誤って決定されたキーポイントを最小化しうる。次に、特徴のオリエンテーション不変性を達成するために、各勾配は、最大又は最小画素値の勾配の方角に基づいて「オリエンテーション」307が割り当てられる。この方法において、キーポイントは、回転不変な方法で(即ち、任意の座標軸というよりはむしろ勾配に関して)説明されうる。幾つかの実施形態において、勾配は、尺度空間ピラミッドのレベルごとに計算されうる。これは、一般的に、「オリエンテーション割当」と呼ばれ、Loweでより詳細に説明されている。
この点で、各キーポイントは、画像の位置、尺度、オリエンテーション(方向性)と関連づけられうる。次に、キーポイントの尺度及び回転不変表現を確実にするためにキーポイント記述子が割り当てられうる308。これは、キーポイントの回りの領域内の各画像のサンプルポイントで勾配の大きさ及びオリエンテーションを計算することによって行われうる。これらのサンプルは、サブ領域のコンテンツを集約するオリエンテーションヒストグラムに累積されうる。これは一般的に、「キーポイント記述子の生成」と呼ばれ、Loweでより詳細に説明されている。
それらの記述子に関するこれらのキーポイントは、出力され310、後の認識のために記憶されうる「特徴」を備える。当業者は、より効率的な記憶を容易にするために特徴が「圧縮されること」又は「低減されること」を容易に認識するだろう。SIFT−PCAにおいて、例えば、システムによって出力される特徴の数は、特徴セットの主要コンポーネント分析(PCA)309を実行することで減らされうる。PCAは、数学的な手順、特に、固有ベクトルベースの多変量分析であり、それは、相関する可能性のある変数の数を、より小ない数の、主要コンポーネントと呼ばれる無相関な変数に変換する。 変換されると、データの投影のための最大分散は、第1の主要座標に横たわり、次に大きい分散は、第2の主要座標に沿う。初期の主要コンポーネントが大部分の情報を備えるため、当業者は通常、データの公平な説明を保持したまま、それより後のコンポーネントを除去することができる。この方法で、PCAは、データを記述するために要求されるディメンションの数を減らすために使用され、例えば、データベース103などにおける特徴の改善された記憶を可能にする。
図4は、上の特徴生成プロセスを示し、それは、特に、画像キャプチャデバイス(撮像装置)201及び画像バッファ205のような、モバイル機器の他のコンポーネントに関連して、特徴生成モジュール203に見られうる。画像を撮影し、それをバッファ205に記憶することに応じて、システムは、原画像の画素300を、上に概要が述べられた特徴生成プロセスを実行しうる特徴生成モジュール203に渡しうる。
上述されたSIFTプロセスファミリのメンバを含む多数の特徴生成プロセスは、高い周波数詳細の領域を識別することによって、画像内の関心領域を決定する。例えば、SIFTプロセスにおいて、尺度空間表現の差分は、後にキーポイントとなりうる「極値」の領域を示す。表現の差分は、高周波数の領域(即ち、隣接する画素間の変化が大きい領域)に等しい。これらのタイプの画像領域が、ほとんど分離されていない、及び、わずかに分離されている場合、これらの高周波数の決定はうまく機能する。あいにく、ランダムノイズは、高い空間周波数を有するため、結果として、被写体認識にほとんど関連性のない特徴を生成しうる。同様に、木の葉のクラスタ、草の葉の大きいクラスタ、又は、服の模様などのテキスチャを備える画像のエリアもまた、それ程好ましくない特徴を生成しうる。これらの「分散された」テキスチャは、近隣の画素間の顕著な分散、即ち、高い周波数情報を含む画像領域を備える。これらの領域は、被写体認識手順に対してほとんど利益を提供しない特徴を生成するだけでなく、特徴生成及び認識プロセスにおいて価値のある時間及びリソースを消費しうる。従って、本願の実施形態は、高い周波数の領域を識別する特徴生成プロセスから、これらの特徴を生成する画像の一部を除去するためのシステム及び方法を意図する。重ねて、SIFTファミリが上に詳細に説明されたが、当業者は、開示された技術が、高い周波数領域において好ましくない特徴を生成する他のプロセスに適用されることを容易に認識するだろう。
本願の実施形態は、特徴生成プロセス内側又は外側への「分散判別器」の組み込みを意図する。分散判別器は、ソフトウェア(ソフトウェアモジュールのような)、ハードウェア、又は、ファームウェアを備えうる。分散判別器は、分散テキスチャの領域のような画像の一部を、特徴生成プロセスによるさらなる分析から除外しうる。例えば、この判別器は、単に、これら一部を処理のためのプロセスに提供しないか、又は、これら一部を、好ましくない特徴を生成しない値と置き換えうる。この方法で、システムは、より正確に及びより効率的に関連性のある特徴を認識しうる。図5及び図6は、モバイル機器の特徴認識システムの他のコンポーネントに対する分散判別器の配置を示すブロック図を描写する。図5及び6における判別器の配置は、SIFTに関して例示することを目的としている。しかしながら、当業者は、この判別器が、ヌル空間PCA、支援ベクトルマシン、神経ネットワーク、及び、他の特徴生成プロセスを組み込むシステムに類似して配置されることを容易に認識するだろう。分散判別器の配置及び動作は、当業者が容易に認識するように、下に説明されるように分散した原画素データに対応する画像の一部をフィルタリングするためだけに変更される必要がある。
図5に示される1つの実施形態において、撮像装置201が画像を獲得した後に画像バッファ205で原画像画素300が見つけられると、分散判別器502は、それらを分析する。判別器は、好ましくないテキスチャを備えうる画素内の分散の領域を決定する。判別器は、さらに、同一画素のブロックのような、変動がほとんど又はまったくない領域を決定しうる。判別器502は、後続の特徴分析からこれらの領域を除外するために、スイッチ501又は他の除外手段を備えうるか、あるいは、それらと連動して動作しうる。図5において、スイッチ501は、尺度空間画像の差分でゲートキーピング機能(gate keeping function)を実行するものとして示される。当業者は、原画素のデータ300が尺度空間に変換される前にスイッチ501を配置することによって、原画素が変更又は除外されうることを容易に認識するだろう。反対に、スイッチ501は、例えば、極値304の配置の後など、プロセスにさらに配置されうる。この方法で、キーポイントが分散テキスチャを備えると判別器が決定した後に、このキーポイントは変更又は除外されうる。スイッチは「除外手段」と呼ばれているが、好ましくない特徴の生成を回避するために画像コンテンツを除去するというよりはむしろ変更する他の機器も、それらが好ましくない特徴に責任を有する部分を同じように除外するため、「除外手段」を同様に備えること、を当業者は容易に理解するだろう。
図6の実施形態で示されている別の例として、判別器は、その代わりとして、尺度空間画像、即ち、ぼやけた画像に対して動作する。ここで、スイッチ501は、さらに、残りのプロセスからそれらのコンテンツを除外又は変更するように尺度空間画像に対して動作する。判別器の閾値及びパラメータは、同様に、残りのプロセスから高い分散の領域を除外するために、原画素よりはむしろ尺度空間データを受信するように変更されうる。これらの変更は、以下でより詳細に説明される。このように、当業者は、スイッチ501が、出力310される前の、プロセスのどこかに配置されうることを認識するだろう。
幾つかのシステムは、特徴生成モジュール203内で1よりも多くの特徴認識プロセスを実現しうるか、それらは、複数の特徴生成モジュール203を動作しうる。例えば、幾つかの状況において、より良い結果は、重ねた認識プロセスを使用して達成されうる。SIFTは、記憶リソースが容易に入手可能である場合に使用され、PCA−SIFTは、記憶空間が限られている場合に使用されうる。本願の実施形態の幾つかにおいて、分散判別器502は、認識方法から選択する機器と通信状態にありうる。画像が撮影される状況に依存して、モバイル機器101は、特徴認識方法を重ねて実行しうる(正確性対速度、画像の主題、等)。上述された実施形態は、判別器の効率的な配置を示しているが、当業者は、この判別器が、出力前のプロセスの任意の時点で画素を除外するように動作しうることを容易に認識するだろう。例えば、キーポイントは、フィルタリング306の間に、又は、記述子308が準備された後に除去されうる。しかしながら、プロセスの異なる位置での動作は、分散判別器が、特定の位置に現れるデータに対して動作するように変更されることを要求しうる。
図7は、画像の一部が分散画素データの領域に対応するか否かを決定するために使用される分散判別器502の様々な動作を示すフロー図である。理解を容易にするために、上に記述されたように、代替的な方法(尺度空間アセスメント、周波数、ドメインアセスメント、等)が使用されるが、図7では、原画像の画素に対する判別器502の動作700が描写される。図10A及び10Bについて、図7の分散判別器502の動作700の背後にある原理が説明されるだろう。次に、これらの原理の実施例が、図7の詳細に関連して記述される。図10Aは、データ1001a及び1001bという2つの級に関して、サンプル値(x軸)にわたる測定1000aを描写する。データ1001a及び1002aというこれら2つの級は、それぞれ、「級内」分散1004a、1003aを有し、「級間」分散1005aを有する2つのガウス分布によって表される。図10Bは、同様に、関連した「級内」分散1004a、1003b及び「級間」分散1005bを有する、データ1001b及び1002bという2つの級を表す。当業者は、図10Aにおける級分布が、2つの級がより大きなオーバラップを含むという意味で、より「分散された」状態であることを観測するだろう。図10Bに描写された級に比べて、両方の級が広範囲をカバーし、両方の級がよりオーバラップするため、ランダムに選択された値は、どちらかの級に入る可能性が高い。対称的に、図10Bは、示されるように、級がより狭く定義され、オーバラップしない可能性があるため、より分散が少ない分布を描写する。特定の実施形態は、この相対分散を表す値が、線形の判別手段分析のフィッシャー判別関数によって漠然と引き起こされることを意図する。この値は、分布の「分散」を示すように、「級内」及び「級間」分散の比を表しうる。図10Aにおいて、例えば、「級間」分散1005aは、図10Bのものよりも小さく、「級内」分散1004a及び1003aは、図10Bのものよりも大きい。反対に、図10Bにおいて、「級間」分散1005bは、図10Aのものよりも大きく、「級内」分散1004b及び1003bは、図10Aのものよりも小さい。特定の実施形態は、図10A−Bについての記述に類似した方法で、「級間」及び「級内」分散を用いて画素分散を決定することを意図する。
図7に戻り、これらの実施形態における判別器502は、分散の測定が行われうるように、画像ブロック701内の画素の「級内」及び「級間」分布を決定しようとする。判別器が、画像部分701を受信する702前に、システムは、画像内にみられうる画素値の領域を量子化する。これは、画素色相、明度、又は類似した画素特性の量子化を備え、システムが分散判別器を用いる前に行われうる。このステップは画像ブロックの受信後に行われうるが、当業者は、画像に対する動作の前に、事前に、この領域が量子化されうることを容易に認識するだろう。量子化された領域は、事前に計算され、例えば、モバイル機器101又はサーバ102上のどこかにあるテーブルに記憶されうる。続いて、判別器が、「トレーニング画像」の画像ブロック内の画素701を受信する702と、画素は、それらのそれぞれの量子化領域703に関連づけられる。共通領域の範囲内の画素は、共通の級ID703が割り当てられる。即ち、値が同じ量子化の範囲内である画素は、同じ「級」を備える。
図8A〜Cについて、これらの級がより詳細に説明される。図8Aは、1つの可能な例として、36個の画素を備える6×6の画像ブロック801を示す。述べられたように、可能な色相の所与の量子化領域の範囲内の画素は、関連量子化レベル、即ち、級IDが割り当てられるだろう。当業者は、画素値を領域と比較するように構成されたソフトウェアコードのような、画素を量子化値に関連付けるための多くの手段を容易に認識するだろう。このように、図8Aの画素は、「X」、「O」、及び「+」で示される3つの級にグループ化されうる。これら3つの領域は、所与の量子化レベルの画素が互いの近くに存在する傾向がある、即ち、左上には「X」、左下には「O」、及び右には「+」が存在する、という意味で、比較的「同質」である。図8Bは、対称的に、同一のディメンションを有するが、「分散された」画素の集合を備える画素ブロックを示す。ここで、所与の量子化級の画素は、必ずしも、ブロック内で互いの近くに位置付けられるわけではない。上述されたように、図7及び図8A〜Bは色彩量子化を指すが、当業者は、量子化されうる多くの代替的な画素パラメータを容易に認識するだろう。例えば、図8Cは、明度値で示された、画素の分散された分布を示す。これらの画素値は、実施例に依存して量子化されうるか、あるいは、量子化されない可能性がある。これらの値は、グレースケール明度値等を備えうる。
再び図7に戻り、上述されたように、次に、同じ量子化レベルを備える画素が級にグループ化されうる703。次に、各級は、図10A〜Bに関して上述された方法に類似した方法で、画像ブロック内の「分散」の測定を決定するために使用されうる。それらの図に関して説明されたように、級同士の「級内」及び「級間」分散は、分散の測定を決定するために使用されうる。図7に対応する実施形態において、「級間」変動Sの測定及び「級内」変動Sの測定705は、以下でさらに詳しく説明されるように、級間基準mref及び級のモーメントm704に基づいて決定されうる。
特定の実施形態において意図されたような、mref及びmの決定、並びに、後続のS及びSの計算がここで説明される。図7の画像部分702を再度参照して、画素領域が判別器502によって分析されるべきであることを考慮する。図8A〜C及び9A〜Bに示されるように、x及びyが、それぞれ、領域内の画素の列及び行の位置を指すと想定する。このように、領域内の各画素zは、位置に関連づけられる。即ち、z=(x、y)である。さらに、画素領域は、N個の画素を備え、N個の画素の各々は、C個の量子化級のうちの1つに分類されうる。例えば、画像内のすべての画素が、3つの量子化レベルのうちの1つに関連付けられた場合、C=3である(これは、8Aのケースである)。1次モーメントとして知られる平均m、即ち、特定の級ZのN個のデータポイントの級の重心は、以下のように定義されうる:
Figure 0005607261
当業者は、画素位置の値を合計し、画素の数で除算するソフトウェアコードなど、これらのモーメントを決定するための多くの方法を容易に認識するだろう。mという用語は、その級における各画素の平均の中心位置を表す画素領域内の位置を指す。例として、図9Aは、図8Aの「X」級、「O」級、「+」級に対する平均m、m、mを示す。各々の級に対して平均miが決定されると、級の平均に対するその級内の各画素のユークリッド距離を合計することによって、級に対する級内分散が決定されうる。次に、級内分散は、以下のように値Sを形成するために、C個すべての級にわたって累積されうる:
Figure 0005607261
「級間」値Sは、以下のように決定されうる。共通の基準点mrefは、級の平均mの各々の間での比較のために選択されうる。1つの実施形態において、mrefは、画素領域の中心901(例えば、17×17の領域の位置9,9)であり、よって、各画素ブロックと固定された残りが考慮されうる。幾つかの実施形態において、基準は、サブ画素位置を備え、当業者は、この基準が物理位置に対応する必要ないことを認識するだろう。画像部分のディメンションが繰り返しの間で変化する場合、基準位置は、同じように変更されうる。次に、「級間」測定Sは、この基準に対する各級の平均のユークリッド距離をとることによって計算されうる:
Figure 0005607261
このように、Sは、各級の中間ポイントmとグローバル基準mrefとの間の分散を指し、よって、級間変動の指標として寄与する。Sは、級内の分散、即ち、各々の級からそれらの平均mまでの距離を指す。図10A〜Bに関して説明されたように、本願の実施形態のいつくかは、これら2つの測定値を、場合によっては比として、画素領域内の分散Dの指標として比較すること706を意図する。
Figure 0005607261
このように、級の中心が互いにさらに分布される(即ち、Sが増加する)と、分散は減少する(図8A及び9A参照)。これは、画像ブロックが類似した色相のグループを備えるケースであり、その級の中心、即ちモーメントが画素領域において広く分離される。反対に、級の中心の密集した集合は、級が互いに近いこと、及び、量子化されたレベルの級が近くにあるか、混ぜられてあるかのいずれかである(即ち、Sが減少する、図8B及び9B参照)ことを示す。類似した方法で、級のメンバがより厳格に限定される(Sが減少する)と、分散は減少する。級のメンバがより広く分離される(Sが増加する)と、分散は増加する。上述されたように、システムはまた、同一又は「実質的に類似した」画素の領域を除外しうる。幾つかの実施形態において、これは、画素領域が単一の級しか備えない場合、Sをゼロであると定義することによって達成されうる。結果として、値Dは、非常に高い又は無限の分散を示すだろう。値Dは、さらに、後処理を容易にするために、様々な形態へと操作されうる。例えば、特定の実施形態は、分散を示す指標として、測定の逆のログをとることをさらに考慮する。幾つかの実施形態は、分布のエントロピ「E」としてこれを指しうる。
Figure 0005607261
結果として、高いエントロピの領域は、除外されうる。上述されたように、実質的に類似した又は同一の画素(即ち、特定の領域内の画素)の領域においてSをゼロに定義することによって、エントロピは、同様に、この領域において極めて高い又は無限であり、これもまた、画像部分をプロセスから除外することにつながる。
判別器502は、分散測定Dを閾値値と比較し707、それによって、画像ブロックが分散画素分布に対応するか否かを決定する。測定が閾値を超える場合、動作の第1のコース708が行われ、超えない場合、代替的なコース709が行われる。例えば、スイッチ501は、上述されたように、決定に基づいて動作されうる。これらの閾値は、予め設定されるか、試行錯誤の結果事前に決定されるか、情報に基づいて予測されるか、又は、前のトレーニングセッションに基づいて動的に生成されうる。ファジー論理(fuzzy logic)、機械学習方法など、動作のコースを決定するための代替的な手段は、当業者によって容易に想像されるだろう。決定が行われた後、プロセスは、終了し710、画像の新しい一部が処理のために受信される。それ以上の部分が処理を要求しない場合、システムは中断する。
図10A〜Bに関して説明された「級間」及び「級内」判別測定は、分散判別器の実施形態のうちの1つの級を備えるが、当業者は、分散値を生成するための代替的な手段を容易に認識するだろう。例えば、画素領域の周波数表現は、フーリエ変換などによって、行われうる。より多くの数の周波数を備える領域は、より少ない周波数を有する領域よりも大きな分散を有するものとして分類されうる。
当業者であれば、本明細書に開示された実施例に関連して説明された様々な実例となる論理ブロック、モジュール、回路、及びプロセスのステップが、電子ハードウェア、コンピュータソフトウェア、又は両方の組み合わせとして実現されうることを容易に理解するだろう。このハードウェア及びソフトウェアの互換性を明確に示すために、様々な実例となるコンポーネント、ブロック、モジュール、回路、及びステップが、一般的にそれらの機能の観点から、上に説明されている。このような機能が、ハードウェアとして実現されるか、ソフトウェアとして実現されるかは、特定のアプリケーション、及びシステム全体に課せられる設計制約に依存する。当業者は、特定のアプリケーションの各々に関して説明された機能を多様な方法で実現することができるが、このような実現の決定は、本発明の範囲を逸脱するものとして解釈されるべきでない。当業者は、一部が、即ち、一部分が、全体以下の内容を備えることを認識するだろう。例えば、画素の集合の一部は、それらの画素のサブ集合を指しうる。
本明細書に開示された実施例に関連して説明された様々な実例となる論理ブロック、モジュール、及び回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)又はその他のプログラマブル論理機器、ディスクリートゲート又はトランジスタロジック、ディスクリートハードウェアコンポーネント、あるいは本明細書に説明された機能を実行するように設計されたこれらの任意の組み合わせで、実現又は実行されうる。汎用プロセッサは、マイクロプロセッサでありうるが、代替的に、このプロセッサは、任意の従来型プロセッサ、コントローラ、マイクロコントローラ、又はステートマシン(state machine)でありうる。プロセッサはまた、計算機器の組み合わせ、例えば、DSPと、1つのマイクロプロセッサ、複数のマイクロプロセッサ、DSPコアと結合された1つ以上のマイクロプロセッサとの組み合わせ、又は他のそのような構成として実現されうる。
本明細書に開示された実施例に関連して説明された方法又はプロセスのステップは、直接ハードウェアに、プロセッサによって実行されるソフトウェアモジュールに、又はこれら2つの組み合わせに組み込まれうる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、取り外し可能ディスク、CD−ROM、あるいは、当技術分野で知られているあらゆる他の形式の非一時的な記憶媒体に存在しうる。例示的なコンピュータ読取可能な記憶媒体は、プロセッサがこのコンピュータ読取可能な記憶媒体から情報を読み取り、このコンピュータ読取可能な記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替的に、記憶媒体は、プロセッサに一体化されうる。プロセッサと記憶媒体とは、ASICに存在しうる。ASICは、ユーザ端末、カメラ、又は別の機器に存在しうる。代替的に、プロセッサと記憶媒体とは、ディスクリートコンポーネントとしてユーザ端末、カメラ、又は他の機器に存在しうる。
参照のため、及び、様々なセクションの位置付けを助けるために、本明細書では表題が含まれている。これらの表題は、それらに関して説明されたコンセプトの範囲の制限を意図するものではない。そのようなコンセプトは、本明細書全体を通して適用性を有しうる。
開示された実施例についての以上の説明は、いずれの業者であっても本願の発明を製造又は使用できるようにするために、提供される。これら実施例に対する様々な変更は、当業者には容易に明らかであり、本明細書で定義された包括的な原理は、本発明の精神又は範囲から逸脱することなく、他の実施例にも適用されうる。従って、本発明は、本明細書に示された実施例に限定されることが意図されず、本明細書に開示された原理及び新規な特徴と一致する最も広い範囲が与えられるべきである。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[C1]
少なくとも1つのプロセッサ上で実行される、特徴を生成するための方法であって、
分散値を画像の少なくとも一部に関連付けることと、
前記画像の前記少なくとも一部における分散が閾値を上回ることを前記分散値が示す場合に、特徴生成プロセスの少なくとも一部から前記画像の前記少なくとも一部の少なくとも一部分を除外することと、
を備える方法。
[C2]
前記一部分を除外することは、前記画像の前記少なくとも一部が前記特徴生成プロセスの前記少なくとも一部によって処理される前に、異なる値を有する前記画像の前記少なくとも一部を差し引くことを備える、C1に記載の方法。
[C3]
前記分散値は、前記画像の一部内の前記画素値のエントロピの測定を備える、C1に記載の方法。
[C4]
前記分散値は、前記画像の前記一部の周波数特性を備える、C1に記載の方法。
[C5]
前記分散値は、少なくとも、前記画像の前記一部内の画素値の級間変動及び級内変動に基づく、C1に記載の方法。
[C6]
前記分散値を関連付けることは、
前記画像の前記少なくとも一部内の画素を量子化値と関連付けることと、
同一の量子化値を有する画素の集合に対して前記1次モーメントを決定することと、
少なくとも2つの集合の前記1次モーメントの間の距離を測定することと、を備える、C1に記載の方法。
[C7]
前記少なくとも2つの集合の1次モーメントの間の距離は、前記分散値の値に反比例しうる、C6に記載の方法。
[C8]
前記特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備える、C1に記載の方法。
[C9]
前記特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備える、C1に記載の方法。
[C10]
命令を備える非一時的なコンピュータ読取可能な媒体であって、前記命令は、
分散値を画像の少なくとも一部に関連付けることと、
前記画像の前記少なくとも一部における分散が閾値を上回ることを前記分散値が示す場合に、前記画像の前記少なくとも一部の少なくとも一部分を特徴生成プロセスの少なくとも一部から除外することと
からなるステップを電子機器に実行させるように構成された、非一時的なコンピュータ読取可能な媒体。
[C11]
前記一部を除外することは、前記画像の前記少なくとも一部が前記特徴生成プロセスの前記少なくとも一部によって処理される前に、異なる値を有する前記画像の前記少なくとも一部を差し引くことを備える、C10に記載の非一時的なコンピュータ読取可能な媒体。
[C12]
前記分散値は、前記画像の前記一部内の前記画素値のエントロピの測定を備える、C10に記載の非一時的なコンピュータ読取可能な媒体。
[C13]
前記分散値は、前記画像の前記一部の周波数特性を備える、C10に記載の非一時的なコンピュータ読取可能な媒体。
[C14]
前記分散値は、少なくとも、前記画像の前記一部における画素値の級間変動及び級内変動に基づく、C10に記載の非一時的なコンピュータ読取可能な媒体。
[C15]
前記分散値を関連付けることは、
前記画像の前記少なくとも一部内の画素を量子化値に関連付けることと、
同一の量子化値を有する画素の集合についての前記1次モーメントを決定することと、
少なくとも2つの集合の前記1次モーメントの間の距離を測定することと、
を備える、C10に記載の非一時的なコンピュータ読取可能な媒体。
[C16]
前記少なくとも2つの集合の1次モーメントの間の距離は、前記分散値の値に反比例しうる、C15に記載の非一時的なコンピュータ読取可能な媒体。
[C17]
前記特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備える、C10に記載の非一時的なコンピュータ読取可能な媒体。
[C18]
前記特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備える、C10に記載の非一時的なコンピュータ読取可能な媒体。
[C19]
前記電子機器は無線電話を備える、C10に記載の非一時的コンピュータ読取可能媒体。
[C20]
命令を備える電子機器であって、前記命令は、
分散値を画像の少なくとも一部に関連付けることと、
前記画像の前記少なくとも一部における分散が閾値を上回ることを前記分散値が示す場合に、前記画像の前記少なくとも一部の少なくとも一部分を特徴生成プロセスの少なくとも一部から除外することと、
からなるステップを実行するように構成される、電子機器。
[C21]
前記一部を除外することは、前記画像の前記少なくとも一部が前記特徴生成プロセスの前記少なくとも一部によって処理される前に、異なる値を有する前記画像の前記少なくとも一部を差し引くことを備える、C20に記載の電子機器。
[C22]
前記分散値は、前記画像の前記一部内の前記画素値のエントロピの測定を備える、C20に記載の電子機器。
[C23]
前記分散値は、前記画像の前記一部の周波数特性を備える、C20に記載の電子機器。
[C24]
前記分散値は、少なくとも、前記画像の前記一部における画素値の級間変動及び級内変動に基づく、C20に記載の電子機器。
[C25]
分散値を関連付けることは、
前記画像の前記少なくとも一部の画素を量子化値に関連付けることと、
同一の量子化値を有する画素の集合についての前記1次モーメントを決定することと、
少なくとも2つの集合の前記1次モーメントの間の距離を測定することと、を備える、C20に記載の電子機器。
[C26]
前記少なくとも2つの集合の1次モーメントの間の距離は前記分散値の前記値に反比例しうる、C25に記載の電子機器。
[C27]
前記特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備える、C20に記載の電子機器。
[C28]
前記特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備える、C20に記載の電子機器。
[C29]
前記電子機器は無線電話を備える、C20に記載の電子機器。
[C30]
電子機器であって、
分散値を画像の少なくとも一部に関連付けるための手段と、
前記画像の前記少なくとも一部における分散が閾値を上回ることを前記分散値が示す場合に、前記画像の前記少なくとも一部の少なくとも一部分を特徴生成プロセスの少なくとも一部から除外するための手段と、
を備える、電子機器。
[C31]
前記関連付ける手段は、級間分散と級内分散とを決定するように構成された分散判別器ソフトウェアモジュール備え、前記除外するための手段はスイッチを備える、C30に記載の電子機器。
[C32]
前記一部を除外することは、前記画像の前記少なくとも一部が前記特徴生成プロセスの前記少なくとも一部によって処理される前に、異なる値を有する前記画像の前記少なくとも一部を差し引くことを備える、C30に記載の電子機器。
[C33]
前記分散値は、前記画像の前記一部内の前記画素値のエントロピの測定を備える、C30に記載の電子機器。
[C34]
前記分散値は、前記画像の前記一部の周波数特性を備える、C30に記載の電子機器。
[C35]
前記分散値は、少なくとも、前記画像の前記一部における画素値の級間変動及び級内変動に基づく、C30に記載の電子機器。
[C36]
前記分散値を関連付けるための手段は、
前記画像の前記少なくとも一部内の画素を量子化値に関連付けるための手段と、
同一の量子化値を有する画素の集合についての前記1次モーメントを決定するための手段と、
少なくとも2つの集合の前記1次モーメントの間の距離を測定するための手段と、
を備える、C30に記載の電子機器。
[C37]
前記少なくとも2つの集合の1次モーメントの間の距離は前記分散値の前記値に反比例しうる、C36に記載の電子機器。
[C38]
前記特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備える、C30に記載の電子機器。
[C39]
前記特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備える、C30に記載の電子機器。
[C40]
前記電子機器は無線電話を備える、C30に記載の電子機器。

Claims (51)

  1. 少なくとも1つのプロセッサ上で実行される、特徴を生成するための方法であって、
    分散値を画像の少なくとも一部に関連付けることと、
    前記画像の前記少なくとも一部における分散が閾値を上回ることを前記分散値が示す場合に、特徴生成プロセスの少なくとも一部から前記画像の前記少なくとも一部の少なくとも一部分を除外することと、
    を備え
    分散値を関連付けることは、
    前記画像の前記少なくとも一部内の画素を級に割り当てることと、
    前記画素割当に基づいて、前記画像の前記少なくとも一部についての級内変動測定と、前記画像の前記少なくとも一部についての級間変動測定を決定することと、
    前記分散値を決定するために、前記級内変動測定と、前記級間変動測定とを比較することと、
    を備える、方法。
  2. 前記一部分を除外することは、前記画像の前記少なくとも一部が前記特徴生成プロセスの前記少なくとも一部によって処理される前に、異なる値を有する前記画像の前記少なくとも一部を差し引くことを備える、請求項1に記載の方法。
  3. 前記分散値は、前記画像の一部内の前記画素値のエントロピの測定を備える、請求項1に記載の方法。
  4. 前記分散値は、前記画像の前記一部の周波数特性を備える、請求項1に記載の方法。
  5. 前記割り当てることは、前記画像の前記少なくとも一部内の画素を量子化値と関連付けることを備え、
    前記決定することは、
    同一の量子化値を有する画素の集合に対して前記1次モーメントを決定することと、
    少なくとも2つの集合の前記1次モーメントの間の距離を測定することと、
    を備える、請求項1に記載の方法。
  6. 前記少なくとも2つの集合の1次モーメントの間の距離は、前記分散値の値に反比例しうる、請求項に記載の方法。
  7. 前記特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備える、請求項1に記載の方法。
  8. 前記特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備える、請求項1に記載の方法。
  9. 命令を備える非一時的なコンピュータ読取可能な媒体であって、前記命令は、
    分散値を画像の少なくとも一部に関連付けることと、
    前記画像の前記少なくとも一部における分散が閾値を上回ることを前記分散値が示す場合に、前記画像の前記少なくとも一部の少なくとも一部分を特徴生成プロセスの少なくとも一部から除外することと
    からなるステップを電子機器に実行させるように構成され、
    分散値を関連付けることは、
    前記画像の前記少なくとも一部内の画素を級に割り当てることと、
    前記画素割当に基づいて、前記画像の前記少なくとも一部についての級内変動測定と、前記画像の前記少なくとも一部についての級間変動測定を決定することと、
    前記分散値を決定するために、前記級内変動測定と、前記級間変動測定とを比較することと、
    を備える、非一時的なコンピュータ読取可能な媒体。
  10. 前記一部を除外することは、前記画像の前記少なくとも一部が前記特徴生成プロセスの前記少なくとも一部によって処理される前に、異なる値を有する前記画像の前記少なくとも一部を差し引くことを備える、請求項に記載の非一時的なコンピュータ読取可能な媒体。
  11. 前記分散値は、前記画像の前記一部内の前記画素値のエントロピの測定を備える、請求項に記載の非一時的なコンピュータ読取可能な媒体。
  12. 前記分散値は、前記画像の前記一部の周波数特性を備える、請求項に記載の非一時的なコンピュータ読取可能な媒体。
  13. 前記割り当てることは、前記画像の前記少なくとも一部内の画素を量子化値に関連付けることを備え、
    前記決定することは、
    同一の量子化値を有する画素の集合についての前記1次モーメントを決定することと、
    少なくとも2つの集合の前記1次モーメントの間の距離を測定することと、
    を備える、請求項に記載の非一時的なコンピュータ読取可能な媒体。
  14. 前記少なくとも2つの集合の1次モーメントの間の距離は、前記分散値の値に反比例しうる、請求項13に記載の非一時的なコンピュータ読取可能な媒体。
  15. 前記特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備える、請求項に記載の非一時的なコンピュータ読取可能な媒体。
  16. 前記特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備える、請求項に記載の非一時的なコンピュータ読取可能な媒体。
  17. 前記電子機器は無線電話を備える、請求項に記載の非一時的コンピュータ読取可能媒体。
  18. 命令を備える電子機器であって、前記命令は、
    分散値を画像の少なくとも一部に関連付けることと、
    前記画像の前記少なくとも一部における分散が閾値を上回ることを前記分散値が示す場合に、前記画像の前記少なくとも一部の少なくとも一部分を特徴生成プロセスの少なくとも一部から除外することと、
    からなるステップを実行するように構成され、
    分散値を関連付けることは、
    前記画像の前記少なくとも一部内の画素を複数の級に割り当てることと、
    前記画素割当に基づいて、前記画像の前記少なくとも一部についての級内変動測定と、前記画像の前記少なくとも一部についての級間変動測定を決定することと、
    前記分散値を決定するために、前記級内変動測定と、前記級間変動測定とを比較することと、
    を備える、電子機器。
  19. 前記一部を除外することは、前記画像の前記少なくとも一部が前記特徴生成プロセスの前記少なくとも一部によって処理される前に、異なる値を有する前記画像の前記少なくとも一部を差し引くことを備える、請求項18に記載の電子機器。
  20. 前記分散値は、前記画像の前記一部内の前記画素値のエントロピの測定を備える、請求項18に記載の電子機器。
  21. 前記分散値は、前記画像の前記一部の周波数特性を備える、請求項18に記載の電子機器。
  22. 前記割り当てることは、前記画像の前記少なくとも一部の画素を量子化値に関連付けることを備え
    前記決定することは、
    同一の量子化値を有する画素の集合についての前記1次モーメントを決定することと、
    少なくとも2つの集合の前記1次モーメントの間の距離を測定することと、
    を備える、請求項18に記載の電子機器。
  23. 前記少なくとも2つの集合の1次モーメントの間の距離は前記分散値の前記値に反比例しうる、請求項22に記載の電子機器。
  24. 前記特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備える、請求項18に記載の電子機器。
  25. 前記特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備える、請求項18に記載の電子機器。
  26. 前記電子機器は無線電話を備える、請求項18に記載の電子機器。
  27. 電子機器であって、
    分散値を画像の少なくとも一部に関連付けるための手段と、
    前記画像の前記少なくとも一部における分散が閾値を上回ることを前記分散値が示す場合に、前記画像の前記少なくとも一部の少なくとも一部分を特徴生成プロセスの少なくとも一部から除外するための手段と、
    を備え、
    前記分散値を関連付けるための手段は、
    前記画像の前記少なくとも一部内の画素を級に割り当てるための手段と、
    前記画素割当に基づいて、前記画像の前記少なくとも一部についての級内変動測定と、前記画像の前記少なくとも一部についての級間変動測定を決定するための手段と、
    前記分散値を決定するために、前記級内変動測定と、前記級間変動測定とを比較するための手段と、
    を備える、電子機器。
  28. 前記決定するための手段は、前記級間分散と前記級内分散とを決定するように構成された分散判別器ソフトウェアモジュール備え、前記除外するための手段はスイッチを備える、請求項27に記載の電子機器。
  29. 前記一部を除外することは、前記画像の前記少なくとも一部が前記特徴生成プロセスの前記少なくとも一部によって処理される前に、異なる値を有する前記画像の前記少なくとも一部を差し引くことを備える、請求項27に記載の電子機器。
  30. 前記分散値は、前記画像の前記一部内の前記画素値のエントロピの測定を備える、請求項27に記載の電子機器。
  31. 前記分散値は、前記画像の前記一部の周波数特性を備える、請求項27に記載の電子機器。
  32. 前記割り当てるための手段は、前記画像の前記少なくとも一部内の画素を量子化値に関連付けるための手段を備え
    前記決定するための手段は、
    同一の量子化値を有する画素の集合についての前記1次モーメントを決定するための手段と、
    少なくとも2つの集合の前記1次モーメントの間の距離を測定するための手段と、
    を備える、請求項27に記載の電子機器。
  33. 前記少なくとも2つの集合の1次モーメントの間の距離は前記分散値の前記値に反比例しうる、請求項32に記載の電子機器。
  34. 前記特徴生成プロセスは、SIFT(scale-invariant feature transform)の少なくとも一部を備える、請求項27に記載の電子機器。
  35. 前記特徴生成プロセスは、画像の尺度空間差分を計算するように構成されたモジュールを備える、請求項27に記載の電子機器。
  36. 前記電子機器は無線電話を備える、請求項27に記載の電子機器。
  37. 前記級内変動測定を決定することは、前記級の各々に対して、級内分散を決定することを備え、
    前記級内変動測定は、前記級内分散に基づく、請求項1に記載の方法。
  38. 前記級の各々について、前記級内分散は、前記級の1次モーメントに基づく、請求項37に記載の方法。
  39. 前記級内変動測定は、前記級の各々についての平均の中心位置に基づく、請求項1に記載の方法。
  40. 前記級間変動測定は、前記画像の前記少なくとも一部の基準位置に基づく、請求項1に記載の方法。
  41. 前記級間変動測定を前記決定することは、各々の級について、共通の基準位置に対する距離を算出することを備える、請求項1に記載の方法。
  42. 前記級内変動測定と前記級間変動測定とを比較することは、前記測定の比を算出することを備え、
    前記分散値は、前記算出された比に基づく、請求項1に記載の方法。
  43. 前記級内変動測定は、前記級の各々についての平均の中心位置に基づく、請求項9に記載の非一時的なコンピュータ読取可能な媒体。
  44. 前記級内変動測定は、前記級の各々から前記級の平均位置までの距離に基づく、請求項9に記載の非一時的なコンピュータ読取可能な媒体。
  45. 前記級内変動測定と前記級間変動測定とを比較することは、前記測定の比を算出することを備え、
    前記分散値は、前記算出された比に基づく、請求項9に記載の非一時的なコンピュータ読取可能な媒体。
  46. 前記級内変動測定は、前記級の各々についての平均の中心位置に基づく、請求項18に記載の電子機器。
  47. 前記級内変動測定は、前記級の各々から前記級の平均位置までの距離に基づく、請求項18に記載の電子機器。
  48. 前記級内変動測定と前記級間変動測定とを比較することは、前記測定の比を算出することを備え、
    前記分散値は、前記算出された比に基づく、請求項18に記載の電子機器。
  49. 前記級内変動測定は、前記級の各々の平均の中心位置に基づく、請求項27に記載の電子機器。
  50. 前記級内変動測定は、前記級の各々から前記級の平均位置までの距離に基づく、請求項27に記載の電子機器。
  51. 前記級内変動測定と前記級間変動測定とを比較することは、前記測定の比を算出することを備え、
    前記分散値は、前記算出された比に基づく、請求項27に記載の電子機器。
JP2013536846A 2010-10-29 2011-10-27 オブジェクト認識における特徴生成を改善するためのシステム及び方法 Expired - Fee Related JP5607261B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/915,652 2010-10-29
US12/915,652 US9501714B2 (en) 2010-10-29 2010-10-29 Systems and methods to improve feature generation in object recognition
PCT/US2011/058166 WO2012058481A1 (en) 2010-10-29 2011-10-27 Systems and methods to improve feature generation in object recognition

Publications (2)

Publication Number Publication Date
JP2013541119A JP2013541119A (ja) 2013-11-07
JP5607261B2 true JP5607261B2 (ja) 2014-10-15

Family

ID=44936551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013536846A Expired - Fee Related JP5607261B2 (ja) 2010-10-29 2011-10-27 オブジェクト認識における特徴生成を改善するためのシステム及び方法

Country Status (6)

Country Link
US (1) US9501714B2 (ja)
EP (1) EP2633476A1 (ja)
JP (1) JP5607261B2 (ja)
KR (1) KR101650994B1 (ja)
CN (1) CN103210401B (ja)
WO (1) WO2012058481A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2450667B1 (en) * 2010-11-09 2016-11-02 Harman Becker Automotive Systems GmbH Vision system and method of analyzing an image
JP5640774B2 (ja) 2011-01-28 2014-12-17 富士通株式会社 情報照合装置、情報照合方法および情報照合プログラム
US8576523B2 (en) 2011-03-14 2013-11-05 Qualcomm Incorporated Charge pump electrostatic discharge protection
US9152882B2 (en) * 2011-06-17 2015-10-06 Microsoft Technology Licensing, Llc. Location-aided recognition
WO2013016837A1 (en) * 2011-07-29 2013-02-07 Hewlett-Packard Development Company, L.P. Incremental image clustering
CN103646232B (zh) * 2013-09-30 2016-08-17 华中科技大学 飞行器地面运动目标红外图像识别装置
CN103942276A (zh) * 2014-03-31 2014-07-23 北京邮电大学 一种商标检测新技术
US9959661B2 (en) 2015-12-02 2018-05-01 Samsung Electronics Co., Ltd. Method and device for processing graphics data in graphics processing unit
CN105979252A (zh) * 2015-12-03 2016-09-28 乐视致新电子科技(天津)有限公司 一种测试方法和装置
WO2018100668A1 (en) 2016-11-30 2018-06-07 Nec Corporation Image processing device, image processing method, and image processing program
CN107688823B (zh) 2017-07-20 2018-12-04 北京三快在线科技有限公司 一种图像特征获取方法及装置,电子设备
KR102158967B1 (ko) * 2018-12-07 2020-09-24 (주)제이엘케이 영상 분석 장치, 영상 분석 방법 및 기록 매체
US10810430B2 (en) * 2018-12-27 2020-10-20 At&T Intellectual Property I, L.P. Augmented reality with markerless, context-aware object tracking
CN111598006B (zh) * 2020-05-18 2023-05-26 阿波罗智联(北京)科技有限公司 用于标注对象的方法和装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100255157B1 (ko) 1993-11-23 2000-05-01 김영환 반도체 소자의 신호입력 장치
US5581454A (en) 1994-11-22 1996-12-03 Collins; Hansel High power switched capacitor voltage conversion and regulation apparatus
DE10040092A1 (de) 2000-08-16 2002-03-07 Infineon Technologies Ag Schaltungsanordnung zur Erkennung eines Fehlerzustands
US6624992B1 (en) 2000-10-06 2003-09-23 Qualcomm, Incorporated Electro-static discharge protection circuit
US6924963B2 (en) 2002-02-14 2005-08-02 Intersil Americas Inc. ESD protection network utilizing precharge bus lines
JP2005143063A (ja) 2003-11-04 2005-06-02 Mitsuo Matsuda 映像形成方法
JP4383159B2 (ja) 2003-12-25 2009-12-16 Necエレクトロニクス株式会社 チャージポンプ回路
KR100573780B1 (ko) 2004-05-25 2006-04-25 재단법인서울대학교산학협력재단 전하펌프
US7519200B2 (en) * 2005-05-09 2009-04-14 Like.Com System and method for enabling the use of captured images through recognition
WO2007063474A2 (en) 2005-11-30 2007-06-07 Nxp B.V. Charge pump circuit and integrated circuit
JP4743617B2 (ja) 2006-04-14 2011-08-10 Kddi株式会社 特徴点抽出装置
JP2008103945A (ja) 2006-10-18 2008-05-01 Toshiba Corp 半導体装置
JP2008136262A (ja) 2006-11-27 2008-06-12 Epson Imaging Devices Corp Dc−dcコンバータ及び表示装置
JP4884251B2 (ja) 2007-02-09 2012-02-29 富士フイルム株式会社 撮影装置および方法並びにプログラム
GB0715254D0 (en) 2007-08-03 2007-09-12 Wolfson Ltd Amplifier circuit
JP4894725B2 (ja) 2007-10-29 2012-03-14 株式会社デンソー 組電池の状態監視装置
US8094947B2 (en) 2008-05-20 2012-01-10 Xerox Corporation Image visualization through content-based insets
TWI424683B (zh) 2008-12-11 2014-01-21 Ind Tech Res Inst 適用於功率放大器的靜電放電箝制電路
KR100972849B1 (ko) 2009-10-16 2010-07-28 주식회사 쓰리디누리 객체 인식 방법
US20110221398A1 (en) 2010-03-15 2011-09-15 Electronvault, Inc. Impedence Balancer
CN201682416U (zh) 2010-04-02 2010-12-22 江苏丽恒电子有限公司 电荷泵
US8576523B2 (en) 2011-03-14 2013-11-05 Qualcomm Incorporated Charge pump electrostatic discharge protection

Also Published As

Publication number Publication date
KR101650994B1 (ko) 2016-09-05
US9501714B2 (en) 2016-11-22
KR20140046394A (ko) 2014-04-18
CN103210401A (zh) 2013-07-17
WO2012058481A1 (en) 2012-05-03
US20120106847A1 (en) 2012-05-03
JP2013541119A (ja) 2013-11-07
CN103210401B (zh) 2016-08-03
EP2633476A1 (en) 2013-09-04

Similar Documents

Publication Publication Date Title
JP5607261B2 (ja) オブジェクト認識における特徴生成を改善するためのシステム及び方法
Nishiyama et al. Facial deblur inference using subspace analysis for recognition of blurred faces
Zheng et al. Fusion of block and keypoints based approaches for effective copy-move image forgery detection
Jaberi et al. Accurate and robust localization of duplicated region in copy–move image forgery
AU2017201281B2 (en) Identifying matching images
Krig et al. Image pre-processing
Ishikura et al. Saliency detection based on multiscale extrema of local perceptual color differences
KR20130142191A (ko) 비주얼 탐색을 위한 강건한 특징 매칭
US11816946B2 (en) Image based novelty detection of material samples
WO2022001137A1 (zh) 一种行人重识别方法、装置、设备及介质
CN110532413B (zh) 基于图片匹配的信息检索方法、装置、计算机设备
WO2010043954A1 (en) Method, apparatus and computer program product for providing pattern detection with unknown noise levels
CN114419349B (zh) 一种图像匹配方法和装置
Priyankara et al. Computer assisted plant identification system for Android
Zhu et al. Underwater object recognition using transformable template matching based on prior knowledge
Lecca et al. Comprehensive evaluation of image enhancement for unsupervised image description and matching
Bahrami et al. Image tampering detection by exposing blur type inconsistency
CN113963295A (zh) 视频片段中地标识别方法、装置、设备及存储介质
Mohammed et al. Proposed approach for automatic underwater object classification
CN107423739B (zh) 图像特征提取方法及装置
Khayeat et al. Improved DSIFT descriptor based copy-rotate-move forgery detection
WO2008003985A2 (en) Method of identifying linear features within an image
Oszust Optimized filtering with binary descriptor for blind image quality assessment
Wong et al. Dynamic amelioration of resolution mismatches for local feature based identity inference
CN114332498A (zh) 基于多特征提取的多尺寸图像变化检测装置及方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130628

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140611

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140729

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140827

R150 Certificate of patent or registration of utility model

Ref document number: 5607261

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees