[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6363682B2 - 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法 - Google Patents

画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法 Download PDF

Info

Publication number
JP6363682B2
JP6363682B2 JP2016233359A JP2016233359A JP6363682B2 JP 6363682 B2 JP6363682 B2 JP 6363682B2 JP 2016233359 A JP2016233359 A JP 2016233359A JP 2016233359 A JP2016233359 A JP 2016233359A JP 6363682 B2 JP6363682 B2 JP 6363682B2
Authority
JP
Japan
Prior art keywords
image
list
content
content item
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016233359A
Other languages
English (en)
Other versions
JP2017157193A (ja
Inventor
チュ ファン
チュ ファン
コン チ
コン チ
リ ドン
リ ドン
ジアン イフェイ
ジアン イフェイ
ウ シュアン
ウ シュアン
ゾウ ヨウリン
ゾウ ヨウリン
ヤン グアン
ヤン グアン
ワン ジンガオ
ワン ジンガオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of JP2017157193A publication Critical patent/JP2017157193A/ja
Application granted granted Critical
Publication of JP6363682B2 publication Critical patent/JP6363682B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施形態は大体コンテンツ検索に関する。より具体的に、本発明の実施形態はメタデータに基づいてマッチング画像を有するコンテンツをリアルタイムに捜索することに関する。
ほとんどの検索エンジンはその操作期間に一般的にクライアント装置で実行されるブラウザによってウェブ(Web)検索を実行する。検索エンジンはユーザにより入力された検索ワードを受信して、且つ検索ワードに関連するウェブページ検索結果リストを検索する。検索エンジンはある標準に基づいて検索結果を検索リストの一連のサブセットとして表示する。検索操作中に使用される一般的な標準は、検索ワードは完全に又は一部に所定のウェブページに出現するか、検索文字列が検索結果に現した回数、アルファベット順などである。なお、ユーザはマウスボタンをクリックすることでリンクの開きを決めて、これによりウェブページを開いてブラウズする。検索エンジンはユーザと検索結果のあるインタラクティブ及び/又はユーザ情報を監視及び収集することによって、それからより良い検索を提供する。
通常、コンテンツアイテムリストを認識及び検索するように、検索クエリに応答して検索を実行する。続いて、コンテンツアイテムを検索リクエスタに返送する。通常の検索エンジンはほとんどのコンテンツアイテムをそのまま返送して修正しない。検索結果におけるいくつかのコンテンツアイテムは単にプレーンテキスト又は記述であり、つまらないもの又は退屈なものであると考えられる。時々、コンテンツアイテムに当該コンテンツアイテムに関連するある画像が用意される場合に、検索結果におけるコンテンツはより表現力があるか又はより吸引力がある。ところが、適切な画像とコンテンツアイテムをマッチングするのは非常に挑戦となるものである。
一つの様態において、検索クエリに応答してコンテンツアイテムのために画像を選択するコンピュータ実施方法を提供し、この方法は、サーバにおいてクライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、前記サーバによってホストされた検索エンジンにより、コンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別するステップと、前記サーバによってホストされた画像選択モジュールにより、画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して、1つまたは複数の画像のリストを識別するステップと、前記検索エンジンにより前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成するステップと、前記検索エンジンによりコンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させるステップと、を含み、ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有する。
他の一つの様態において、指令が記憶された非一時的な機械可読媒体を提供し、前記指令はプロセッサにより実行される際に、前記プロセッサに画像とコンテンツアイテムをマッチングする操作を実行させ、前記操作は、クライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、検索エンジンによりコンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別するステップと、画像選択モジュールにより画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して、1つまたは複数の画像のリストを識別するステップと、前記検索エンジンにより前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成するステップと、前記検索エンジンによりコンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させるステップと、を含み、ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有する。
さらに、他の一つの様態において、データ処理システムを提供し、このシステムは、プロセッサと、クライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、コンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別する検索エンジンと、画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して1つまたは複数の画像のリストを識別する画像選択モジュールと、を備え、前記検索エンジンは、前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成し、コンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させて、ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有する。
本発明の実施形態は、図面の各図に例として非限定的に示され、図面における類似の符号は、類似の構成要素を示す。
本発明のいくつかの実施形態に係る画像とコンテンツアイテムをマッチングするためのシステム構成の例を示すブロック図である。 本発明のいくつかの実施形態に係る画像とコンテンツアイテムをマッチングするためのシステム構成の例を示すブロック図である。 本発明の一実施形態に係る画像とコンテンツアイテムとをマッチングするためのシステムを示すブロック図である。 本発明のある実施形態に係るクエリ−画像マッチングテーブルの例を示す。 本発明のある実施形態に係るクエリ−画像マッチングテーブルの例を示す。 本発明の一実施形態に係る画像とコンテンツアイテムとをマッチングするための過程を示すフローチャートである。 本発明の一実施形態に係る画像とコンテンツアイテムとをマッチングするためのシステムの例を示すブロック図である。 本発明の一実施形態に係るクエリ−画像マッピングルールを生成するための処理フローである。 本発明のある実施形態に係るマッピングデータ構造の例を示す図である。 本発明のある実施形態に係るマッピングデータ構造の例を示す図である。 本発明の一実施形態に係るクエリ−画像マッピングルールを生成するための過程を示すフローチャートである。 本発明の別の実施形態に係るクエリ−画像マッチングシステムの例を示すブロック図である。 本発明の一実施形態に係る検索クエリに応答して画像とコンテンツアイテムとをマッチングする過程を示す処理フローチャートである。 本発明の一実施形態に係る検索クエリに応答して画像をランキングする過程の例を示す図である。 本発明の一実施形態に係るキーワードに基づいて画像とコンテンツアイテムとをマッチングする過程を示すフローチャートである。 本発明の別の実施形態に係るクエリ−画像マッチングシステムの例を示すブロック図である。 本発明の一実施形態に係るマッチングスコアを確定するためのスコアリング行列の例を示すブロック図である。 本発明の別の実施形態に係る画像とコンテンツアイテムとをマッチングするための過程を示すフローチャートである。 一実施形態に係るデータ処理システムを示すブロック図である。
以下、説明の詳細を参照しながら、本発明の様々な実施形態および態様を説明し、図面は、様々な実施形態を示す。以下の説明および図面は、本発明を説明するためのものであり、本発明を限定するものではない。本発明の様々な実施形態を完全に把握するために、多数の特定の詳細を説明する。なお、いくつかの例では、本発明の実施形態に対する簡単な説明を提供するために、周知または従来技術の詳細について説明していない。
本明細書では「1つの実施形態」または「実施形態」とは、当該実施形態について組み合わせて説明した特定特徴、構造または特性が、本発明の少なくとも1つの実施形態に含まれる。語句「1つの実施形態では」は、本明細書全体において同一実施形態を指すとは限らない。
ある実施形態によれば、効果的なメカニズムを提供してコンテンツアイテムと画像とをマッチングするように、1組のクエリ−画像(クエリ/画像)マッチングルール(キーワード/画像ルールとも呼ばれる)は、1組の所定のキーワードにおける各キーワードを1つまたは複数の画像を識別するための1つまたは複数の画像識別子(ID)にマッピングするように構成される。この組の所定のキーワードは、検索クエリにおいて使用される可能性がより高いキーワードに識別されてもよい。ユーザの検索活動または検索歴史への解析または追跡に基づいてこのようなキーワードを識別することができ、一定の時間においてこのようなキーワードをコンパイルすることができる。
次に、クライアント装置からコンテンツを検索するための検索クエリを受信した場合、コンテンツデータベースにおいてまたはコンテンツサーバを経由して検索を実行してコンテンツアイテムリストを検索する。また、クエリを解析して、前記クエリに関連付けられた1つまたは複数のキーワードを確定する。確定されたキーワードは検索クエリに含まれるキーワードであってもよい。確定されたキーワードは意味的に類似するまたは検索クエリにおける最初のキーワードの意味と同じ意味を有するあるキーワード(例えば、同義語または同義語句)をさらに含んでもよい。キーワードに基づき、1組のクエリ/画像マッチングルールで1つまたは複数の画像のリストを識別する。次に、識別された画像と前記コンテンツアイテムの少なくとも一部を合併する。例えば、画像をコンテンツアイテムの背景画像または補足画像として使用することができる。次に、画像と集積するコンテンツアイテムを検索結果の一部としてクライアント装置に返送する。従って、検索結果はより魅力的になるまたは退屈でない。
本発明の一態様によれば、この組のクエリ/画像マッチングルールをコンパイルするために、最初、初期クエリ/画像マッチングルールを示す第1のクエリ/画像マッチングテーブル(一次クエリ/画像マッチングテーブルとも呼ばれる)を構成する。前記第1のクエリ/画像マッチングテーブルは複数のマッチングエントリーを含む。各マッチングエントリーはキーワードを1つまたは複数の画像を識別するための1つまたは複数の画像IDにマッピングし、ここで、画像は事前に収集され、例えば事前に画像収集システム(例えば、画像ウェブクローラ)を用いて前記画像を収集する。次に、第1のクエリ/画像テーブルにおける各マッチングエントリーのキーワードに対して第1の解析を実行して、前記マッチングエントリーの前記キーワードに関連するまたは意味的に類似した1つまたは複数の追加キーワード(拡張キーワードとも呼ばれる)を識別する。
各追加キーワードに対して、追加のマッチングエントリー(拡張マッチングエントリーとも呼ばれる)を作成して前記追加キーワードを対応する元のキーワードの同じ組の1つまたは複数の画像にマッピングし、それにより第2のクエリ/画像マッチングテーブル(拡張クエリ/画像マッチングテーブルとも呼ばれる)を生成する。第2のクエリ/画像テーブルに追加される各追加または拡張マッチングエントリーに対して、第2の解析を実行して、画像および/またはキーワードに関連付けられたメタデータに基づいて対応するキーワードにより十分に説明された画像ではない任意の画像、または対応するキーワードが画像に関連しない任意の画像をフィルタリングしたり識別したりする。次に、追加のマッチングエントリーから識別された1つまたは複数の画像を取り除いて第3のクエリ/画像マッチングテーブル(最終のクエリマッチングテーブルとも呼ばれる)を生成する。フィルタリング過程の後にキーワードに関連付けられた画像がない場合、前記特定の追加または拡張エントリーを取り除くことができる。次に、実行時間に第3のクエリ/画像マッチングテーブルを用いて、検索クエリに関連付けられた1つまたは複数のキーワードに基づいて画像および検索クエリに応答して発見されたコンテンツアイテムをマッチングし、合併する。
本発明の別の態様によれば、クライアント装置から受信した、コンテンツを検索するための検索クエリに応答して、前記検索クエリを解析して1つまたは複数の第1のキーワードを確定する。画像−キーワード(画像/キーワード)マッピングテーブルまたはデータ構造において第1のキーワードに基づいて検索またはサーチ操作を実行する。クエリ/画像マッチングテーブルは複数のエントリーを含み、且つ各エントリーは画像を識別するための画像IDを1つまたは複数の第2のキーワードにマッピングする。画像/キーワードマッピングテーブルにおいて識別されたそれぞれの画像に対して、ランキング過程を実行して第1のキーワードと第2のキーワードとの間のマッチング度を確定する。次に、マッチング度に基づいて画像/キーワードマッピングテーブルにおいて識別された画像をランキングしたり分類したりする。各マッチング度に事前に重み付け係数を割り当てることができる。従って、第1のキーワードと第2のキーワードとのマッチング度は所定のカテゴリー内にあり、対応する1つの重み付け係数を割り当てる。分類またはランキングの目的のため、最後にマッチング度を示すマッチングスコアを計算することができる。所定の閾値よりも高いマッチング度を有する、分類またはランキングされた画像を候補画像として使用することができ、これによりコンテンツデータベースまたはコンテンツサーバから検索されたコンテンツアイテムを割り当てるおよび/または当該コンテンツアイテムと集積する。
本発明の別の態様によれば、1つまたは複数の検索語を有する検索クエリに応答し、コンテンツデータベースまたはコンテンツサーバにおいて第1の検索を実施して、前記1つまたは複数の検索語に関連する第1のコンテンツアイテムのリストを識別し、検索する。画像メモリまたは画像サーバにおいて第2の検索を実行して、前記検索語に関連する1つまたは複数の画像のリストを識別し、検索する。第2の検索によって識別された各画像に対して、コンテンツアイテムのコンテキストおよび画像に関連付けられたメタデータに基づいて、画像と各第1のコンテンツアイテムとの間のマッチングスコアを計算する。各第1のコンテンツアイテムに対して、画像と対応するコンテンツアイテムとの間のマッチングスコアに基づいて画像をランキングする。次に、ランキングされる画像のリストから画像のいずれかを選択して前記コンテンツアイテムに関連付ける。選択された画像および関連付けられたコンテンツアイテムを合併する(例えば、背景画像とする)。従って、第1のコンテンツアイテムの少なくとも一部と合併する画像の少なくとも一部を有する第2のコンテンツアイテムのリストを生成し、且つ前記第2のコンテンツアイテムのリストはクライアント装置に返送される。
図1Aおよび図1Bは、本発明のいくつかの実施形態に係る画像とコンテンツアイテムとをマッチングするためのシステム構成の例を示すブロック図である。図1Aを参照し、システム100は、ネットワーク103を介してサーバ104に通信可能に接続される1つまたは複数のクライアント装置101〜102を含むが、それらに限定されない。クライアント装置101〜102は、任意のタイプのクライアント装置、例えば、パーソナルコンピュータ(例えば、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ)、「薄型」クライアント、パーソナルデジタルアシスタント(PDA)、インターネット対応機器、スマート腕時計や携帯電話(例えば、スマートフォン)等であってもよい。あるいは、バックエンドサーバまたはアプリケーションサーバとしてのサーバ104に対して、クライアント装置101−102は、フォアグラウンドシステムまたはフォアグラウンドサーバであってもよい。ネットワーク103は、任意のタイプの有線や無線ネットワーク、例えばローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)(例えば、インターネット)またはそれらの組合せであってもよい。
サーバ104は、任意のタイプのサーバまたはサーバクラスター、例えばネットワークまたはクラウドサーバ、アプリケーションサーバ、バックエンドサーバまたはそれらの組合せであってもよい。一実施形態では、サーバ104は、検索エンジン120、画像選択モジュール110、およびクエリ/画像マッチングルール115を含むが、それらに限定されない。サーバ104はクライアント(例えば、クライアント装置101〜102)がサーバ104で提供されたリソースまたはサービスにアクセスすることを可能にするインターフェース(図示せず)をさらに含む。インターフェースは、ネットワークインターフェース、アプリケーション・プログラミング・インターフェース(API)および/またはコマンドラインインターフェース(CLI)を含んでもよい。
例えば、クライアント(当該例ではクライアント装置101のユーザアプリケーション(例えば、ネットワークブラウザ、モバイルアプリケーション、またはフォアグラウンドサーバ/フォアグラウンドシステムの検索機能ソフトウェア))はサーバ104に検索クエリを送信し、検索エンジン120はネットワーク103により、インターフェースを経由して検索クエリを受信する。検索クエリに応答して、検索エンジン120は、検索クエリから1つまたは複数のキーワード(検索語とも呼ばれる)を抽出する。検索エンジン120は、主要コンテンツデータベース130および/または補助コンテンツデータベース131を含んでもよいコンテンツデータベース133において検索を実行してキーワードに関連するコンテンツアイテムリストを識別する。主要コンテンツデータベース130(マスターコンテンツデータベースとも呼ばれる)は、一般的なコンテンツデータベースであってもよく、補助コンテンツデータベース131(二次または付属コンテンツデータベースとも呼ばれる)は、特殊のコンテンツデータベースであってもよい。検索エンジン120は、リストの少なくとも一部のコンテンツアイテムを有する検索結果ページをクライアント装置101に返送して表示する。検索エンジン120は、百度会社(Baidu Inc)から取得されるBaidu(登録商標)検索エンジンであってもよく、Google(登録商標)検索エンジン、Microsoft BingTM検索エンジン、Yahoo(登録商標)検索エンジン、またはほかの検索エンジンであってもよい。
検索エンジン、例えばウェブページ検索エンジンは、ワールドワイドウェブ上で情報を検索するソフトウェアシステムとして設計される。検索結果は、通常、一連の結果に表示され、この一連の結果は、通常、検索エンジン結果ページと呼ばれる。情報は、ウェブページ、画像、およびほかのタイプのファイルの組合せであってもよい。いくつかの検索エンジンは、さらにデータベースまたはオープンディレクトリ中の利用可能なデータをマイニングする。ヒューマンエディタのみにより維持されるウェブディレクトリと異なり、検索エンジンは、さらにウェブクローラ(web crawler)においてアルゴリズムを実行することにより、リアルタイム情報を維持する。
ウェブページ検索エンジンは、ページのハイパーテキストマークアップ言語(HTML)マークアップから検索される多数のウェブページに関連する情報を記憶することにより動作される。これらのページは、ウェブサイト上の各リンクに従う自動ウェブクローラであるウェブクローラにより検索される。次に、検索エンジンは、各ページのコンテンツを解析して如何にインデックスされるかを決定する(例えば、タイトル、ページコンテンツ、ヘッダーまたはメタタグと呼ばれる特殊フィールドによりワードを抽出する)。ウェブページに関連するデータをインデックスデータベースに記憶し、後続のクエリに使用する。インデックスは、クエリに関連する情報をできるだけ速めに見つけることに役立つ。
ユーザが検索エンジンに(一般的に、キーワードを使用することにより)クエリを入力する場合、前記エンジンは、クエリのインデックスを検査し、通常ドキュメントタイトルを含み且つ必要に応じて一部のテキストを含む短い概要を有する基準にしたがってベストマッチングのウェブページのリストを提供する。インデックスは、データとともに記憶された情報、および情報のインデックス方法からなる。検索エンジンは、入力時に完全に一致する語(ワード)または語句(フレーズ)をサーチする。いくつかの検索エンジンは、近接検索と呼ばれる高度な特徴を提供し、ユーザがキーワード間の距離を定義することを可能にする。概念に基づく検索もあり、その中でも前記検索は検索された語または語句を含むページ上で統計解析を使用する。また、自然言語クエリは、ユーザが人間に質問するような形と同様に問題を入力することを可能にする。
検索エンジンの有用性は、返送された結果セットの関連性により決められる。特定の語または語句を含むウェブページが数百万も存在する可能性があるが、その一部のページは、他のページに比べるとさらに関連性が高く、人気があり、または信頼性が高い可能性がある。ほとんどの検索エンジンは、複数種の方法を用いて結果をランキングすることにより、「ベスト」結果を優先的に提供する。検索エンジンが如何にどのページをベストマッチングのページに決定するか、およびどんな順序で結果を表示するかについて、エンジンにより大きく異なている。
図1Aに戻って参照して、一実施形態によれば、サーバ104でクライアント装置(当該例では、クライアント装置101)から受信された検索クエリに応答して、検索エンジン120は、コンテンツデータベース133(例えば、主要コンテンツデータベース130、および/または補助コンテンツデータベース131)において検索を実行し、コンテンツアイテムリスト(第1のコンテンツアイテムと呼ばれる)を生成する。ユニフォームリソースリンク(URL)および/またはユニフォームリソースアイデンティファイア(URI)を経由してコンテンツアイテムのそれぞれと特定のコンテンツプロバイダの特定ウェブサイトの特定ウェブページを関連付ける。一実施形態では、主要コンテンツデータベース130はウェブクローラにより収集された一般的なコンテンツアイテム(例えば、非スポンサー付きコンテンツ)を記憶する。補助コンテンツデータベース131は、特定、既知または所定のコンテンツプロバイダに関連付けられた特定、または特殊のコンテンツアイテム(例えば、スポンサー付きコンテンツ)を記憶する。あるいは、主要コンテンツデータベース131と補助コンテンツデータベース132を区別せずに、コンテンツデータベース133を単一データベースとしてもよい。
ウェブクローラ(Network crawlerまたはWeb Crawler)は、ネットワークのハイパーテキスト構造を自動的にトラバースするプログラムである。実際に、ネットワーククローラは、URLからドキュメントをダウンロードする1つもしくは複数の過程またはスレッドを実行するようにそれぞれ構成された個別のコンピュータあるいはサーバで実行できる。ネットワーククローラは、割り当てられたURLを受信し、それらのURLでドキュメントをダウンロードする。ネットワーククローラは、さらに検索されたドキュメントに引用されるドキュメントを検索して、コンテンツ処理システム(図示せず)および/または検索エンジン120に処理させるようにしてもよい。ネットワーククローラは、例えばハイパーテキスト転送プロトコル(HTTP)やファイル転送プロトコル(FTP)のような様々なプロトコルを使用して、URLに関連付けられたページをダウンロードすることができる。
また、一実施形態によれば、画像選択モジュール110は、クエリ/画像マッチングルール115において検索クエリに関連付けられたキーワードに基づいて検索して、画像または前記キーワードに関連する画像を識別するための画像IDのリストを識別する。クエリ/画像マッチングルール115は、様々なデータ構造(例えば、テーブルまたはデータベース)で実施されることができる。画像IDに基づき、画像メモリ125に記憶された画像122から候補画像のリストを識別し、検索することができ、その中で、画像メモリ125は、画像122を記述する画像のメタデータ124を記憶してもよい。上記したように、ネットワークをクロールして画像およびその周辺のメタデータを収集するように設計される1つまたは複数の画像クローラにより、画像122およびその対応するメタデータ124を取得することができる。画像122は、保護されていない、版権がない、適切に許可されている画像であってもよく、または任意のそのほかの授権されている画像であってもよい。キーワードと候補画像との間の関連性スコアまたはマッチング度に基づいて候補画像をランキングすることができ、前記関連性スコアまたはマッチング度は、画像のメタデータ124に基づいて確定されてもよい。コンテンツデータベース133において発見された各コンテンツアイテムに対して、候補画像のリストから1つの画像を選択して前記コンテンツアイテムに関連付ける。選択された画像は、合併済みのコンテンツアイテムを生成するように、前記コンテンツアイテムと合併してもよい。例えば、選択された画像は、前記コンテンツアイテムの背景画像または補足画像として機能することができる。合併済みのコンテンツアイテムおよび画像のリストは、検索結果の一部としてクライアント装置101に返送される。
一実施形態によれば、検索クエリを受信する前にクエリ/画像マッチングルール115(例えば、オフライン)を事前にコンパイルおよび生成することができる。1組のクエリ/画像マッチングルール115は、1組の所定のキーワードのそれぞれを1つまたは複数の画像を識別するための1つまたは複数の画像IDにマッピングするように構成される。この組の所定のキーワードは、検索クエリにおいて使用される可能性がより高いキーワードとして識別されてもよい。ユーザの検索活動または検索歴史への解析または追跡に基づいてこのようなキーワードを識別することができ、一定の時間でこのようなキーワードをコンパイルすることができる。
次に、コンテンツを検索するために検索クエリがクライアント装置から検索エンジン120により受信された場合、コンテンツデータベース133において検索を実行してコンテンツアイテムリストを検索する。また、例えば画像選択モジュール110によりクエリを解析して、前記クエリに関連付けられた1つまたは複数のキーワードを確定する。確定されたキーワードは、検索クエリに含まれるキーワードであってもよい。確定されたキーワードは、意味的に類似するまたは検索クエリにおける最初のキーワードの意味と同じ意味を有するあるキーワード(例えば、同義語または同義語句)をさらに含んでもよい。キーワードに基づいて、1組のクエリ/画像マッチングルール115で画像メモリ125からの1つまたは複数の画像のリストを識別する。次に、識別された画像と前記コンテンツアイテムの少なくとも一部を合併する。例えば、画像をコンテンツアイテムの背景画像として使用することができる。次に、画像と集積するコンテンツアイテムを検索結果の一部としてクライアント装置に返送する。従って、検索結果はより魅力的になるまたは退屈でない。
なお、例示の目的のために、サーバ104の構成のみを説明する。そのほかのアーキテクチャまたは構成も適用可能である。例えば、図1Bに示されるように、コンテンツデータベース133は、ネットワークを介してコンテンツサーバである個別のサーバにおいて維持され、ホストされるようにしてもよい。同様に、画像メモリ125は、画像サーバである個別のサーバにおいて維持され、ホストされるようにしてもよい。サーバ133および125は、ネットワークサーバ、アプリケーションサーバまたはバックエンドサーバであってもよい。サーバ104と同様なエンティティまたは組織により、コンテンツサーバ133および/または画像サーバ125を組織して提供するようにしてもよい。あるいは、コンテンツデータベース130〜131におけるコンテンツと画像122、およびその両者のメタデータ124を収集するための個別のエンティティまたは組織(例えば、第三者のプロバイダ)により、コンテンツサーバ133および/または画像サーバ125を維持したり、ホストしたりするようにしてもよい。また、画像選択モジュール110を個別のシステムとして実施してもよく、例えばAPIまたはネットワークを経由してサーバ104に通信可能に接続される画像選択システムまたはサーバとして実施される。
図2は、本発明の一実施形態に係る画像とコンテンツアイテムとをマッチングするためのシステムを示すブロック図である。システム200は、図1A〜図1Bのシステム100の一部として実施されてもよい。図2を参照し、クライアント装置(例えば、図1のクライアント装置101)から検索クエリ201を受信した場合、検索エンジン120はコンテンツデータベースまたはコンテンツサーバ133において第1の検索を実行して、検索クエリ201に関連付けられた1つまたは複数のキーワードまたは検索語に基づいてコンテンツアイテムの第1のリスト(例えば、第1のコンテンツアイテム)を識別し、検索する。また、1組のクエリ/画像マッチングルール115で検索クエリ201に関連付けられたキーワードに基づいて画像メモリまたは画像サーバ125から画像のリストを識別するように、検索エンジン120は画像選択モジュール110と通信する。検索エンジン120および/または画像選択モジュール110は、クエリを解析して、検索クエリ201に含まれるキーワードおよび/または検索クエリ201のキーワードと類似するキーワード(例えば、意味的に類似した語、同義語)のリストを導出する。拡張キーワードのリストに対して、コンテンツデータベース/サーバ133および/または画像メモリ/サーバ125において実行された検索を実行することができる。
一実施形態では、画像選択モジュール110および/またはクエリ/画像マッチングルール115が検索エンジン120と集積してもよい。例えば、クエリ/画像マッピングシステム220によってクエリ/画像マッチングルール115を予め構成したりコンパイルしたりしてもよい。クエリ/画像マッピングシステム220はAPIまたはネットワークを経由してシステム200に通信可能に接続される個別のサーバにホストされてもよい。クエリ/画像マッピングシステム220は、ユーザまたは管理者が、処理ロジックにより所定のアルゴリズムを使用して拡張され、ランキングされる1組のクエリ/画像マッチングルールを構成することを可能にするユーザインターフェースを含んでもよい。以下、クエリ/画像マッピングシステム220のさらなる詳細を、さらに説明する。
同様に、画像収集システム230は、画像メモリ/サーバ125に記憶された画像を収集してもよく、前記画像収集システム230は、ネットワークを介してシステム200に通信可能に接続される個別のサーバであってもよい。システム200と同様なまたは異なるエンティティまたは組織によりクエリ/画像マッピングシステム220および/または画像収集システム230を実行することができる。当該例では、画像をシステム200に対してローカル(例えば、サーバ104に対してローカルである)である画像メモリにキャッシュして記憶することができる。あるいは、画像収集システム230に関連付けられた所定のサーバにより画像を保存し、画像選択モジュール110は、アプリケーション・プログラミング・インターフェース(API)を経由して前記指定されたサーバと通信して画像のリストを識別して検索する。
画像メモリ/サーバ125から検索された画像のリストに基づき、画像選択モジュール110は、ランキングアルゴリズムに従って画像をランキングする。次に、いくつかの画像とコンテンツデータベース/サーバ133から識別して検索したいくつかのコンテンツアイテムとをマッチングする。続いて、マッチングしたコンテンツアイテムと画像を集積済みのコンテンツアイテムに集積する。一実施形態では、画像をコンテンツアイテムの背景画像または補足画像として選択することができる。例えば、コンテンツアイテム211は記述またはテキストであってもよく、画像212はコンテンツアイテム211の背景画像として選択される。適切な方式を用いて、本明細書全体に説明されるマッチング技術に基づき、画像212を選択してコンテンツアイテム211を補足または記述し、またはコンテンツアイテム211を用いて画像212を補足または記述する。例えば、コンテンツアイテム211のコンテンツが画像212に示されるコンテンツに関連付けられ、逆も同様である。集積済みの画像212とコンテンツアイテム211を検索結果215の一部としてクライアント装置に返送することができる。
なお、コンテンツデータベース/サーバ133は、主要コンテンツデータベース130と補助コンテンツデータベース131を含んでもよい。主要コンテンツデータベース130は個別のコンテンツサーバ(主要コンテンツサーバと呼ばれる)に実施または維持されてもよい。同様に、補助コンテンツデータベース131は個別のコンテンツサーバ(補助コンテンツサーバと呼ばれる)に実施または維持されてもよい。以下にさらに詳細に説明される様々なマッチング式を使用して2つのコンテンツデータベース130〜131から取得したコンテンツアイテムと画像メモリ/サーバ125から取得した画像とをマッチングすることができる。あるいは、主要コンテンツデータベース130および補助コンテンツデータベース131の一方のみから取得したコンテンツアイテムと、画像メモリ/サーバ125から取得した画像とをマッチングしてもよい。例えば、補助コンテンツデータベース131から取得したコンテンツアイテム(例えば、スポンサー付きコンテンツ)と画像メモリ/サーバ125から取得した画像とをマッチングしてもよく、主要コンテンツデータベース130から取得したコンテンツアイテム(例えば、一般的なコンテンツ)は、変更せずに検索結果215の一部としてクライアント装置に返送される。
一実施形態によれば、クライアント装置から受信した検索クエリ201に応答し、検索クエリ201に基づいて1つまたは複数のキーワードを確定し、前記キーワードは、検索クエリ201におけるキーワードまたは検索クエリ201への解析に基づいて拡張したキーワードを含んでもよい。前記キーワードに基づいて、クエリ/画像マッチングルール115においてサーチ操作または検索を実行し、前記クエリ/画像マッチングルール115は、様々なデータ構造(例えば、データベースまたはテーブル)で実施されてもよい。例示の目的のため、クエリ/画像マッチングルール115をクエリ/画像マッチングテーブルと呼ばれる。
クエリ/画像マッチングテーブル115は、多数のマッチングエントリーを含む。各マッチングエントリーは、1つまたは複数のキーワードを、画像メモリ/サーバ125に記憶された1つまたは複数の画像を識別するための1つまたは複数の画像IDにマッピングする。検索クエリ201に基づいて取得したキーワードに基づき、クエリ/画像マッチングテーブル115から1つまたは複数の画像IDのリストを取得することができる。前記画像IDに基づいて、対応する画像が画像メモリ/サーバ125から候補画像として取得される。次に、以下にさらに詳細に説明される1つまたは複数の所定のランキングおよび/またはマッチングアルゴリズムを使用し、候補画像をランキングし、マッチングする。続いて、最上位にランキングされる画像を選択してコンテンツアイテムに関連付けて検索結果215の一部として集積する。なお、図2に示されるコンポーネントまたはモジュールの一部または全部はソフトウェア、ハードウェアまたはそれらの組合せにより実施されてもよい。
図3A〜図3Bは、本発明の特定の実施形態に係るクエリ−画像マッチングテーブルの例である。図3Aを参照し、クエリ/画像マッチングテーブル300は上記した図1A〜図1Bおよび図2のクエリ/画像マッチングルール115を表してもよい。一実施形態では、クエリ/画像マッチングテーブル300は、多数のマッチングエントリーを含む。各マッチングエントリーは、1つまたは複数のキーワード301を、画像メモリまたは画像サーバ(例えば、画像メモリ/サーバ125)における対応する画像を識別するための1つまたは複数の画像ID302にマッピングする。キーワードに基づき、マッチングテーブル300をインデキシングする。当該例では、第1のエントリーは、語「花」を画像1〜5にマッピングする。第2のエントリーは、語「北京の花」を画像1のみにマッピングする。第3のエントリーは、語「上海の花」を画像2にマッピングする。第4のエントリーは、語「花の配達」を画像1〜2および4にマッピングする。従って、検索クエリが「北京の花」を含む場合に、画像1〜5を識別する。そのうち、画像1のランキング順位がより高くなってもよい。
図3Bを参照し、マッチングテーブルの代替実施形態の例を示し、このマッチングテーブルは、クエリ/画像マッチングルール115の一部として機能する画像−キーワード(画像/キーワード)マッチングテーブルであってもよい。当該例では、画像/キーワードマッチングテーブル350は、多数のマッチングエントリーを含む。各マッチングエントリーは、画像ID351を1つまたは複数のキーワード352にマッピングする。画像IDに基づきマッチングテーブル350をインデキシングする。2つのテーブル300および350を交換可能に使用してもよい。例えば、テーブル300が1つまたは複数のキーワードに関連するすべての画像を識別することに用いられてもよい。テーブル300を経由して識別された各画像に対して、キーワード352と検索クエリにおけるキーワードとの間のマッチング度を確定して、画像ID351により識別された画像をランキングする。例えば、検索クエリマッチングキーワード352におけるキーワードの数に基づいてランキングスコアを計算する。検索クエリにおけるキーワードがフィールド352におけるキーワードに正確にマッチングした場合、フィールド351において識別された対応する画像は最も高いマッチング度またはマッチングスコアを有する。検索クエリとフィールド352との間のマッチングキーワードが少ないほど、その結果、マッチング度またはマッチングスコアが低くなる。意味的にマッチングするキーワード(例えば、実際にマッチングしないが、同義語または同じまたは類似の意味を有する語)は、最も低いマッチング度またはマッチングスコアを有する。
図4は、本発明の一実施形態に係る画像とコンテンツアイテムとをマッチングするための過程を示すフローチャートである。処理ロジックにより過程400を実行することができ、前記処理ロジックは、ソフトウェア、ハードウェアまたはそれらの組合せを含んでもよい。例えば、図1A〜図1Bのサーバ104または図2のシステム200により過程400を実行することができる。図4を参照し、ブロック401において、処理ロジックはクライアント装置からコンテンツを検索するための検索クエリを受信する。検索クエリは、1つまたは複数のキーワードまたは検索語を含む。検索クエリに応答し、ブロック402において、処理ロジックはコンテンツデータベースにおいてまたはコンテンツサーバを経由して検索して、キーワードに基づいて1つまたは複数のコンテンツアイテムのリストを識別する。ブロック403において、処理ロジックは画像メモリにおいてまたは画像サーバを経由して検索して、キーワードに基づいて1つまたは複数の画像のリストを識別する。ブロック404において、処理ロジックは、選択的にランキング式に基づいて前記コンテンツアイテムの少なくとも一部と前記画像の少なくとも一部とをマッチングする。ブロック405において、処理ロジックは、検索結果を生成するように、前記コンテンツアイテムの少なくとも一部とマッチング画像を集積する(例えば、背景画像とする)。ブロック406において、検索結果をクライアント装置に送信する。
図5は、本発明の一実施形態に係る画像とコンテンツアイテムとをマッチングするためのシステムを示す例のブロック図である。システム500は図2のシステム200の一部として実施されてもよい。図5を参照し、システム500は、クエリ/画像マッピングシステム220、画像メモリ501、およびクエリ/画像マッチングルール502(キーワード/画像マッチングルールとも呼ばれる)を含むが、それらに限定されない。一実施形態では、クエリ/画像マッピングシステム200を用いて1組のクエリ/画像マッチングルール502を構成および生成して特定のキーワードを画像メモリ501に記憶された画像にマッピングする。
画像メモリ501は、ネットワークを介してローカルまたは遠隔の方式で指定されたサーバに維持されてもよい。画像メモリ501は、図1A〜図1Bの画像メモリ/サーバ125を示すことができる。クエリ/画像マッチングルールにおいてマッピングするためのキーワードは、検索クエリにおいて使用される可能性がより高いキーワードであってもよい。画像メモリ501は、画像511およびその対応するメタデータ512を記憶する。クエリ/画像マッチングルール502は、一次マッピングルール521、選択可能な拡張マッピングルール522、および最終のマッピングルール523を含む。上記したようなマッピングまたはマッチングテーブルの形でこれらのルール521〜523を実施することができる。最終のマッピングルール523は、図1A〜図1Bのクエリ/画像マッチングルール115の一部として使用されてもよい。
一実施形態では、クエリ/画像マッピングシステム220は、マッチングルール構成モジュール531、データ収集モジュール532、解析モジュール533、フィルタリングとマッチングモジュール534、および1組のフィルタリング/ランキングルール535を含む。モジュール531〜534は、ソフトウェア、ハードウェアまたはそれらの組合せで実施されてもよい。一実施形態では、構成モジュール531を用いて例えばユーザインターフェースを経由するユーザの要求に応答して一次マッピングルール521を構成することができる。一次マッピングルール521(当該例では一次マッピングテーブル521である)は、多数のマッピングエントリーを含む。各マッピングエントリーは、キーワードを、画像メモリ501に記憶された画像511の1つまたは複数を識別するための1つまたは複数の画像IDにマッピングする。データ収集モジュール532は、画像511とメタデータ512を周期的に収集して更新することができる。データ収集モジュール532は、いくつかのウェブクローラを用いて画像およびその周辺の情報またはメタデータ512をクローリングし、収集することができる。
一実施形態では、ユーザまたは管理者は、構成インターフェース(例えば、ネットワークインターフェース)を経由して一次マッピングテーブル521を構成することができる。一次マッピングテーブル521に基づいて、解析モジュール533はキーワードと画像との間の一次マッピングを解析して、1つまたは複数の追加または拡張マッピングエントリーを作成する。拡張マッピングルールまたは拡張マッピングテーブル522を生成して拡張マッピングエントリーを含ませる。拡張マッチングテーブル522に基づき、フィルタリング/マッチングモジュール534は、1組のフィルタリングおよびランキングルール535に基づいて追加または拡張エントリーに対してフィルタリング操作を実行して、マッピングを検証して対応するキーワードに関連しないいかなる画像を取り除く。次に、図1A〜図1Bのクエリ/画像マッチングルール115の一部として使用することが可能な最終のマッピングルールまたは最終のマッピングテーブル523を生成する。
図6は、本発明の一実施形態に係るクエリ−画像マッピングルールを生成するための処理フローである。図6を参照し、マッチングルール構成モジュール531を経由して一次マッピングルール521を生成する。例えば、ユーザまたは管理者は、システム600にログオンしてマッチングルール構成モジュール531に関連付けられたグラフィカルユーザインターフェース(GUI)を経由して構成することができる。ユーザは、対応する画像IDを使用する1つまたは複数の画像にマッピングされる特定のキーワードを指定することができる。例えば、図7Aにおいて、マッピングテーブル700の形式で一次マッピングルール521の例を示す。
図7Aを参照し、マッピングテーブル700は、多数のマッピングエントリー(マッチングエントリーとも呼ばれる)を含む。各エントリーは、キーワード(例えば、単一キーワード)701を、画像メモリ(例えば図5の画像メモリ501)に記憶された1つまたは複数の画像を識別するための1つまたは複数の画像ID702にマッピングする。当該例では、エントリーは語「花」を画像1−5にマッピングする。従って、検索クエリが語「花」を含む場合、画像1−5を単語「花」に関連すると思われる候補画像として識別することができる。
図6を戻って参照し、一次マッピングルール521、解析モジュール533に基づき、1組の解析ルール601(例えば意味類似性ルール601)を用いて一次マッピングルール521のエントリーに含まれるキーワードを解析する。このような解析は潜在的意味解析を含んでもよい。一次マッピングルール521のキーワードの少なくとも一部に対して、前記解析に基づいて前記キーワードに関連する1つまたは複数の追加キーワード(本明細書において拡張キーワード602と呼ばれる)を識別する。拡張キーワード602は、一次マッピングルール521における元のキーワードと同じまたは類似の意味を有するキーワード(例えば、意味的に類似する語または同義語)であってもよい。
自然言語処理、特に分布意味論において、潜在的意味解析(latent semantic analysis、LSA)は、1組のドキュメントおよびそれに含まれる語に関連する1組の概念を生成することにより、当該ドキュメントと当該単語との間の関係を解析する技術である。LSAは、意味の近い語が類似するテキスト断片に出現すると仮定する。各段落の文字数を含む行列(行はユニークワード、列は各段落を表す)は、長いテキストから構成され、且つ特異値分解(SVD)と呼ばれる数学的手法により列間の類似性構造を維持しながら行数を減少させる。続いて、任意の2行により形成された2つのベクトル間の角度の余弦関数(または2つの正規化ベクトル間のドット積)を使用して単語を比較する。1に近い値は、類似度が非常に高い単語を表し、0に近い値は、類似度が非常に低い単語を表す。
各拡張キーワード602に対して、追加エントリーを作成して前記拡張キーワードを対応する元のキーワードの同じ画像IDにマッピングする。従って、一次マッピングルール521から拡張マッピングルール522を作成することができる。図7Bは、図7Aの一次マッピングテーブル700により拡張された拡張マッピングテーブル750の例を示す。図7A〜図7Bを参照し、エントリー721は、一次マッピングテーブル700の元のエントリーを表す。エントリー721のキーワード「花」を解析した後に、追加キーワード「北京の花」、「上海の花」、および「花の配達」を元の語「花」に意味的に関連するように識別する。従って、一次マッピングテーブル700から追加または拡張エントリー722〜724を作成して拡張マッピングテーブル750を形成することができる。拡張エントリー722〜724のそれぞれは、元のエントリー721と同じ画像IDにマッピングされる。当該例では、すべてのエントリー721〜724は画像1〜5にマッピングされる。拡張マッピングテーブル750は図6の拡張マッピングルール522を表す。
図6を戻って参照し、拡張マッピングルール522に基づき、フィルタリング/マッチングモジュール534は、1組のフィルタリングルールまたは式535を使用してマッチング画像に関連付けられたメタデータ512(例えば、画像1〜5のメタデータ)に従って拡張エントリー(例えば、図7Bのエントリー722〜724)に対してフィルタリング操作を実行する。フィルタリング操作は、拡張エントリーを検証して拡張エントリーのマッチング品質を確保することを目的とする。一実施形態では、フィルタリング操作は、元のキーワードにマッピングされるけれど実はまたは実際に拡張キーワードに関連しない任意の画像を取り除く。従って、最終のマッピングルール523、例えば、図3Aに示されるテーブル300を作成することができる。図3Aを参照し、フィルタリング操作のため、エントリー「北京の花」、「上海の花」、および「花の配達」に関連付けられた画像の一部を取り除く。フィルタリング操作の後に特定のエントリーに関連付けられた画像がなくなる場合、当該エントリーを最終のマッピングテーブルから取り除くことができる。
一実施形態では、メタデータ512は、画像を記述する様々な情報またはデータを含み、指定されたデータ収集モジュールまたはシステム(例えば、図5のデータ収集モジュール532)でメタデータを取得または収集することができる。例えば、対応する画像を取得する際に画像のメタデータを収集する。画像のメタデータは、画像の収集ソースと収集時間を含んでもよい。画像の収集ソースは、画像が添付されたウェブページまたはドキュメントであってもよい。例えばソースページのようなユニバーサルリソースロケータ(URL)のアドレスを収集することができる。また、画像が表示する可能性のあるコンテンツを確定するように、ソースページのコンテンツを解析することができる。画像のコンテンツ(例えば、画像は人物、オブジェクト、風景、テキストまたはそれらの組合せに関するかどうか)を確定するように、画像に対して画像認識を実行してもよい。また、画像の属性、例えば縦横比、画素数、明るさ、コントラスト、画像の撮影時間およびスタイル(例えば、風景または肖像)を収集してもよい。また、画像に関連付けられた歴史インタラクティブに基づいて過去のユーザと画像および/またはキーワードとの以前のインタラクティブ(例えば、クリック率)を確定してもよい。これらの情報は、画像のメタデータの一部としてコンパイルされてもよい。
メタデータに基づき、フィルタリング操作は、キーワードと特定の画像のメタデータとの間の意味論的意味をマッチングすることによって特定のキーワードが画像を十分に記述しているかどうかを確定する。例えば、キーワードは画像が収集されたソースページに表示された場合、前記キーワードは前記画像に関連する。同様に、キーワードは画像認識に応答して画像の少なくとも一部のコンテンツを記述した場合、前記キーワードは関連するものであってもよい。メタデータへの解析に基づいてキーワードが特定の画像を十分に記述していないまたは画像が特定のキーワードを十分に記述していないことを確定した場合、前記特定の画像を取り除くことができる。ユーザと特定の画像との以前のインタラクティブが所定の閾値(例えば、少ないユーザインタラクティブ、少ないユーザ関心または人気のない)よりも低いと確定された場合、前記特定の画像を取り除くことができる。なお、本出願の全体にわたり、例示の目的のため、用語「マッチングルール」、「マッピングルール」、「マッチングテーブル」、および「マッピングテーブル」は交換可能な用語である。しかしながら、様々なデータ構造またはデータフォーマットで実施することができる。
図8は、本発明の一実施形態に係るクエリ−画像マッピングルールを生成するための過程を示すフローチャートである。処理ロジックにより過程800を実行することができ、前記処理ロジックは、ソフトウェア、ハードウェアまたはそれらの組合せを含んでもよい。例えば、図5のシステム500により過程800を実行することができる。図8を参照し、ブロック801において、処理ロジックは、各キーワードを1つまたは複数の画像にマッピングする第1のクエリ/画像マッピングテーブル(例えば、一次マッピングテーブル)を作成する。ブロック802において、1組のルールに基づいて第1のクエリ画像マッピングテーブルの各キーワードに対して第1の解析を実行して、元のキーワードに関連するまたは類似する1つまたは複数の追加キーワードを識別する。ブロック803において、第2のクエリ/画像マッピングテーブル(例えば、拡張マッピングテーブル)を作成して前記追加キーワードの追加エントリーを含ませる。前記追加エントリーは、追加キーワードを対応する元のキーワードと同じ画像にマッピングする。ブロック804において、関連付けられた画像のメタデータに従って第2のクエリ/画像マッピングテーブルに対して第2の解析(例えば、フィルタリング/マッチング操作)を実行する。ブロック805において、第2の解析に基づいて、エントリーから少なくとも1つの画像を取り除いたり、第2のマッピングテーブルから関連しないと確定された少なくとも1つのエントリーを取り除いたりする。ブロック806において、第3のクエリ/画像マッピングテーブルを生成して最終のクエリ/画像マッピングテーブルとする。
図9は、本発明の別の実施形態に係るクエリ−画像マッチングシステムの例を示すブロック図である。システム900を図2のシステム200の一部として実施することができる。図9を参照し、システム900は図2のシステム200と合併してもよい。あるいは、例えば、システム900を、ネットワークまたはコネクタを介してAPIまたは通信プロトコルを経由して図2のシステム200に通信可能に接続される個別のシステムまたは個別のサーバとして実施することができる。一実施形態では、システム900は、検索コンテンツの検索クエリに応答し、実行時間において、検索クエリに応答して発見されたコンテンツアイテムとマッチングしようとする画像を識別し、ランキングし、選択する。
一実施形態では、画像選択モジュール110は、クエリ解析モジュール901、画像マッチングモジュール902、画像ランキングモジュール903、および画像ランキングルールまたは式904を含み、これらのモジュールの一部または全部は、ソフトウェア、ハードウェアまたはそれらの組合せとして実施されてもよい。一実施形態では、クライアント装置から受信した検索コンテンツの検索クエリに応答し、クエリ解析モジュール901は、検索クエリを解析して1つまたは複数の第1のキーワードを確定する。画像マッチングモジュール902は、画像−キーワード(画像/キーワード)マッチングテーブルまたはデータ構造115において第1のキーワードに基づいて検索操作またはサーチ操作を実行する。クエリ/画像マッピングテーブル115は複数のエントリーを含み、各エントリーは、画像を識別するための画像IDを1つまたは複数の第2のキーワードにマッピングするまたは1つまたは複数の第2のキーワードを画像を識別するための画像IDにマッピングする(例えば、図3A〜図3Bに示されるマッチングテーブル)。
画像/キーワードマッピングテーブル115において識別された各画像に対して、画像ランキングモジュール903はランキング過程を実行して、第1のキーワードと第2のキーワードとの間のマッチング度を確定する。次に、画像メモリ/サーバ125から画像/キーワードマッピングテーブル115において識別された画像を検索する。例えば画像ランキングルールまたは式904を用いてマッチング度に基づいて画像をランキングしたり分類したりすることができる。画像ランキングルールまたは式904は、事前に構成されてもよく(例えば、ユーザにより構成インターフェースを経由して構成され、またはルールエンジン(図示せず)により自動的に構成される)且つ不揮発性記憶装置(例えば、ハードディスク)に保存されてもよい。一実施形態では、各マッチング度に事前に重み付け係数を割り当てることができる。従って、第1のキーワードと第2のキーワードとのマッチング度は所定のカテゴリー内にあり、対応する1つの重み付け係数を適用する。分類またはランキングの目的のため、最後に、例えば画像ランキングモジュール903またはマッチングスコア計算機(図示せず)によりマッチング度を示すマッチングスコアを計算することができる。分類またはランキングされた、所定の閾値よりも高いマッチング度を有する画像を候補画像として使用することができる。前記候補画像の少なくとも一部を選択してコンテンツデータベースまたはコンテンツサーバから検索されたコンテンツアイテムを割り当てるおよび/または当該コンテンツアイテムと集積してもよい。
図10は、本発明の一実施形態に係る検索クエリに応答して画像とコンテンツアイテムとをマッチングする過程を示す処理フローチャートである。図9のシステム900により過程フロー1000を実行することができる。図10を参照し、検索クエリ1001に応答し、クエリ解析モジュール901は、検索クエリ1001に含まれるキーワードを解析して、1つまたは複数のキーワード1002のセットを生成する。キーワード1002は、検索クエリ1001に含まれる正確なキーワード、および拡張キーワード(例えば、意味的に関連するまたは類似する語、同義語)を含んでもよい。クエリ解析モジュール901は、1つまたは複数の拡張キーワードのセットを導出するように、検索クエリ1001に含まれるキーワードに対して潜在的意味解析を実行することができる。前記拡張キーワードは、一定量のユーザが特定の意味を有するコンテンツを説明したり検索したりするために用いられる可能性が高い単語、例えば一定期間に基づく以前のユーザインタラクティブ(例えば、ネットワークを介してコンパイルされたユーザインタラクティブ履歴ログ)を含んでもよい。
キーワード1002に基づいて、画像マッチングモジュール902は、クエリ/画像マッピングテーブル115(例えば、図3A〜図3Bに示されるマッピングテーブル)において検索操作またはサーチ操作を実行して、キーワード1002に関連すると思われる候補画像1003を識別する。画像マッチングモジュール902は、クエリ/画像マッピングテーブル115においてキーワード1002に基づいてサーチ操作を実行して、マッチングキーワード1002における少なくとも1つのエントリーから画像IDを検索する。候補画像1003に基づいて、画像ランキングモジュール903は、検索クエリ1001の1つまたは複数のキーワードとクエリ/画像マッピングテーブル115のマッチングエントリーにおけるキーワードとの間のマッチング度を確定する。一実施形態では、ランキングモジュール903は、どれくらいの検索クエリ1001に関連付けられたキーワード1002が、クエリ/画像マッピングテーブル115のマッチングエントリーに含まれるかを確定する。
検索クエリのすべてのキーワードを有するエントリーは最も高いマッチング度を表示する。検索クエリのキーワードとマッチングするキーワードが多いエントリー(例えば、一部だけのキーワードを含むエントリー)は高いマッチング度を有する。一方、マッチングエントリーは検索クエリのいずれかのキーワードを含まないけれど関連するまたは類似する語を含んだ場合、その対応するマッチング度が低くなる。また、キーワードと画像との間の各対のマッチングに対して、ランキングルールまたは式904に基づいてマッチング度を示すマッチングスコアを計算することができる。高いマッチング度に高いマッチングスコアを割り当てることができる。異なるマッチング度は、ランキング式904において対応するマッチングスコアを計算するための異なる重み付け係数に関連付けられることができる。
図11は、本発明の一実施形態に係る検索クエリに応答して画像をランキングする過程の例を示す図である。図9および図11を参照し、検索クエリ1101を受信した場合、クエリ解析モジュール901は解析を実行する。当該例では、検索クエリ1101は、「一日」、「花」、および「配達」という3つの語を含む。これらのキーワードに基づいて、画像マッチングモジュール902は、クエリ/画像マッピングテーブル1102においてサーチ操作を実行し、クエリ/画像マッピングテーブル1102は、クエリ/画像マッピングテーブル115において識別された候補画像を表してもよい。
当該例では、マッピングテーブル1102は、画像1〜4を様々な語またはキーワードにマッピングするマッチングエントリー1111〜1114を含む。キーワード「一日」、「花」、および「配達」に基づき、スコアリング式1103を用いてクエリ/画像マッピングテーブル1102におけるマッチング検索クエリ1101のキーワードの数に基づいて画像1111〜1114をランキングする。上記したように、検索クエリ1101とマッピングテーブル1102のエントリー1111〜1114との間のマッチングされたキーワードが多いほど、マッチングスコアが高くなる。当該例では、エントリー1112と検索クエリ1101がキーワードの正確なマッチングを有するため、スコアリング式1103に基づいて画像2に最も高いスコアを割り当て、これにより画像2は、選択されてコンテンツアイテムに関連付けられて集積される画像1104とする。
一実施形態によれば、検索クエリと画像に対応する特定のエントリーのキーワードとの間のマッチングされるキーワードの数、検索クエリに含まれるキーワードの数、および/または前記特定のエントリーに含まれるキーワードの数に基づき、マッチングスコア計算機またはランキングモジュールによりスコアリング式1103に基づいて計算されたマッチングスコアを確定する。特定の一実施形態では、特定の画像のマッチングスコア=(マッチングキーワードの数/検索クエリにおけるキーワードの数)*(マッチングキーワードの数/画像に対応するマッチングエントリーのキーワードの数)。
図12は、本発明の一実施形態に係るキーワードに基づいて画像とコンテンツアイテムとをマッチングする過程を示すフローチャートである。処理ロジックにより過程1200を実行することができ、前記処理ロジックは、ソフトウェア、ハードウェアまたはそれらの組合せを含んでもよい。例えば、図9のシステム900により過程1200を実行することができる。図12を参照し、ブロック1201において、処理ロジックは、画像/キーワードマッピングテーブルを維持して画像を1つまたは複数のキーワードにマッピングする。画像/キーワードマッピングテーブルは、多数のマッピングエントリーを含み、各エントリーは、画像または画像を識別するための画像IDを1つまたは複数のキーワードにマッピングする。ブロック1202において、検索クエリに応答し、処理ロジックは、検索クエリを解析して1つまたは複数の検索語またはキーワードを確定する。ブロック1203において、処理ロジックは、画像/キーワードマッピングテーブルにおいて検索語に基づいてサーチ操作を実行して、1つまたは複数の画像を識別する。ブロック1204において、少なくとも1つの検索語を含む各エントリーに対して、処理ロジックは前記エントリーに対応する画像のマッチング度を確定する。ブロック1205において、識別された各画像に対して、処理ロジックは所定のスコアリング式を用いて対応するマッチング度に基づいてマッチングスコアを計算する。ブロック1206において、関連付けられたマッチングスコアに基づいて画像をランキングして候補画像のリストを導出する。
画像とキーワードをマッチングするためのマッチング技術は、検索クエリのキーワードおよび/または画像のメタデータへの解析に基づくものである。いくつかの実施形態によれば、画像をランキングする場合、クエリのキーワードおよび画像のメタデータに基づいてマッチングする以外、前記ランキングは、検索クエリに応答して発見されたコンテンツアイテムの周辺の情報および/またはメタデータもしくはコンテンツアイテム自身に基づいて確定されてもよい。この方法の基本原理をは、画像とコンテンツアイテムが類似するソースに由来するまたは類似する歴史背景を有する場合、これらの画像とコンテンツアイテムは関連するまたは正確にマッチングする可能性が高い。
本発明の別の態様によれば、1つまたは複数の検索語を有する検索クエリに応答し、コンテンツデータベースにおいてまたはコンテンツサーバを経由して第1の検索を実施して、前記1つまたは複数の検索語に関連する第1のコンテンツアイテムのリストを識別して検索する。画像メモリまたは画像サーバにおいて第2の検索を実行して、前記検索語に関連する1つまたは複数の画像のリストを識別し、検索する。第2の検索によって識別された各画像に対して、コンテンツアイテムのコンテキストおよび画像に関連付けられたメタデータに基づいて、画像と各第1のコンテンツアイテムとの間のマッチングスコアを計算する。各第1のコンテンツアイテムに対して、画像と対応するコンテンツアイテムとの間のマッチングスコアに基づいて画像をランキングする。次に、ランキングされた画像のリストから画像のいずれかを選択して前記コンテンツアイテムに関連付ける。選択された画像および関連付けられたコンテンツアイテムを合併する(例えば、背景画像とする)。従って、合併された、第1のコンテンツアイテムの少なくとも一部および画像の少なくとも一部を有する第2のコンテンツアイテムのリストを生成し、且つ前記第2のコンテンツアイテムのリストはクライアント装置に返送される。
図13は、本発明の別の実施形態に係るクエリ−画像マッチングシステムの例を示すブロック図である。システム1300は、上記マッチングシステムの一部として実施されてもよい。同じ参照符号を用いて上記コンポーネントの機能と同じまたは類似の機能を有するあるコンポーネントを引用する。同じ参照符号を有するコンポーネントに対する上記説明はここで同様に適用される。
図13を参照し、一実施形態によれば、検索クエリ1301を受信した場合、検索エンジン120は、コンテンツデータベースにおいてまたはコンテンツサーバを経由して検索を実行してコンテンツアイテム1303のリストを識別し、検索し、前記コンテンツアイテム1303は検索結果に合併されてもよい。一般的なコンテンツデータベース/サーバ、補助コンテンツデータベース/サーバ(例えば、スポンサー付きコンテンツ、特殊のコンテンツ)またはこの両者からコンテンツアイテム1303を検索することができる。また、クエリ解析モジュール901は、キーワード1302のリストを導出するように、検索クエリ1301のキーワードまたは検索語を解析する。上記したように、キーワード1302に基づいて、画像マッチングモジュール902は、クエリ/画像マッピングテーブルまたはルール115において検索したりサーチしたりして候補画像1304のリストを識別する。
候補画像1304およびコンテンツアイテム1303に基づき、ランキングモジュール903は、コンテンツアイテム1303、コンテンツアイテム1303に関連付けられたメタデータ1311、候補画像1304、および候補画像1304に関連付けられたメタデータ1312に基づいて、ランキング過程を実行する。所定のランキング式1310を用いて、コンテンツアイテム1303、コンテンツアイテム1303に関連付けられたメタデータ1311、候補画像1304、および候補画像1304に関連付けられたメタデータ1312の間の関係に基づいて、ランキング過程を実行してもよい。前記ランキング過程のため、コンテンツアイテムと画像とのマッチング対1305を生成する。マッチングされたコンテンツアイテムおよび画像を集積済みのコンテンツアイテムに集積してもよい。例えば、コンテンツアイテム(例えば、テキスト)を、背景画像として機能するマッチングされた画像に重ね合わせてもよい。あるいは、マッチングされた画像をコンテンツアイテムの隣に置いてコンテンツアイテムを補足する。集積済みのコンテンツアイテムを有する検索結果を、検索クエリ1301を開始するクライアント装置に送信する。
一実施形態では、コンテンツアイテム1303に従って候補画像1304をランキングする際に、ランキングモジュール903は、候補画像1304およびコンテンツアイテム1303をめぐってすべての情報またはデータ(コンテンツアイテムのメタデータ1311および画像のメタデータ1312と総称される)を考慮する。コンテンツアイテム1303のそれぞれと候補画像1304のそれぞれとの間のマッチングスコアに基づいてスコア行列を計算する。コンテンツアイテムにおける1つおよび候補画像における1つからなる各対のマッチングスコア(ランキングスコアとも呼ばれる)を計算する際に、前記対のコンテンツアイテムおよび候補画像に関連付けられた各所定の属性またはパラメータの個別のマッチングスコアを計算する。対応する属性またはパラメータに関連付けられた個別のスコアリング式を用いて、コンテンツアイテムのメタデータ1311および/または画像のメタデータ1312から取得した対応するデータに基づいて、前記個別のマッチングスコアを確定することができる。次に、総合的なスコアリング式を用いて、個別のマッチングスコアに基づいて総合的なマッチングスコアを確定する。同じマッチングスコアを有するマッチングが1つを超えた場合、異なる画像を異なるコンテンツアイテムに割り当てるように、タイブレーク式を用いることができる。あるいは、特定の必要に応じて、1つの画像を複数のコンテンツアイテムに割り当てもよい。
メタデータ1311〜1312から取得した、コンテンツアイテムと候補画像をスコアリングするための属性またはパラメータは様々なデータであってもよく、データ収集モジュール(図示せず)を用いて一定の時間において収集することができる。一実施形態では、部分的にコンテンツアイテムと候補画像との間のマッチング品質に基づいて前記コンテンツアイテムと前記候補画像との間のマッチングスコアを確定してもよい。用語「マッチング品質」はコンテンツアイテムがマッチングされた画像から認識されたコンテンツを記述するかどうかを意味してもよい。例えば、タイトルおよび/または記述が画像により表示されたコンテンツとマッチングするかどうかに基づいてマッチング品質を確定してもよい。画像認識モジュールまたはシステム(図示せず)によって実行された画像認識過程によって画像により示されたコンテンツを確定してもよい。コンテンツアイテムと画像が同じソースまたは類似のソース(例えば、同じアドレス(例えばURL)、同じドメイン、または同じまたは類似のプロバイダにより提供される)から取得されるかどうかに基づいてマッチング品質を確定してもよい。
一実施形態では、部分的にコンテンツアイテムと画像との間の、ユーザの以前のクリック率と呼ばれるインタラクティブ(例えば、以前のユーザアクセスモードまたは行動)に基づいてコンテンツアイテムと候補画像との間のマッチングスコアを確定してもよい。データ収集モジュールまたはデータ収集システム(図示せず)により一定の時間において収集されたユーザインタラクティブの履歴ログから以前のユーザインタラクティブを取得することができる。履歴ログは、ユーザと、ユーザがアクセスまたはブラウズするコンテンツおよび/または画像とのインタラクティブを記録し、ユーザ情報(例えば、IPアドレス、ドメイン、ユーザ名)、コンテンツアイテムおよび/または画像にアクセスしたユーザの数、アクセス時間、ユーザがコンテンツアイテムおよび/または画像を表示するコンテンツページに滞留する時間、ユーザがコンテンツページにアクセスする頻度を識別することを含む。クリック率は、コンテンツアイテム、画像または共同で表示するコンテンツアイテム及び画像の両方に対するユーザのクリックを記録してもよい。
一実施形態では、部分的に画像の画質に基づいてコンテンツアイテムと候補画像との間のマッチングスコアを確定してもよい。画質は、画像の大きさ(例えば、高さと幅)、解像度(例えば、画素数)、縦横比、レイアウト(例えば、風景、肖像)、画像の撮影時間(例えば、画像が最新であるかどうか)を含むが、それらに限定されない。マッチングスコアは、画像の革新またはスタイル、例えば明るさ、コントラスト、カメラ設定または画像に関連付けられた任意のそのほかのメタデータに基づいて確定されてもよい。
図14は、本発明の一実施形態に係るマッチングスコアを確定するためのスコアリング行列の例を示すブロック図である。図14を参照し、ランキングモジュール(例えば図13のランキングモジュール903)によってスコアリング行列1400をコンパイルし、生成することができる。図14を参照し、検索エンジンが検索クエリに関連付けられた1つまたは複数のキーワードに基づいてコンテンツデータベースまたはコンテンツサーバからコンテンツアイテム1401(例えば、スポンサー付きコンテンツ)を識別し、検索すると仮定する。また、上記したように、検索クエリに関連付けられた特定のキーワードに関連する候補画像1421〜1423のリストが識別された。
一実施形態では、コンテンツアイテム1401のそれぞれに対して、1組の所定の属性またはパラメータ1402〜1406の個別のマッチングスコアを計算する。個別のマッチングスコア計算機により特定または対応する個別のマッチングスコア式を用いて個別のマッチングスコア1402〜1406を計算することができる。上記したように、属性またはパラメータ1402〜1406のそれぞれは、個別のマッチングスコアの計算中の特定の重み付け係数または係数に関連付けてもよい。図示しないが、画像1422〜1423のそれぞれの個別のマッチングスコアを計算することができる。コンテンツアイテム1401のそれぞれに対して、画像1421〜1423のそれぞれの総合的なスコア1410を計算する。次に、特定のコンテンツアイテムに対して計算された画像1421〜1423の総合的なスコアを用いて画像1421〜1423における1つを選択して前記特定のコンテンツアイテムに関連付ける。
一実施形態では、特定のコンテンツアイテムに対して最も高い総合的なマッチングスコアを有する画像を選択して前記コンテンツアイテムに関連付ける。例えば、画像1421が画像1421〜1423において最も高い総合的なマッチングスコアを有すると仮定する。画像1421を選択してコンテンツアイテム1に関連付けてもよい。同じ画像が複数のコンテンツアイテム(当該例ではコンテンツアイテム1および2である)に対して同じ最も高いマッチングスコアを有する場合、タイブレーク式で競争を解決することができる。一実施形態では、コンテンツアイテム1401のそれぞれに対してすべての画像1421〜1423のすべての総合的なマッチングスコアの和を計算する。最も高い和を有するコンテンツアイテムは、画像を選択するより高い優先権を有する。そのほかの構成が存在してもよい。
図15は、本発明の別の実施形態に係る画像とコンテンツアイテムとをマッチングするための過程を示すフローチャートである。処理ロジックにより過程1450を実行することができ、前記処理ロジックは、ソフトウェア、ハードウェアまたはそれらの組合せを含んでもよい。例えば、図13のシステム1300により過程1450を実行することができる。図15を参照し、ブロック1451において、検索クエリに応答し、処理ロジックは、コンテンツデータベースまたはサーバにおいて検索して、コンテンツアイテムのリストを識別し、検索する。ブロック1452において、処理ロジックは検索クエリを解析して、検索クエリに関連付けられた1つまたは複数のキーワードを確定する。これらのキーワードは、検索クエリに含まれるキーワードおよび/またはそれらのキーワードに関連する拡張キーワードを含んでもよい。ブロック1453において、処理ロジックは、キーワード/画像マッピングテーブルにおいてキーワードに基づいて検索して、候補画像のリストを識別する。
ブロック1454において、各候補画像に対して、処理ロジックは、コンテンツアイテムと各候補画像に関連付けられた各所定の属性またはパラメータ(例えば、マッチング品質、画質、クリック率、画像の革新またはスタイル、ユーザインタラクティブの歴史)の個別のマッチングスコアを計算する。ブロック1455において、処理ロジックは、所定のランキング式を用いて個別のマッチングスコアに基づいて総合的なマッチングスコアを計算する。ブロック1456において、コンテンツアイテムと割り当てられた候補画像との間の総合的なスコアに基づいて、候補画像の少なくとも一部をコンテンツアイテムに割り当てる。
上記技術を使用して画像とスポンサー付きコンテンツとをマッチングすることができる。スポンサー付きコンテンツの一種は広告(Ad)である。例えば、図1A〜図1Bに戻って参照し、コンテンツデータベース(DB)またはサーバ133は、AdデータベースまたはAdサーバであってもよい。別の実施形態では、主要コンテンツDB130は、公共ネットワークで一般的に利用可能な一般的なコンテンツを記憶してもよい。補助コンテンツDB131は広告DBであってもよい。特定の広告は、プレインテキストのみであってもよい。画像と広告とをマッチングして集積する(例えば、背景画像とする)ことによって、広告はヒトまたはユーザにとってさらに魅力的になる。サーバ104は、コンテンツを検索するネットワークサーバであってもよく、広告サーバであってもよい。
図16は、本出願の一実施形態と組み合わせて使用されるデータ処理システムを例示的に示すブロック図である。例えば、システム1500は、上記プロセスまたは方法のいずれかを実行する上記任意のデータ処理システム、例えば上記クライアント装置またはサーバを示してもよい。
システム1500は、多数の異なる構成要素を含んでもよい。これらの構成要素は、集積回路(IC)、集積回路の一部、分散型電子装置または回路基板に適用された他のモジュール(例えばコンピュータシステムのマザーボードまたはアドインカード)、または他の方式でコンピュータシステムのシャシーに組み込まれた構成要素として実現できる。
さらに、システム1500は、コンピュータシステムの多数の構成要素の詳細ビューを示すことを目的とする。しかしながら、いくつかの実現形態では、付加的構成を要してもよいことを理解すべきである。また、他の実現形態において示される構成要素が異なる配置を有してもよい。システム1500は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、サーバ、携帯電話、メディアプレーヤー、パーソナルディジタルアシスタント(PDA)、スマート腕時計、パーソナルコミュニケーター、ゲーム装置、ネットワークルータまたはハブ、無線アクセスポイント(AP)またはリピーター、セットトップボックス、またはそれらの組合せを示してもよい。また、単一の機器またはシステムのみを示したが、用語「機器」または「システム」は、さらに、独立または共同で1つ(または複数)の命令セットを実行することにより本明細書に説明される任意の1種または複数種の方法を実行する機器またはシステムの任意のセットを含むことを理解すべきである。
一実施形態において、システム1500は、バスまたは相互接続部材1510によって接続されたプロセッサ1501、メモリ1503および装置1505〜1508を備える。プロセッサ1501は、単一のプロセッサコアまたは複数のプロセッサコアを含む単一のプロセッサまたは複数のプロセッサを備えてもよい。プロセッサ1501は、マイクロプロセッサ、中央処理装置(CPU)等のような1つまたは複数の汎用プロセッサであってもよい。より具体的には、プロセッサ1501は、複雑命令セット計算(CISC)マイクロプロセッサ、縮小命令セットコンピュータ(RISC)マイクロプロセッサ、超長命令語(VLIW)マイクロプロセッサ、または他の命令セットを実現するプロセッサ、または命令セットの組合せを実現するプロセッサであってもよい。プロセッサ1501は、さらに、専用集積回路(ASIC)、セルラまたはベースバンドプロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、ネットワークプロセッサ、グラフィックプロセッサ、通信プロセッサ、暗号プロセッサ、コプロセッサ、組み込みプロセッサのような1つまたは複数の専用プロセッサ、あるいは命令処理可能な任意の他のタイプのロジックであってもよい。
プロセッサ1501(超低電圧プロセッサのような低電力マルチコアプロセッサソケットであってもよい)は、前記システムの各種構成要素と通信するための主処理ユニットおよび中央ハブとして機能できる。このようなプロセッサは、システムオンチップ(SoC)として実現できる。プロセッサ1501は、命令を実行することにより本明細書に説明される操作およびステップを実行するための命令を実行するように構成される。また、システム1500は、選択可能なグラフィックサブシステム(表示コントローラおよび/または表示装置)1504と通信するグラフィックインターフェースをさらに含み、グラフィックサブシステム(表示コントローラおよび/または表示装置)1504は、表示コントローラ、グラフィックプロセッサおよび/または表示装置をさらに備えてもよい。
プロセッサ1501は、メモリ1503と通信してもよく、メモリ1503は、一実施形態において複数のメモリによって所定量のシステムメモリを提供する。メモリ1503は、ランダムアクセスメモリ(RAM)、動的RAM(DRAM)、シンクロナスDRAM(SDRAM)、静的RAM(SRAM)または他のタイプの記憶装置のような1つまたは複数の揮発性記憶(またはメモリ)装置を備えてもよい。メモリ1503は、プロセッサ1501または任意の他の装置により実行される命令列を含む情報を記憶できる。例えば、複数種のオペレーティングシステム、装置ドライバー、ファームウェア(例えば、入力出力基本システムまたはBIOS)および/またはアプリケーションの実行可能なコードおよび/またはデータはメモリ1503にロードされてもよく、プロセッサ1501により実行される。オペレーティングシステムは、Microsoft(登録商標)会社からのWindows(登録商標)オペレーティングシステム、アップル会社からのMac OS(登録商標)/iOS(登録商標)、Google(登録商標)会社からのAndroid(登録商標)、Linux(登録商標)、Unix(登録商標)または他のリアルタイムまたは組み込みオペレーティングシステム(例えばVxWorks)のような任意のタイプのオペレーティングシステムであってもよい。
システム1500は、I/O装置、例えば装置1505〜1508をさらに備えてもよく、ネットワークインターフェース装置1505、選択可能な入力装置1506および他の選択可能なI/O装置1507を備える。ネットワークインターフェース装置1505は、無線送受信機および/またはネットワークインターフェースカード(NIC)を備えてもよい。前記無線送受信機は、WiFi送受信機、赤外送受信機、ブルートゥース(登録商標)送受信機、WiMax送受信機、無線セルラーホン送受信機、衛星送受信機(例えば、全地球測位システム(GPS)送受信機)または他の無線周波数(RF)送受信機またはそれらの組合せであってもよい。NICはイーサネット(登録商標)カードであってもよい。
入力装置1506は、マウス、タッチパッド、タッチスクリーン(それは表示装置1504と一体化されてもよい)、ポインタデバイス(例えばスタイラス)および/またはキーボード(例えば、物理キーボードまたはタッチスクリーンの一部として表示された仮想キーボード)を備えてもよい。例えば、入力装置1506は、タッチスクリーンに接続されるタッチスクリーンコントローラを含んでもよい。タッチスクリーンおよびタッチスクリーンコントローラは、例えば複数種のタッチ感度技術(容量、抵抗、赤外および表面音波の技術を含むが、それらに限定されない)のいずれか、およびタッチスクリーンの1つまたは複数の接触点を決定するための他の近接センサアレイまたは他の素子を用いてそのタッチ点および移動または断続を検出できる。
I/O装置1507は音声装置を備えてもよい。音声装置は、スピーカおよび/またはマイクロホンを含んでもよく、それにより音声認識、音声コピー、デジタル記録および/または電話機能のような音声サポートの機能を促進する。他のI/O装置1507は、汎用シリアルバス(USB)ポート、パラレルポート、シリアルポート、印刷機、ネットワークインターフェース、バスブリッジ(例えば、PCI−PCIブリッジ)、センサ(例えば、加速度計、ジャイロスコープ、磁力計、光センサ、コンパス、近接センサ等のような動きセンサ)またはそれらの組合せをさらに備えてもよい。装置1507は、結像処理サブシステム(例えば、カメラ)をさらに備えてもよく、前記結像処理サブシステムは、カメラ機能(例えば、写真およびビデオ断片の記録)を促進するための電荷カップリング装置(CCD)または相補型金属酸化物半導体(CMOS)光学センサのような光学センサを備えてもよい。あるセンサは、センサハブ(図示せず)によって相互接続部材1510に接続されてもよく、キーボードまたは熱センサのような他の装置は、組み込みコントローラ(図示せず)により制御されてもよく、これはシステム1500の特定配置または設計により決められる。
データ、アプリケーション、1つまたは複数のオペレーティングシステム等のような情報の永久記憶を提供するために、大容量記憶装置(図示せず)は、プロセッサ1501に接続されてもよい。様々な実施形態において、薄型化と軽量化のシステム設計を実現し且つシステムの応答能力を向上させるために、このような大容量記憶装置は、ソリッドステート装置(SSD)によって実現できる。なお、他の実施形態において、大容量記憶装置は、主にハードディスクドライブ(HDD)で実現されてもよく、少量のSSD記憶量は、SSDキャッシュとして停電イベント期間にコンテキスト状態および他のこのような情報の不揮発性記憶を実現し、それによりシステム動作が再開する時に通電を速く実現できる。さらに、フラッシュデバイスは、例えばシリアルペリフェラルインターフェース(SPI)によってプロセッサ1501に接続されてもよい。このようなフラッシュデバイスは、システムソフトウェアの不揮発性記憶に用いられてもよく、前記システムソフトウェアは、前記システムの基本入力/出力ソフトウェア(BIOS)および他のファームウェアを備える。
記憶装置1508は、任意の1種または複数種の本明細書に記載の方法または機能を体現する1つまたは複数の命令セットまたはソフトウェア(例えば、モジュール、ユニットおよび/またはロジック1528)が記憶されるコンピュータアクセス可能な記憶媒体1509(機械可読記憶媒体またはコンピュータ可読媒体とも呼ばれる)を備えてもよい。モジュール/ユニット/ロジック1528は、上記した検索エンジン、エンコーダ、インタラクションログ記録モジュール、画像選択モジュールのような上記構成要素のいずれかを示してもよい。モジュール/ユニット/ロジック1528は、さらにデータ処理システム1500により実行される期間にメモリ1503内および/またはプロセッサ1501内に完全または少なくとも部分的に存在してもよく、ここで、メモリ1503およびプロセッサ1501も、機器アクセス可能な記憶媒体を構成する。モジュール/ユニット/ロジック1528は、さらにネットワークによってネットワークインターフェース装置1505を経由して送受信されてもよい。
コンピュータ可読記憶媒体1509は、以上に説明されたいくつかのソフトウェア機能を永続的に記憶してもよい。コンピュータ可読記憶媒体1509は、例示的な実施形態において単一の媒体として示されたが、用語「コンピュータ可読記憶媒体」は、前記1つまたは複数の命令セットが記憶される単一の媒体または複数の媒体(例えば、集中型または分散型データベース、および/または関連するキャッシュおよびサーバ)を備えることを理解すべきである。用語「コンピュータ可読記憶媒体」は、さらに命令セットを記憶またはコーディング可能な任意の媒体を備えることを理解すべきであり、前記命令セットは、機器により実行され且つ前記機器に本出願の任意の1種または複数種の方法を実行させる。従って、用語「コンピュータ可読記憶媒体」は、ソリッドステートメモリおよび光学媒体と磁気媒体または任意の他の非一時的機械可読媒体を備えるが、それらに限定されないことを理解すべきである。
本明細書に記載のモジュール/ユニット/ロジック1528、構成要素および他の特徴は、ディスクリートハードウェアコンポーネントとして実現されてもよく、またはハードウェアコンポーネント(例えばASICS、FPGA、DSPまたは類似装置)の機能に統合されてもよい。さらに、モジュール/ユニット/ロジック1528は、ハードウェア装置内のファームウェアまたは機能回路として実現されてもよい。また、モジュール/ユニット/ロジック1528は、ハードウェア装置およびソフトウェアコンポーネントの任意の組合せで実現されてもよい。
なお、システム1500は、データ処理システムの各種の構成要素を有するように示されているが、任意の具体的な構造または構成要素の相互接続方式を限定するものではないことに注意すべき、それは、このような詳細が本出願の実施形態に密接な関係がないためである。また、より少ない構成要素またはより多くの構成要素を有するネットワークコンピュータ、ハンドヘルドコンピュータ、携帯電話、サーバおよび/または他のデータ処理システムは、本出願の実施形態と共に使用されてもよい。
上記詳細な説明の一部は、コンピュータメモリにおけるデータビットに対する演算のアルゴリズムおよび記号表現で示される。これらのアルゴリズムの説明および表現は、データ処理分野における当業者によって使用される、それらの作業実質を所属分野の他の当業者に最も効果的に伝達する方法である。ここで、アルゴリズムは、通常、所望の結果につながる首尾一貫した操作列(sequence of operations)と考えられる。これらの操作とは、物理量に対して物理的操作を行う必要となるステップを指す。
ただし、これらの全ておよび類似の用語は、いずれも適切な物理量に関連付けられ、且つただこれらの量に適用される適切なラベルであることに注意すべきである。特に断らない限り、本明細書の全体にわたって用語(例えば、添付している特許請求の範囲に説明された用語)による説明とは、コンピュータシステムまたは類似の電子計算装置の動作および処理であり、前記コンピュータシステムまたは電子計算装置は、コンピュータシステムのレジスタおよびメモリに物理(例えば、電子)量として示されるデータを取り扱い、且つ前記データをコンピュータシステムメモリまたはレジスタまたは他のこのような情報メモリ、伝送装置または表示装置内において類似に物理量として示される他のデータに変換する。
各図に示される技術は、1つまたは複数の電子装置に記憶され前記電子装置上で実行されるコードおよびデータにより実施されてもよい。このような電子装置は、コンピュータ可読媒体を使用してコードおよびデータを記憶し、(内部で、および/またはネットワークを介してほかの電子装置を利用して)伝送し、前記コンピュータ可読媒体として、非一時的コンピュータ可読記憶媒体(例えば、磁気ディスク、光ディスク、ランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ装置、相変化メモリ)および一時的コンピュータ可読伝送媒体(例えば、電子、光学、音響学、またはほかの形式の信号伝播、例えば搬送波、赤外信号、デジタル信号)が挙げられる。
上記図面に示されるプロセスまたは方法は、ハードウェア(例えば、回路、専用ロジック等)、ファームウェア、ソフトウェア(例えば、非一時的コンピュータ可読媒体に示される)、またはそれらの組合せを含む処理ロジックにより実行されてもよい。前記プロセスまたは方法は、本明細書において特定の順序に応じて説明されるが、説明された操作の一部は、異なる順序に応じて実行されてもよい。また、いくつかの操作は、順番ではなく並行に実行されてもよい。
以上の明細書では、本出願の具体的な例示的な実施形態を参照してその実施形態を説明した。明らかなように、添付している特許請求の範囲に記載の本出願のより広い趣旨および範囲を逸脱しない限り、様々な変形が可能である。従って、限定的なものではなく例示的なものとして本明細書および図面を理解すべきである。

Claims (21)

  1. サーバにおいてクライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、前記サーバによってホストされた検索エンジンにより、コンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別するステップと、
    前記サーバによってホストされた画像選択モジュールにより、画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して、1つまたは複数の画像のリストを識別するステップと、
    前記検索エンジンにより前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成するステップと、
    前記検索エンジンによりコンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させるステップと、を含み、
    ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有しており、
    前記画像のそれぞれに対して、前記第1のリストの第1のコンテンツアイテムに関連付けられたメタデータと前記画像に関連付けられたメタデータとに基づいて、前記画像と前記第1のコンテンツアイテムとの間のマッチングスコアを計算するステップと、
    前記画像と前記第1のコンテンツアイテムとの間の対応するマッチングスコアに基づいて前記画像のそれぞれをランキングするステップと、
    前記画像における、所定の閾値よりも大きいマッチングスコアを有する1つの画像を選択するステップと、をさらに含み、
    ここで、選択された画像は前記第1のコンテンツアイテムと集積し、
    各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、前記画像の画質またはスタイルに基づいて計算される
    ことを特徴とする検索クエリに応答してコンテンツアイテムのために画像を選択するコンピュータ実施方法。
  2. 前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積するステップにおいては、
    各コンテンツアイテムを前記画像における選択された1つの画像に重ね合わせて、前記コンテンツアイテムを前景に位置させて選択された画像を背景画像とするステップを含む
    ことを特徴とする請求項1に記載の方法。
  3. 前記第1のリストにおける前記コンテンツアイテムのそれぞれに対して、
    マッチングスコアを反復的に計算し、
    前記マッチングスコアに基づいて前記画像のそれぞれをランキングし、
    前記マッチングスコアに基づいて前記画像の中の1つを選択するステップをさらに含む
    ことを特徴とする請求項1に記載の方法。
  4. 前記第1のリストの複数のコンテンツアイテムに対して同じ画像を選択したかどうかを確定するステップと、
    所定のタイブレーク式を前記複数のコンテンツアイテムに関連付けられた画像のマッチングスコアに適用して、前記第1のリストの異なるコンテンツアイテムに対して異なる画像を選択するステップと、をさらに含む
    ことを特徴とする請求項3に記載の方法。
  5. 各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、前記第1のコンテンツアイテムと各画像との間の類似性に基づいて計算され、前記第1のコンテンツアイテムが前記画像により示された画像コンテンツを記述しているかどうかを確定するステップを含む
    ことを特徴とする請求項1に記載の方法。
  6. サーバにおいてクライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、前記サーバによってホストされた検索エンジンにより、コンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別するステップと、
    前記サーバによってホストされた画像選択モジュールにより、画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して、1つまたは複数の画像のリストを識別するステップと、
    前記検索エンジンにより前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成するステップと、
    前記検索エンジンによりコンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させるステップと、を含み、
    ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有しており、
    前記画像のそれぞれに対して、前記第1のリストの第1のコンテンツアイテムに関連付けられたメタデータと前記画像に関連付けられたメタデータとに基づいて、前記画像と前記第1のコンテンツアイテムとの間のマッチングスコアを計算するステップと、
    前記画像と前記第1のコンテンツアイテムとの間の対応するマッチングスコアに基づいて前記画像のそれぞれをランキングするステップと、
    前記画像における、所定の閾値よりも大きいマッチングスコアを有する1つの画像を選択するステップと、をさらに含み、
    ここで、選択された画像は前記第1のコンテンツアイテムと集積し、
    各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、前記画像の以前のユーザアクセスモードに基づいて計算される
    ことを特徴とする検索クエリに応答してコンテンツアイテムのために画像を選択するコンピュータ実施方法。
  7. サーバにおいてクライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、前記サーバによってホストされた検索エンジンにより、コンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別するステップと、
    前記サーバによってホストされた画像選択モジュールにより、画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して、1つまたは複数の画像のリストを識別するステップと、
    前記検索エンジンにより前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成するステップと、
    前記検索エンジンによりコンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させるステップと、を含み、
    ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有しており、
    前記画像のそれぞれに対して、前記第1のリストの第1のコンテンツアイテムに関連付けられたメタデータと前記画像に関連付けられたメタデータとに基づいて、前記画像と前記第1のコンテンツアイテムとの間のマッチングスコアを計算するステップと、
    前記画像と前記第1のコンテンツアイテムとの間の対応するマッチングスコアに基づいて前記画像のそれぞれをランキングするステップと、
    前記画像における、所定の閾値よりも大きいマッチングスコアを有する1つの画像を選択するステップと、をさらに含み、
    ここで、選択された画像は前記第1のコンテンツアイテムと集積し、
    各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、一緒に表示された、前記画像と前記第1のコンテンツアイテムとの組合せの以前のユーザアクセスモードに基づいて計算される
    ことを特徴とする検索クエリに応答してコンテンツアイテムのために画像を選択するコンピュータ実施方法。
  8. 指令が記憶された非一時的な機械可読媒体であって、前記指令はプロセッサにより実行される際に、前記プロセッサに画像とコンテンツアイテムをマッチングする操作を実行させ、
    前記操作は、
    クライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、検索エンジンによりコンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別するステップと、
    画像選択モジュールにより画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して、1つまたは複数の画像のリストを識別するステップと、
    前記検索エンジンにより前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成するステップと、
    前記検索エンジンによりコンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させるステップと、を含み、
    ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有しており、
    前記操作は、
    前記画像のそれぞれに対して、前記第1のリストの第1のコンテンツアイテムに関連付けられたメタデータと前記画像に関連付けられたメタデータとに基づいて、前記画像と前記第1のコンテンツアイテムとの間のマッチングスコアを計算するステップと、
    前記画像と前記第1のコンテンツアイテムとの間の対応するマッチングスコアに基づいて前記画像のそれぞれをランキングするステップと、
    前記画像における、所定の閾値よりも大きいマッチングスコアを有する1つの画像を選択するステップと、をさらに含み、
    ここで、選択された画像は前記第1のコンテンツアイテムと集積し、
    各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、前記画像の画質またはスタイルに基づいて計算される
    ことを特徴とする非一時的な機械可読媒体。
  9. 前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積するステップにおいては、
    各コンテンツアイテムを前記画像における選択された1つの画像に重ね合わせて、前記コンテンツアイテムを前景に位置させて選択された画像を背景画像とするステップを含む
    ことを特徴とする請求項に記載の非一時的な機械可読媒体。
  10. 前記操作は、
    前記第1のリストにおける前記コンテンツアイテムのそれぞれに対して、
    マッチングスコアを反復的に計算し、
    前記マッチングスコアに基づいて前記画像のそれぞれをランキングし、
    前記マッチングスコアに基づいて前記画像の中の1つを選択するステップをさらに含む
    ことを特徴とする請求項に記載の非一時的な機械可読媒体。
  11. 前記操作は、
    前記第1のリストの複数のコンテンツアイテムに対して同じ画像を選択したかどうかを確定するステップと、
    所定のタイブレーク式を前記複数のコンテンツアイテムに関連付けられた画像のマッチングスコアに適用して、前記第1のリストの異なるコンテンツアイテムに対して異なる画像を選択するステップと、をさらに含む
    ことを特徴とする請求項1に記載の非一時的な機械可読媒体。
  12. 各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、前記第1のコンテンツアイテムと各画像との間の類似性に基づいて計算され、前記第1のコンテンツアイテムが前記画像により示された画像コンテンツを記述するかどうかを確定するステップを含む
    ことを特徴とする請求項に記載の非一時的な機械可読媒体。
  13. 指令が記憶された非一時的な機械可読媒体であって、前記指令はプロセッサにより実行される際に、前記プロセッサに画像とコンテンツアイテムをマッチングする操作を実行させ、
    前記操作は、
    クライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、検索エンジンによりコンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別するステップと、
    画像選択モジュールにより画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して、1つまたは複数の画像のリストを識別するステップと、
    前記検索エンジンにより前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成するステップと、
    前記検索エンジンによりコンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させるステップと、を含み、
    ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有しており、
    前記操作は、
    前記画像のそれぞれに対して、前記第1のリストの第1のコンテンツアイテムに関連付けられたメタデータと前記画像に関連付けられたメタデータとに基づいて、前記画像と前記第1のコンテンツアイテムとの間のマッチングスコアを計算するステップと、
    前記画像と前記第1のコンテンツアイテムとの間の対応するマッチングスコアに基づいて前記画像のそれぞれをランキングするステップと、
    前記画像における、所定の閾値よりも大きいマッチングスコアを有する1つの画像を選択するステップと、をさらに含み、
    ここで、選択された画像は前記第1のコンテンツアイテムと集積し、
    各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、前記画像の以前のユーザアクセスモードに基づいて計算される
    ことを特徴とする非一時的な機械可読媒体。
  14. 指令が記憶された非一時的な機械可読媒体であって、前記指令はプロセッサにより実行される際に、前記プロセッサに画像とコンテンツアイテムをマッチングする操作を実行させ、
    前記操作は、
    クライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、検索エンジンによりコンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別するステップと、
    画像選択モジュールにより画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して、1つまたは複数の画像のリストを識別するステップと、
    前記検索エンジンにより前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成するステップと、
    前記検索エンジンによりコンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させるステップと、を含み、
    ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有しており、
    前記操作は、
    前記画像のそれぞれに対して、前記第1のリストの第1のコンテンツアイテムに関連付けられたメタデータと前記画像に関連付けられたメタデータとに基づいて、前記画像と前記第1のコンテンツアイテムとの間のマッチングスコアを計算するステップと、
    前記画像と前記第1のコンテンツアイテムとの間の対応するマッチングスコアに基づいて前記画像のそれぞれをランキングするステップと、
    前記画像における、所定の閾値よりも大きいマッチングスコアを有する1つの画像を選択するステップと、をさらに含み、
    ここで、選択された画像は前記第1のコンテンツアイテムと集積し、
    各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、一緒に表示された、前記画像と前記第1のコンテンツアイテムとの組合せの以前のユーザアクセスモードに基づいて計算される
    ことを特徴とする非一時的な機械可読媒体。
  15. プロセッサと、
    クライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、コンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別する検索エンジンと、
    画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して1つまたは複数の画像のリストを識別する画像選択モジュールと、を備え、
    前記検索エンジンは、
    前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成し、
    コンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させて、
    ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有しており、
    前記画像選択モジュールは、
    前記画像のそれぞれに対して、前記第1のリストの第1のコンテンツアイテムに関連付けられたメタデータと前記画像に関連付けられたメタデータとに基づいて、前記画像と前記第1のコンテンツアイテムとの間のマッチングスコアを計算し、
    前記画像と前記第1のコンテンツアイテムとの間の対応するマッチングスコアに基づいて前記画像のそれぞれをランキングし、
    前記画像における、所定の閾値よりも大きいマッチングスコアを有する1つの画像を選択することに用いられるランキングモジュールを備え、
    ここで、選択された画像は前記第1のコンテンツアイテムと集積し、
    各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、前記画像の画質またはスタイルに基づいて計算される
    ことを特徴とするデータ処理システム。
  16. 前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積することは、
    各コンテンツアイテムを前記画像における選択された1つの画像に重ね合わせて、前記コンテンツアイテムを前景に位置させて選択された画像を背景画像とすることを含む
    ことを特徴とする請求項1に記載のシステム。
  17. 前記ランキングモジュールはさらに、
    前記第1のリストにおける前記コンテンツアイテムのそれぞれに対して、
    マッチングスコアを反復的に計算し、
    前記マッチングスコアに基づいて前記画像のそれぞれをランキングし、
    前記マッチングスコアに基づいて前記画像の中の1つを選択する
    ことを特徴とする請求項1に記載のシステム。
  18. 前記ランキングモジュールはさらに、
    前記第1のリストの複数のコンテンツアイテムに対して同じ画像を選択するかどうかを確定し、
    所定のタイブレーク式を前記複数のコンテンツアイテムに関連付けられた画像のマッチングスコアに適用して、前記第1のリストの異なるコンテンツアイテムに対して異なる画像を選択する
    ことを特徴とする請求項1に記載のシステム。
  19. 各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、前記第1のコンテンツアイテムと各画像との間の類似性に基づいて計算され、前記第1のコンテンツアイテムが前記画像により示された画像コンテンツを記述するかどうかを確定することを含む
    ことを特徴とする請求項1に記載のシステム。
  20. プロセッサと、
    クライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、コンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別する検索エンジンと、
    画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して1つまたは複数の画像のリストを識別する画像選択モジュールと、を備え、
    前記検索エンジンは、
    前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成し、
    コンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させて、
    ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有しており、
    前記画像選択モジュールは、
    前記画像のそれぞれに対して、前記第1のリストの第1のコンテンツアイテムに関連付けられたメタデータと前記画像に関連付けられたメタデータとに基づいて、前記画像と前記第1のコンテンツアイテムとの間のマッチングスコアを計算し、
    前記画像と前記第1のコンテンツアイテムとの間の対応するマッチングスコアに基づいて前記画像のそれぞれをランキングし、
    前記画像における、所定の閾値よりも大きいマッチングスコアを有する1つの画像を選択することに用いられるランキングモジュールを備え、
    ここで、選択された画像は前記第1のコンテンツアイテムと集積し、
    各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、前記画像の以前のユーザアクセスモードに基づいて計算される
    ことを特徴とするデータ処理システム。
  21. プロセッサと、
    クライアント装置から受信した、コンテンツを検索するための検索クエリに応答し、コンテンツデータベースにおいてまたはコンテンツサーバを経由して前記検索クエリの1つまたは複数の検索語に基づいて検索して、1つまたは複数のコンテンツアイテムの第1のリストを識別する検索エンジンと、
    画像メモリにおいて前記1つまたは複数の検索語に基づいて検索して1つまたは複数の画像のリストを識別する画像選択モジュールと、を備え、
    前記検索エンジンは、
    前記第1のリストの各コンテンツアイテムを前記画像の中の1つと集積し、これにより1つまたは複数のコンテンツアイテムの第2のリストを生成し、
    コンテンツアイテムの前記第2のリストを前記クライアント装置に送信し、前記第1のリストの各コンテンツアイテムと前記画像の中の1つとともに表示させて、
    ここで、前記1つまたは複数のコンテンツアイテムの第2のリストは、前記1つまたは複数のコンテンツアイテムの第2のリストに集積される前記画像の少なくとも一部を有しており、
    前記画像選択モジュールは、
    前記画像のそれぞれに対して、前記第1のリストの第1のコンテンツアイテムに関連付けられたメタデータと前記画像に関連付けられたメタデータとに基づいて、前記画像と前記第1のコンテンツアイテムとの間のマッチングスコアを計算し、
    前記画像と前記第1のコンテンツアイテムとの間の対応するマッチングスコアに基づいて前記画像のそれぞれをランキングし、
    前記画像における、所定の閾値よりも大きいマッチングスコアを有する1つの画像を選択することに用いられるランキングモジュールを備え、
    ここで、選択された画像は前記第1のコンテンツアイテムと集積し、
    各画像と前記第1のコンテンツアイテムとの間のマッチングスコアは、一緒に表示された、前記画像と前記第1のコンテンツアイテムとの組合せの以前のユーザアクセスモードに基づいて計算される
    ことを特徴とするデータ処理システム。
JP2016233359A 2016-03-01 2016-11-30 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法 Active JP6363682B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/058,020 US10235387B2 (en) 2016-03-01 2016-03-01 Method for selecting images for matching with content based on metadata of images and content in real-time in response to search queries
US15/058,020 2016-03-01

Publications (2)

Publication Number Publication Date
JP2017157193A JP2017157193A (ja) 2017-09-07
JP6363682B2 true JP6363682B2 (ja) 2018-07-25

Family

ID=59723589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016233359A Active JP6363682B2 (ja) 2016-03-01 2016-11-30 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法

Country Status (3)

Country Link
US (1) US10235387B2 (ja)
JP (1) JP6363682B2 (ja)
CN (1) CN107145497B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10185720B2 (en) 2016-05-10 2019-01-22 International Business Machines Corporation Rule generation in a data governance framework
KR20240054365A (ko) * 2017-12-28 2024-04-25 제트 인터미디에이트 글로벌 코포레이션 다중 프로필을 제공하는 방법 및 시스템
US10902052B2 (en) * 2018-03-26 2021-01-26 Microsoft Technology Licensing, Llc Search results through image attractiveness
KR20230003388A (ko) * 2018-06-21 2023-01-05 구글 엘엘씨 시각적 검색을 위한 디지털 보충물 연관 및 검색
US10878037B2 (en) 2018-06-21 2020-12-29 Google Llc Digital supplement association and retrieval for visual search
EP3819851A4 (en) * 2018-10-05 2021-08-11 Samsung Electronics Co., Ltd. ELECTRONIC DEVICE AND ITS CONTROL PROCESS
US11907280B2 (en) * 2020-11-05 2024-02-20 Adobe Inc. Text adjusted visual search

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3897494B2 (ja) 1999-08-31 2007-03-22 キヤノン株式会社 画像管理検索装置、画像管理検索方法及び記憶媒体
FR2801991B1 (fr) * 1999-12-03 2002-05-03 Canon Kk Procede et dispositif de recherche d'images basee sur le contenu prenant en compte le contenu de regions d'interet
AU2000238383A1 (en) * 2000-04-14 2001-10-30 Venture Matrix, Inc. Information providing system, information providing device, and terminal
JP4192703B2 (ja) * 2003-06-30 2008-12-10 日本電気株式会社 コンテンツ処理装置、コンテンツ処理方法及びプログラム
US8099263B2 (en) * 2003-12-30 2012-01-17 Vista Print Technologies Limited System and method for custom product design
JP2008165303A (ja) 2006-12-27 2008-07-17 Fujifilm Corp コンテンツ登録装置、及びコンテンツ登録方法、及びコンテンツ登録プログラム
JP5234730B2 (ja) 2007-11-05 2013-07-10 シャープ株式会社 電子機器、その制御方法およびコンピュータプログラム
CN101662454A (zh) 2008-08-29 2010-03-03 阿里巴巴集团控股有限公司 互联网中图像处理的方法、装置和系统
US20120158686A1 (en) 2010-12-17 2012-06-21 Microsoft Corporation Image Tag Refinement
US8935259B2 (en) 2011-06-20 2015-01-13 Google Inc Text suggestions for images
CN102999489B (zh) 2011-09-08 2016-08-03 腾讯科技(深圳)有限公司 一种社区网站页面的图片检索方法和系统
JP5831143B2 (ja) 2011-11-09 2015-12-09 日本電気株式会社 検索支援装置、検索支援方法および検索支援プログラム
US8548990B2 (en) * 2011-12-30 2013-10-01 Microsoft Corporation Presenting interactive images with search results
US9519661B2 (en) * 2012-04-17 2016-12-13 Excalibur Ip, Llc Method and system for updating a background picture of a web search results page for different search queries
JP5451810B2 (ja) 2012-04-18 2014-03-26 ヤフー株式会社 検索情報提供装置、検索情報提供方法および検索情報提供プログラム
US8996516B2 (en) 2013-01-02 2015-03-31 Google Inc. Adjacent search results exploration
US9292162B2 (en) 2013-04-08 2016-03-22 Art.Com Discovering and presenting décor harmonized with a décor style
US20160132931A1 (en) 2013-05-29 2016-05-12 Ron LEVINSON Method of associating advertisements to images
JP6027039B2 (ja) 2014-02-13 2016-11-16 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム
CN105183746B (zh) * 2015-07-08 2018-04-17 西安交通大学 从多相关图片中挖掘显著特征实现图像检索的方法
US20170147610A1 (en) 2015-11-24 2017-05-25 Via Capitale Image-based search engine
US20170185670A1 (en) 2015-12-28 2017-06-29 Google Inc. Generating labels for images associated with a user

Also Published As

Publication number Publication date
US20170255647A1 (en) 2017-09-07
JP2017157193A (ja) 2017-09-07
CN107145497B (zh) 2020-12-11
CN107145497A (zh) 2017-09-08
US10235387B2 (en) 2019-03-19

Similar Documents

Publication Publication Date Title
CN107145496B (zh) 基于关键词将图像与内容项目匹配的方法
JP6423845B2 (ja) 検索クエリに応答してコンテンツとマッチングしようとする画像を動的にランキングする方法及びシステム
JP6266080B2 (ja) 類似性スコアに基づきコンテンツアイテムと画像とのマッチングを評価する方法、およびシステム
CN107103016B (zh) 基于关键词表示使图像与内容匹配的方法
JP6363682B2 (ja) 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法
US10296535B2 (en) Method and system to randomize image matching to find best images to be matched with content items
JP6165955B1 (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
US10275472B2 (en) Method for categorizing images to be associated with content items based on keywords of search queries
US10496686B2 (en) Method and system for searching and identifying content items in response to a search query using a matched keyword whitelist
US11308154B2 (en) Method and system for dynamically overlay content provider information on images matched with content items in response to search queries
US10496698B2 (en) Method and system for determining image-based content styles

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171107

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180327

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180628

R150 Certificate of patent or registration of utility model

Ref document number: 6363682

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250