JP6759844B2 - 画像を施設に対して関連付けるシステム、方法、プログラム及び装置 - Google Patents
画像を施設に対して関連付けるシステム、方法、プログラム及び装置 Download PDFInfo
- Publication number
- JP6759844B2 JP6759844B2 JP2016160161A JP2016160161A JP6759844B2 JP 6759844 B2 JP6759844 B2 JP 6759844B2 JP 2016160161 A JP2016160161 A JP 2016160161A JP 2016160161 A JP2016160161 A JP 2016160161A JP 6759844 B2 JP6759844 B2 JP 6759844B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- business
- facility
- concept
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 127
- 230000000007 visual effect Effects 0.000 claims description 116
- 238000012552 review Methods 0.000 claims description 87
- 230000014509 gene expression Effects 0.000 claims description 61
- 230000008569 process Effects 0.000 claims description 41
- 238000004458 analytical method Methods 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 17
- 230000008447 perception Effects 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 39
- 238000013527 convolutional neural network Methods 0.000 description 36
- 238000012549 training Methods 0.000 description 21
- 238000004891 communication Methods 0.000 description 17
- 238000001514 detection method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000002790 cross-validation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 235000013353 coffee beverage Nutrition 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000015114 espresso Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 235000015220 hamburgers Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 235000013550 pizza Nutrition 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/587—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
- G06V20/36—Indoor scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
- G06V20/38—Outdoor scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Library & Information Science (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Description
オペレーティングシステム216。これは様々な基本システムのサービスを取り扱い、またハードウェアに依存するタスクの遂行のための手順を含んでいる。
通信モジュール218。これは1つ以上の通信ネットワークインタフェース204(有線又は無線)及び、インターネット、その他の広域ネットワーク、ローカルエリアネットワーク、大都市圏ネットワークなどの通信ネットワーク108を介して、サーバ200を他のコンピュータに接続するために利用される。
ユーザインタフェースモジュール220。これは1つ以上の入力装置210から入力を受信し、ディスプレイ装置208上にディスプレイするためのユーザインタフェース要素を生成する。
1つ以上のウェブサーバ110。これはクライアント装置102からリクエストを受信し、それぞれのウェブページ、リソース、又はリンクを返す。ある態様では、各リクエストはデータベース112に記録される。
データベースアクセスモジュール222。これはデータベース112に格納されているデータの読み出し、書き込み、及びクエリのための手順を含んでいる。
視覚検出器訓練モジュール114。これは、図4A〜図4C、図5、図6に関して後で述べるように、画像内のビジネス関連概念を検出するように1つ以上の視覚検出器224を訓練するために使用される。
1つ以上のデータベース112。これは視覚検出器訓練モジュール114及び/又は視覚検出器224によって使用されるデータを格納する。ある態様では、データベース112は、SQLデータベース等のリレーショナルデータベースである。一方、他の態様ではデータベース112は、JSONオブジェクト等のデータ構造のコレクション、又はリレーショナルデータベースと非リレーショナル形式で格納されたデータ構造との組合せを含む。ある態様では、データベースには次のものが格納される。
(a)多様な外部サービス(例えばYelp(登録商標)、フォースクエア(登録商標)等の、図1の外部サービス122)から収集される多様な施設に関するテキストレビュー228、及びビジネス関連概念を見つけ出し、視覚検出器を訓練するのに利用される他の情報。
(b)多様な外部サービス(例えばインスタグラム(登録商標)、フェースブック(登録商標)等の、図1の外部サービス122−1)から収集される多様な施設に関連する保存画像230、及びビジネス関連概念を見つけ出し、視覚検出器を訓練するのに利用される他の情報。
(c)テキストレビュー228及び/又は保存画像230の解析に基づいて見つけ出されるビジネス関連概念232(ある態様では、ビジネス関連概念232が、施設の認識の目的で使用可能なビジネス関連性があり、視覚的に検出可能であり、弁別可能な用語である(すなわち、個々のビジネス関連概念232のそれぞれが、少なくとも画像内に個々のビジネス関連概念を信頼性良く検出できる等、視覚検出器を訓練可能である)ことを確実とするために、見つけ出された各ビジネス関連概念232がビジネス関連概念に対する予め定められた仕様に合致していることの検証に保存画像230が利用される。)
(d)生成されたクエリ画像と施設238の表現。これは図4A〜図4C、図5、図6を参照して後で詳細を説明するように、個々のクエリ画像に対して最も類似した施設を配置するために利用される。
視覚検出器224を利用して画像内に(例えば、まだ施設に関連付けられていないクエリ画像内、及び/又は既に施設に関連付けられている保存画像230内に)ビジネス関連概念を識別するための、概念検出モジュール234:ある態様では、概念検出モジュール234は画像を受信した後、各ビジネス関連概念が画像内に存在する尤度を特定する、各ビジネス関連概念に対する(例えばビジネス関連概念232の)スコアのベクトルを生成する。
クエリ画像と施設238の形成された表現を作成/生成/形成するための表現形成モジュール236(例えば、ビジネス関連概念のスコアのベクトルと単語表現を含む)。
オペレーティングシステム316。これは様々な基本システムのサービスを取り扱い、またハードウェアに依存するタスクの遂行のための手順を含んでいる。
通信モジュール318。これは1つ以上の通信ネットワークインタフェース304(有線又は無線)及び、インターネット、その他の広域ネットワーク、ローカルエリアネットワーク、大都市圏ネットワークなどの通信ネットワーク108を介して、クライアント装置102を他のコンピュータと装置に接続するために利用される。
ディスプレイモジュール320。これは1つ以上の入力装置310から入力を受信し、ディスプレイ装置308上にディスプレイするためのユーザインタフェース要素を生成する。
1つ以上のユーザ入力または1つ以上の入力装置310からのインタラクションを検出し、検出された入力またはインタラクションを解釈するための、入力処理モジュール322。
ユーザがネットワーク108(インターネットなど)を介してリモートコンピュータ又は装置と通信可能となるウェブブラウザ324。
クライアント装置102で実行するように構成された、1つ以上のアプリケーション326−1〜326−u。様々な態様において、アプリケーション326には、カメラモジュール、センサモジュール、1つ以上のゲーム、アプリケーション市場、支払いプラットフォーム、及び/又はソーシャルネットワークプラットフォームが含まれる。ある態様では、1つ以上のアプリケーション326がウェブブラウザ324内で動作する。ある態様では1つ以上のアプリケーションに、装置102のユーザが(例えば、図4A〜図4C、図5、及び図6を参照して後で説明する等、任意の方法を利用して)関連する施設の処理と識別のために画像の投入を可能とするアプリケーションが含まれている。
装置102又は装置102のユーザ106に関する情報を含む、クライアントデータ328。ある態様では、クライアントデータ328には1つ以上のユーザプロファイル330が含まれ、これには装置102のユーザが訪問したことのある施設に関するユーザ固有の情報が含まれ得る。これを利用してクエリ画像に関連する施設の識別に対する支援(例えば候補施設のリストの精選/選択支援)が可能となる。ある態様では、クライアントデータ328には、クライアント装置でのユーザアクティビティを記録するユーザデータが含まれる。
任意選択で概念検出モジュール234が含まれる。これは視覚検出器224を利用して(例えば、サーバ200や1つ以上の視覚検出器224から受信した後、クライアント装置は検出プロセスをローカルに実行可能である)、画像(例えばまだ施設に関連付けられていないクエリ画像、及び/又は既に施設に関連付けられている保存画像230)の中にビジネス関連概念を識別するためのものである。ある態様では、概念検出モジュール234が(例えば装置のユーザから)画像を受信した後、個々のビジネス関連概念が画像内に存在する尤度を特定する、(例えば、複数のビジネス関連概念232の内の)各ビジネス関連概念に対するスコアのベクトルを作成する。
任意選択により、クエリ画像と施設238の形成された表現(例えば、ビジネス関連概念のスコアのベクトルと単語表現を含む)を作成/生成/形成するための表現形成モジュール236を含む。
任意選択により、データベース112(図2)に保存されたデータのすべて又は一部を保存するための1つ以上のデータベース338を含む。例えばネットワークのトラフィック状態が遅いとき、ネットワークを介して1つ以上のサーバ200と情報を交換する場合よりもより効率的にデータをローカルに保存及びアクセスすることができる。
102−r クライアント
104 サーバシステム
108 通信ネットワーク
110 ウェブサーバ
112 データベース
114 視覚検出器訓練モジュール
122−1 外部サービス
122−n 外部サービス
Claims (20)
- 画像を施設に関連付ける方法であって、ディスプレイと、1つ以上の入力装置と、1つ以上のプロセッサと、メモリを有するコンピュータが、
特定の地理領域に関連する第1の画像を、前記1つ以上の入力装置を介して受信し、
複数の施設に関するテキスト形式のレビューと保存画像とを含むリポジトリから、前記複数の施設の内の1つ以上の候補施設に関連するテキストレビューの第1の集合と保存画像の第2の集合とを引き出し、前記1つ以上の候補施設の各施設は、前記特定の地理領域の予め定められた距離内にあり、
訓練された視覚検出器を用いた前記第1の画像の解析に基づいて、前記第1の画像内に複数のビジネス関連概念を検出し、検出された各ビジネス関連概念は、前記検出されたビジネス関連概念が前記第1の画像内に存在する尤度を反映するスコアに関連付けられ、
前記スコアに基づき、また前記複数のビジネス関連概念の中の高スコアのビジネス関連概念に対する1つ以上の単語表現に基づいて、前記第1の画像に対応する第1の表現を生成し、
前記1つ以上の候補施設のそれぞれに対応する第2の表現を受信し、前記第2の表現はテキストレビューの前記第1の集合と保存画像の前記第2の集合とに基づいており、
前記第1の表現が第1の候補施設の第2の表現のそれぞれに最も類似していることを判定することに従って、(i)前記第1の画像を前記第1の候補施設に関連付け、(ii)前記第1の画像が前記第1の候補施設に関連付けられていることの指示を与える、
方法。 - 前記コンピュータが、前記第2の表現を受信する場合に、前記訓練された視覚検出器を用いて保存画像の第2の集合の各保存画像の解析に基づいて、各保存画像内に前記複数のビジネス関連概念を検出し、
検出された各ビジネス関連概念は、前記検出されたビジネス関連概念が前記各保存画像内に存在する尤度を反映するスコアに関連付けられ、
さらに、第1の候補施設の第2の表現のそれぞれが、(i)0以上の関連スコアと、(ii)前記第1の候補施設に関連する各テキストレビューに対する1つ以上の単語表現とに基づいている、請求項1に記載の方法。 - 前記複数のビジネス関連概念の各概念は、(i)各概念はビジネス関連であり、(ii)各概念は視覚的に一貫しており、(iii)各概念は施設の認識に関して弁別可能である、という条件を満たしている、請求項1または請求項2に記載の方法。
- 前記複数のビジネス関連概念は、前記ビジネス関連概念を識別するために施設に関連するテキストと画像を探索することによって識別される、請求項1〜請求項3の何れか1項に記載の方法。
- 前記訓練された視覚検出器は前記複数のビジネス関連概念に関連する画像を利用し、かつクエリ画像の視覚概念を1つ以上の前記ビジネス関連概念に合致させるように構成された視覚概念検出器を構築することによって訓練される、請求項1〜請求項4の何れか1項に記載の方法。
- 前記訓練された視覚検出器は、前記第1の画像を受信する前に訓練される、請求項5に記載の方法。
- 前記第1の画像を前記第1の候補施設に関連付ける前には、前記リポジトリには前記第1の候補施設に関連する画像が含まれていない、請求項1〜請求項6の何れか1項に記載の方法。
- 与えられる指示には、前記第1の画像が前記第1の候補施設において撮影されたことを示すテキスト記述のついた視覚指示が含まれる、請求項1〜請求項7の何れか1項に記載の方法。
- 前記第1の表現が第1の候補施設のそれぞれの第2の表現に最も類似していることを判定するステップは、前記第2の表現のそれぞれが前記複数のビジネス関連概念の多次元空間における前記第1の表現に最も近いことを判定すること含む、請求項1〜請求項8の何れか1項に記載の方法。
- 前記第1の画像を受信する前に、前記複数のビジネス関連概念が前記施設に関連する画像とテキストレビューを解析することにより識別されて、以下の条件、(i)各概念はビジネス関連性がある、(ii)各概念は視覚的に一貫している、(iii)各概念は施設の認識に関して弁別可能である、を満たす概念が配置される、請求項1〜請求項9の何れか1項に記載の方法。
- 前記第1の画像を前記第1の候補施設に関連付けるステップが、前記第1の画像を前記リポジトリ内に保存するために送信することを含む、請求項1〜請求項10の何れか1項に記載の方法。
- 前記受信した第1の画像は室内環境で撮影された画像に対応する、請求項1〜請求項11の何れか1項に記載の方法。
- 前記受信した第1の画像は室外環境で撮影された画像に対応する、請求項1〜請求項12の何れか1項に記載の方法。
- 前記特定の地理領域は、前記第1の画像が撮影された地点の近似座標に関連づけられる、請求項1〜請求項13の何れか1項に記載の方法。
- 前記特定の地理領域は、前記第1の画像が撮影されたときに前記コンピュータによって検出されたWi−Fi信号に基づいて判定される、請求項1〜請求項14の何れか1項に記載の方法。
- 前記第1の表現は、前記第1の画像の多モード表現である、請求項1〜請求項15の何れか1項に記載の方法。
- 前記高スコアのビジネス関連概念は、スコア閾値を超える指定スコアに関連付けされる、請求項1〜請求項16の何れか1項に記載の方法。
- 前記複数の施設に関連するテキストレビュー及び保存画像の前記リポジトリは、前記コンピュータから遠隔地にあるサーバシステムに保持される、請求項1〜請求項17の何れか1項に記載の方法。
- ディスプレイと1つ以上の入力装置と1つ以上のプロセッサとメモリとを有するコンピュータによって実行されるプログラムであって、前記コンピュータに、
特定の地理領域に関連する第1の画像を、前記1つ以上の入力装置を介して受信し、
複数の施設に関連するテキスト形式のレビューと保存画像のリポジトリから、前記複数の施設の内の1つ以上の候補施設に関連するテキストレビューの第1の集合と保存画像の第2の集合とを引き出し、前記1つ以上の候補施設の各施設は、前記特定の地理領域の予め定められた距離内にあり、
訓練された視覚検出器を用いた前記第1の画像の解析に基づいて、前記第1の画像内に複数のビジネス関連概念を検出し、検出された各ビジネス関連概念は、前記検出されたビジネス関連概念が前記第1の画像内に存在する尤度を反映するスコアに関連付けられ、
前記スコアに基づき、また前記複数のビジネス関連概念の中の高スコアのビジネス関連概念に対する1つ以上の単語表現に基づいて、前記第1の画像に対応する第1の表現を生成し、
前記1つ以上の候補施設のそれぞれに対応する第2の表現を受信し、前記第2の表現はテキストレビューの前記第1の集合と保存画像の前記第2の集合とに基づいており、
前記第1の表現が第1の候補施設の第2の表現のそれぞれに最も類似していることを判定することに従って、(i)前記第1の画像を前記第1の候補施設に関連付け、(ii)前記第1の画像が前記第1の候補施設に関連付けられていることの指示を与える、処理を実行させる命令を含んでいる、
プログラム。 - ディスプレイと、
1つ以上の入力装置と、
1つ以上のプロセッサと、
メモリと、
1つ以上のプログラムと、
を備える装置であって、
前記1つ以上のプログラムは前記メモリ内に格納されて前記1つ以上のプロセッサによって実行されるように構成されており、前記1つ以上のプログラムには、
特定の地理領域に関連する第1の画像を、前記1つ以上の入力装置を介して受信し、
複数の施設に関連するテキストレビューと保存画像のリポジトリから、前記複数の施設の1つ以上の候補施設に関連するテキストレビューの第1の集合と保存画像の第2の集合とを引き出し、前記1つ以上の候補施設の各施設は、前記特定の地理領域の予め定められた距離内に位置し、
訓練された視覚検出器を用いた前記第1の画像の解析に基づいて、前記第1の画像内に複数のビジネス関連概念を検出し、検出された各ビジネス関連概念のそれぞれは、前記検出されたビジネス関連概念が前記第1の画像内に存在する尤度を反映するスコアに関連付けられ、
前記スコアに基づき、また前記複数のビジネス関連概念の中の高スコアのビジネス関連概念に対する1つ以上の単語表現に基づいて、前記第1の画像に対応する第1の表現を生成し、
前記1つ以上の候補施設のそれぞれに対応する第2の表現を受信し、前記第2の表現はテキストレビューの前記第1の集合と保存画像の前記第2の集合とに基づいており、
前記第1の表現が第1の候補施設の第2の表現のそれぞれに最も類似していることを判定することに従って、(i)前記第1の画像を前記第1の候補施設に関連付け、(ii)前記第1の画像が前記第1の候補施設に関連付けられていることの指示を与える、ための命令が含まれている
装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/001,130 | 2016-01-19 | ||
US15/001,130 US10198635B2 (en) | 2016-01-19 | 2016-01-19 | Systems and methods for associating an image with a business venue by using visually-relevant and business-aware semantics |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017130182A JP2017130182A (ja) | 2017-07-27 |
JP6759844B2 true JP6759844B2 (ja) | 2020-09-23 |
Family
ID=59314377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016160161A Active JP6759844B2 (ja) | 2016-01-19 | 2016-08-17 | 画像を施設に対して関連付けるシステム、方法、プログラム及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10198635B2 (ja) |
JP (1) | JP6759844B2 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL236598A0 (en) * | 2015-01-05 | 2015-05-31 | Superfish Ltd | Image similarity as a function of image weighted image descriptors generated from neural networks |
US10055489B2 (en) * | 2016-02-08 | 2018-08-21 | Ebay Inc. | System and method for content-based media analysis |
WO2018033156A1 (zh) * | 2016-08-19 | 2018-02-22 | 北京市商汤科技开发有限公司 | 视频图像的处理方法、装置和电子设备 |
US20180089316A1 (en) * | 2016-09-26 | 2018-03-29 | Twiggle Ltd. | Seamless integration of modules for search enhancement |
US10067965B2 (en) | 2016-09-26 | 2018-09-04 | Twiggle Ltd. | Hierarchic model and natural language analyzer |
US10515289B2 (en) * | 2017-01-09 | 2019-12-24 | Qualcomm Incorporated | System and method of generating a semantic representation of a target image for an image processing operation |
JP6890720B2 (ja) * | 2017-06-16 | 2021-06-18 | マーカブル インコーポレイテッドMarkable,Inc. | 画像処理システム |
CN117744654A (zh) | 2017-07-26 | 2024-03-22 | 舒辅医疗 | 基于机器学习的自然语言情境中数值数据的语义分类方法以及系统 |
CN108170712B (zh) * | 2017-11-29 | 2021-08-10 | 浙江大学 | 一种利用包含社会地理信息的多媒体网络学习最大边界多媒体网络表达的方法 |
US11290530B2 (en) * | 2018-06-01 | 2022-03-29 | Apple Inc. | Customizable, pull-based asset transfer requests using object models |
US11164026B2 (en) | 2018-10-16 | 2021-11-02 | International Business Machines Corporation | Graphical user interface generation based on image analysis |
US11495041B2 (en) * | 2019-03-29 | 2022-11-08 | Jumio Corporation | Biometric identification using composite hand images |
US11553026B2 (en) * | 2019-05-27 | 2023-01-10 | International Business Machines Corporation | Regulating content associated with a streaming platform |
US11842299B2 (en) * | 2020-01-14 | 2023-12-12 | Dell Products L.P. | System and method using deep learning machine vision to conduct product positioning analyses |
JP2021165886A (ja) * | 2020-04-06 | 2021-10-14 | トヨタ自動車株式会社 | 制御装置、制御装置のプログラム、及び端末装置のプログラム |
JP7556700B2 (ja) | 2020-05-08 | 2024-09-26 | 株式会社日立製作所 | 計算機、ラベルの推定方法、及びモデルの学習方法 |
CN112597695B (zh) * | 2020-12-03 | 2022-05-03 | 浙江大学 | 一种基于感知特征聚类的计算机辅助设计方法及系统 |
CN113065012B (zh) * | 2021-03-17 | 2022-04-22 | 山东省人工智能研究院 | 一种基于多模态动态交互机制的图文解析方法 |
CN115718868A (zh) * | 2021-08-23 | 2023-02-28 | 华为技术有限公司 | 模型训练方法、装置及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005108230A (ja) * | 2003-09-25 | 2005-04-21 | Ricoh Co Ltd | オーディオ/ビデオコンテンツ認識・処理機能内蔵印刷システム |
CN102348050A (zh) * | 2010-08-03 | 2012-02-08 | 国基电子(上海)有限公司 | 数码照相设备及其获取地理标签的方法 |
US20170109615A1 (en) * | 2015-10-16 | 2017-04-20 | Google Inc. | Systems and Methods for Automatically Classifying Businesses from Images |
-
2016
- 2016-01-19 US US15/001,130 patent/US10198635B2/en active Active
- 2016-08-17 JP JP2016160161A patent/JP6759844B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20170206416A1 (en) | 2017-07-20 |
US10198635B2 (en) | 2019-02-05 |
JP2017130182A (ja) | 2017-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6759844B2 (ja) | 画像を施設に対して関連付けるシステム、方法、プログラム及び装置 | |
JP6575335B2 (ja) | ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法、コンピュータシステム、及びプログラム | |
US10599731B2 (en) | Method and system of determining categories associated with keywords using a trained model | |
US10395179B2 (en) | Methods and systems of venue inference for social messages | |
US20200089769A1 (en) | Consumer Insights Analysis Using Word Embeddings | |
US20180060353A1 (en) | System and method for predicting a geographic origin of content and accuracy of geotags related to content obtained from social media and other content providers | |
CN104699732B (zh) | 形成用户简档的方法和信息处理设备 | |
US11182806B1 (en) | Consumer insights analysis by identifying a similarity in public sentiments for a pair of entities | |
CN108701155B (zh) | 社交网络中的专家检测 | |
US20170300862A1 (en) | Machine learning algorithm for classifying companies into industries | |
JP6109970B2 (ja) | オンライン・ソーシャル・ネットワーク上での画像に対するタグ付けの提案 | |
US10509863B1 (en) | Consumer insights analysis using word embeddings | |
CN105874452B (zh) | 从社交摘要中标记兴趣点 | |
US11082800B2 (en) | Method and system for determining an occurrence of a visit to a venue by a user | |
Kordopatis-Zilos et al. | Geotagging text content with language models and feature mining | |
CN110622153A (zh) | 用于查询分割的方法和系统 | |
US10803248B1 (en) | Consumer insights analysis using word embeddings | |
WO2017016122A1 (zh) | 一种信息推送方法及装置 | |
US11030539B1 (en) | Consumer insights analysis using word embeddings | |
JP2023162232A (ja) | 視覚検索クエリのためのインテリジェントなシステムおよび方法 | |
US12086543B2 (en) | Rule-based machine learning classifier creation and tracking platform for feedback text analysis | |
US20210176181A1 (en) | Intelligent Conversion of Internet Domain Names to Vector Embeddings | |
US11651280B2 (en) | Recording medium, information processing system, and information processing method | |
KR20210120203A (ko) | 웹 페이지에 기반한 메타데이터 생성방법 | |
US11868358B1 (en) | Contextualized novelty for personalized discovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190610 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200817 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6759844 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |