[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2021170391A - 商品案内方法、装置、デバイス、記憶媒体、及びプログラム - Google Patents

商品案内方法、装置、デバイス、記憶媒体、及びプログラム Download PDF

Info

Publication number
JP2021170391A
JP2021170391A JP2021121060A JP2021121060A JP2021170391A JP 2021170391 A JP2021170391 A JP 2021170391A JP 2021121060 A JP2021121060 A JP 2021121060A JP 2021121060 A JP2021121060 A JP 2021121060A JP 2021170391 A JP2021170391 A JP 2021170391A
Authority
JP
Japan
Prior art keywords
image
product
character
posture
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021121060A
Other languages
English (en)
Other versions
JP7168837B2 (ja
Inventor
チャン ミャオ
Miao Zhang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021170391A publication Critical patent/JP2021170391A/ja
Application granted granted Critical
Publication of JP7168837B2 publication Critical patent/JP7168837B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • G06Q30/0643Graphical representation of items or shoppers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】人工知能画像処理技術に基づいて商品を推薦する商品案内方法、装置、デバイス、コンピュータ可読記憶媒体及びプログラムを提供する。【解決手段】商品案内方法は、第1の画像におけるキャラクタの身分情報を識別しS101、第1の画像におけるキャラクタに対して姿勢識別を行い、姿勢情報を得てS102、第1の画像におけるキャラクタの姿勢情報と、予め記憶されている複数の商品画像における同一のキャラクタの姿勢情報とをマッチングし、マッチングに成功した商品画像を第1の画像の推薦商品画像として決定するS103。第1の画像の範囲内又は周辺領域において商品案内標識を表示しS104、商品案内標識がトリガされた後、第1の画像を前記推薦商品画像に切り替えるS105。【選択図】図1

Description

本開示は、人工知能画像処理技術分野に関し、具体的に画像処理に基づく商品推薦技術に関し、さらに具体的に商品案内方法、装置、デバイス、コンピュータ可読記憶媒体、及びプログラムに関する。
通常、ユーザは画像をアップロードして画像識別を行った後、画像の内容に関するより多くの情報を得ることを希望する。例えば、画像が建築物である場合、該建築物の名称、住所などの情報を得ることを希望し、画像が動植物である場合、該動植物の名称、概要などの情報を得ることを希望し、画像が物品である場合、該物品の用途概要を得ること等を希望する。また、現在はさらに、画像識別結果ページにて商品推薦情報を追加することができ、ユーザはエンティティに関連する商品を容易に閲覧することができ、商品推薦の目的を達成することができる。例えば、画像のエンティティがアニメ・漫画キャラクタである場合、画像識別結果において該アニメ・漫画キャラクタの画像、プロフィール、画像の出所、類似画像などを提示するほか、ページに商品推薦アイコンを追加し、ユーザが商品推薦アイコンをクリックした後該アニメ・漫画キャラクタに関連する商品リストを表示することもできる。しかし、このような商品推薦の方法は比較的通常であるため、ユーザが関連商品を理解しようとするための操作を実行するよう引き付けることは、ますます困難になっており、商品推薦の効果は良くない。
本開示は、商品案内方法、装置、デバイス、及びコンピュータ可読記憶媒体を提供し、個性的な商品案内方法を通して、ある程度商品推薦の成果を向上することができる。
本開示の第1態様において、商品案内方法を提供し、該方法は、第1の画像におけるキャラクタの身分情報を識別することと、第1の画像におけるキャラクタに対して姿勢識別を行い、姿勢情報を得ることと、第1の画像におけるキャラクタの姿勢情報と、予め記憶されている複数の商品画像における同一のキャラクタの姿勢情報とをマッチングし、マッチングに成功した商品画像を第1の画像の推薦商品画像として決定することと、第1の画像の範囲内又は周辺領域において商品案内標識を表示することと、商品案内標識がトリガされた後、第1の画像を推薦商品画像に切り替えることと、を含む。
本開示の第2様態において、商品案内装置を提供し、該装置は、第1の画像におけるキャラクタの身分情報を識別するための画像識別モジュールと、第1の画像におけるキャラクタに対して姿勢識別を行い、姿勢情報を得るための姿勢識別モジュールと、第1の画像におけるキャラクタの姿勢情報と、予め記憶されている複数の商品画像における同一のキャラクタの姿勢情報とをマッチングし、マッチングに成功した商品画像を第1の画像の推薦商品画像として決定するためのマッチング処理モジュールと、第1の画像の範囲内又は周辺領域において商品案内標識を表示するための案内標識表示モジュールと、商品案内標識がトリガされた後、第1の画像を推薦商品画像に切り替えるための画像切り替えモジュールと、を備える。
本開示の第3様態において、電子デバイスをさらに提供し、該電子デバイスは、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに通信接続されるメモリと、を備え、メモリには、少なくとも1つのプロセッサにより実行可能な命令が記憶されており、命令は、少なくとも1つのプロセッサにより実行される場合、本開示の実施形態の任意の商品案内方法を実行させることを特徴とする。
本開示の第4様態において、コンピュータ命令を記憶した非一過性のコンピュータ可読記憶媒体をさらに提供し、該コンピュータ命令を記憶した非一過性のコンピュータ可読記憶媒体は、本開示の実施形態の任意の商品案内方法をコンピュータに実行させる。
本開示の実施形態により、例えば人体姿勢識別モデルに基づいて、推薦する商品画像をフィルタリングすることを提案し、姿勢識別とマッチングした後のキャラクタは、ユーザが関心を示すキャラクタと類似性の高い姿勢を有するため、ユーザの画像を推薦商品画像に切り替える際に、類似性の高い姿勢の商品をユーザに推薦することができ、ユーザの関心をより高め、ユーザが推薦商品を選択する確率を向上し、商品推薦の効果を強めることができる。
ここに記載された内容は、本開示の実施形態のキーポイント又は重要な特徴を記述することを意図せず、また、本開示の範囲を制限することにも用いられないことを理解すべきである。本開示の他の特徴については、下記の明細書を通して説明を促す。
本開示の1つの実施形態による商品案内方法のフローチャートである。 本開示の1つの実施形態による商品画像データ事前処理のフローチャートである。 通常の画像に基づいて商品を推薦する表示ページの効果図である。 図3における商品案内アイコンをクリックした後に現れる商品推薦ページの効果図である。 本開示の1つの実施形態によるオフライン処理とオンライン処理の論理アーキテクチャのブロック図である。 本開示の1つの実施形態による2人のアニメ・漫画キャラクタの画像保存リストの概略図である。 図6の実施形態における2人のアニメ・漫画キャラクタの姿勢データの概略図である。 本開示の1つの実施形態によるアニメ・漫画キャラクタの予め記憶されている姿勢データのリストの概略図である。 本開示の1つの実施形態による画像に基づいて商品案内を表示する必要があるか否かを判断するフローチャートである。 本開示の1つの実施形態による画像識別結果ページにおける案内提示の概略図である。 本開示の1つの実施形態による切り替えプロセスにおける複数のキーマップの効果概略図である。 本開示の1つの実施形態による処理の画像識別画像と推薦商品画像との対比効果図である。 本開示の1つの実施形態による商品案内装置の構成ブロック図である。 本開示の1つの実施形態による商品案内方法を実現するための電子デバイスのブロック図である。
上記の図面は、よりよく本開示を理解させるためのものであり、本開示を限定するものではない。
以下において、本開示の例示的な実施形態を、理解を容易にするために本開示の実施形態の様々な詳細を含む添付の図面に関連して説明するが、これらは単に例示的なものであると考えるべきである。したがって、当業者は、本開示の範囲及び精神を逸脱することなく、本明細書に記載された実施形態に様々な変更及び修正を加えることができることを認識すべきである。同様に、以下の説明では、周知の機能及び構成については、明確化及び簡明化のために説明を省略する。
図1は、本開示の1つの実施形態による商品案内方法のフローチャートであり、該方法は以下を含む。
S101において、第1の画像におけるキャラクタの身分情報を識別する。
S102において、第1の画像におけるキャラクタに対して姿勢識別を行い、姿勢情報を得る。
S103において、第1の画像におけるキャラクタの姿勢情報と、予め記憶されている複数の商品画像における同一のキャラクタの姿勢情報とをマッチングし、マッチングに成功した商品画像を第1の画像の推薦商品画像として決定する。
S104において、第1の画像の範囲内又は周辺領域において商品案内標識を表示する。
S105において、商品案内標識がトリガされた後、第1の画像を推薦商品画像に切り替える。
本開示の実施形態によれば、例えばユーザが入力した識別されるべき画像を受信した後、画像にキャラクタ(例えば、カートゥーンキャラクタ、アニメキャラクタ、漫画キャラクタ又は映画・テレビ作品キャラクタ)が含まれている場合、本開示の実施形態では、画像におけるキャラクタの身分情報(例えば、名前、キャラクタプロフィール、キャラクタ作品など)を取得するため、画像におけるキャラクタに対して身分識別を行い、さらに、画像におけるキャラクタの姿勢情報(例えば、立っている、座っている姿、両腕を落としている、左腕を上げて右腕を落としている、など)を取得するため、画像におけるキャラクタに対して姿勢識別を行う必要がある。そして、識別された身分情報と姿勢情報とに基づいて、データベースに予め記憶されている商品画像の資料情報とのマッチング(また、比較ともいう)を行う。例えば、ユーザの画像から識別されたキャラクタの身分は、「第1のカートゥーンキャラクタ」(例えば、ドナルドダック)であり、識別された該第1のカートゥーンキャラクタの姿勢情報は、「左腕を上げて右腕を落としている」であり、人物がマッチングする時、データベースから該第1のカートゥーンキャラクタの全商品画像をフィルタリングすることができ、さらにその中から、姿勢が「左腕を上げて右腕を落としている」である商品画像をフィルタリングし、該商品画像をユーザに推薦する商品画像とする。ここで、推薦した商品画像は、キャラクタ姿勢のマッチングプロセスを通しているため、推薦商品画像における第1のカートゥーンキャラクタは、ユーザの画像における第1のカートゥーンキャラクタと類似性の高い姿勢を有しており、姿勢類似性の高い商品をユーザに推薦したり、ユーザの関心をより高め、推奨効果を強めることができ、かつユーザの画像を推薦商品画像に切り替える商品案内方法を設計しているため、実際の応用における視覚効果から見ると、2つの画像におけるキャラクタ姿勢は類似しているため、この切り替えは視覚的にインパクトを与えることができる。例えば、ユーザの画像が2次元の2Dキャラクタであり、推薦商品画像が3次元の3Dキャラクタである場合、ユーザのワンタッチ切り替えの効果は、2Dキャラクタから3Dキャラクタ(キャラクタ姿勢は類似している)への変化であり、このような視覚感覚はユーザの関心度を高め、ユーザが推薦商品を選択する確率を高めることができる。
本開示の実施形態において言及される「キャラクタ」は、人間のキャラクタイメージ(例えば、エルサ姫)であってもよく、動物のキャラクタイメージ(例えば、ペッパピッグ)であってもよく、このようなアニメ・漫画又はカートゥーンイメージであってもよく、例えば「動物の世界」に登場する動物のような現実に近い状態のイメージであってもよい。本文では、説明の便宜上、上記の複数の対象を総称して「キャラクタ」と呼び、キャラクタイメージ及び動物イメージのうち少なくとも1つと捉えることができる。
本開示の実施形態において、オプションとして、ユーザの画像におけるキャラクタと推薦商品画像におけるキャラクタ間のマッチング度合いであるマッチング条件を実際の需要に応じて設定することができる。いくつかの実施形態において、キャラクタの上肢姿勢及び下肢姿勢のうち少なくとも1つを考慮してもよく、他の実施形態においてさらに、頭部姿勢などを考慮してもよく、動物イメージに対して、四肢の姿勢などを考慮してもよい。マッチングする場合、完全マッチング(例えば、上肢姿勢と下肢姿勢とのいずれも一致する)と設定してもよく、又は部分マッチング(例えば、上肢姿勢あるいは下肢姿勢が一致する)と設定してもよく、具体的に、次のいずれかの方法を使用することができる。
第1の画像におけるキャラクタの姿勢情報は、キャラクタの上肢姿勢を含み、マッチングに成功した商品画像は、第1の画像におけるキャラクタの上肢姿勢と一致する商品画像を含む。
第1の画像におけるキャラクタの姿勢情報は、キャラクタの下肢姿勢を含み、マッチングに成功した商品画像は、第1の画像におけるキャラクタの下肢姿勢と一致する商品画像を含む。
第1の画像におけるキャラクタの姿勢情報は、キャラクタの上肢姿勢と下肢姿勢とを含み、マッチングに成功した商品画像は、第1の画像におけるキャラクタの上肢姿勢及び下肢姿勢のうち少なくとも1つと一致する商品画像を含む。
これにより、前期に商品画像におけるキャラクタに対して姿勢識別を行うとき、キャラクタ姿勢データの一部又は全部を識別し、マッチングフィルタリングに用いることができる。オプションとして、前期に商品画像におけるキャラクタの姿勢データを可能な限り詳細かつ包括的に識別し、後期にユーザの画像におけるキャラクタの姿勢データを用いてマッチングを行うとき、操作者は、異なる精度要求に応じて異なるマッチング条件を設定することができ、姿勢データの一致度合いが高いほどマッチング度が高く、最終的に決定された推薦商品画像とユーザの画像におけるキャラクタとの類似度は高い。
本開示の実施形態において、オプションとして、商品案内標識がトリガされた後、第1の画像を推薦商品画像に切り替えることは、以下のいずれかの方法を用いて実現されてもよい。
商品案内標識がトリガされた後の第1の予めに設定された時間内に、第1の画像を推薦商品画像に直接切り替える。
商品案内標識がトリガされた後の第2の予めに設定された時間内に、第1の画像を推薦商品画像に段階的に切り替える。
ユーザ画像を推薦商品画像へ切り替えることは、実際の応用における視覚的効果から見て、両画像におけるキャラクタ姿勢が類似しているため、視覚的にインパクトを与えることができ、このような視覚感覚はよりユーザの関心度を高め、ユーザが推薦商品を選択する確率を高めることができる。
本開示の実施形態において、オプションとして、図2を参照して、第1の画像に対して画像識別処理を行う前に、商品画像データに対して予め処理を行う。具体的に、以下を含むことができる。
S201において、キャラクタに基づいて作成された商品を含む商品画像を収集する。
S202において、収集された商品画像におけるキャラクタに対して身分識別を行い、各商品画像におけるキャラクタの身分情報を得る。
S203において、収集された商品画像におけるキャラクタに対して姿勢識別を行い、各商品画像におけるキャラクタの姿勢情報を得る。
S204において、収集された商品画像と、各商品画像におけるキャラクタの身分情報と、各商品画像におけるキャラクタの姿勢情報とをデータベースに記憶する。
上記の処理により、推薦されるべき商品の画像リソースを大量に取得することができ、画像には少なくとも1つのキャラクタが含まれているべきであり、画像におけるキャラクタに対して身分識別及び姿勢識別を行う必要がある。例えば、身分識別と人体姿勢識別のニューラルネットワークモデル(2つのモデルであってもよいし、身分識別能力及び人体姿勢識別能力を備える1つのニューラルネットワークモデルであってもよい)を通して処理することにより、画像におけるキャラクタの身分情報と人体姿勢データとを得、画像及び対応するデータをデータベースに格納することができ、例えば、キャラクタごとに1つのリストに対応し、リストは、該キャラクタの推薦されるべき商品の画像における姿勢データである。上記の予め記憶されているデータは、ユーザの画像におけるキャラクタの姿勢データに対してマッチングを行う際に用いられ、マッチングした商品をユーザに案内・推薦する。
以上、本開示の実施形態の様々な実現について説明したが、以下、本開示の実施形態の具体的な処理プロセス及び対応する効果提示について、具体的な例を用いて説明する。
具体的な実施形態を提供する前に、本開示の実施形態に関連する概念又は処理の大まかな説明を行う。一般的に、画像識別とは、ユーザが画像をアップロードすることによって画像に関するより多くの情報を得たいと希望する行為であり、ウェブサイトから返される画像識別結果ページは、画像に関するより多くの情報を掲載したページである。エンティティとは、画像情報に基づいて画像識別された画像における主体を指す。アニメ・漫画とは、通常、アニメと漫画の総称、又はアニメと漫画の集合を指す。アニメ・漫画キャラクタ画像とは、エンティティがアニメ・漫画キャラクタである画像を指す。商品案内とは、商品案内を画像識別結果ページに表示することで、ユーザがエンティティに関連する商品を閲覧することに適することである。商品推薦とは、ユーザのより深いニーズを満たすため、エンティティ情報に基づいて推薦商品を表示することである。画像の画像識別結果から主体が識別された後、ユーザの画像識別ニーズを満たすため、画像識別結果ページにエンティティに関連する情報を表示する必要がある。
説明を明確にするため、以下の具体的な実施形態は、「画像は、アニメ・漫画キャラクタであり、推薦商品は、該アニメ・漫画キャラクタのフィギュア製品である」場合を例として説明する。
図3は、まず、通常の画像に基づいて商品を推薦する表示ページを模式的に示しており、画像におけるエンティティはアニメ・漫画キャラクタであり、画像識別ページには、主に該アニメ・漫画キャラクタの画像、商品案内、より多くのサイズデータ、画像の出所及び類似画像等の情報が含まれる。ここで、図3の左下に「同商品」と記された商品推薦案内アイコンを設置する。ユーザーが該案内アイコンをクリックした場合、ページは図4に跳ぶ。図4は、商品案内アイコンをクリックすると(左ページ)、商品推薦ページ(右ページ)が表示され、ページには、通常の該アニメ・漫画キャラクタに関連する各種商品情報、例えば、該アニメ・漫画キャラクタが印刷されたスーツケース、該アニメ・漫画キャラクタの装飾画等が表示されていることを模式的に示している。このような商品案内方法は斬新ではなく、ユーザが商品をさらに理解するように引き付けることが困難である。
これに対し、図5を参照すると、本開示の新規的な設計によれば、オフライン処理及びオンライン処理を通して、全く新しい商品案内方法を構築することができるため、以下、オフライン処理及びオンライン処理についてそれぞれ詳細に説明する。
(1)オフライン処理
オフライン処理部分は、リソース収集処理、リソース識別処理、リソースをデータベースに格納する処理を含むことができ、以下、それぞれの処理内容を具体的に説明する。
リソース収集処理は、主にアニメ・漫画キャラクタの商品案内リソースを収集するものであり、例えば、まずできるだけ多くのアニメ・漫画キャラクタ(例えば、アニメ・漫画キャラクタの上位100位までのアニメ・漫画キャラクタ)を収集し、さらに各キャラクタの人気フィギュアの商品画像を収集し、データは例えば図6であり、2人のアニメ・漫画キャラクタ(ゾロとルフィ)の画像保存のリストを示している。
リソース識別処理は、主にフィギュアの商品画像を人体姿勢のニューラルネットワークモデル処理し、フィギュアの人体姿勢データを読み取るものであり、データは図7のように、上記の2人のアニメ・漫画キャラクタの姿勢データを示しており、いずれも上肢及び下肢の姿勢データを含んでいる。
リソースをデータベースに格納する処理は、主にリソース識別処理の結果をオンラインデータベースに格納するものであり、データベース表示は例えば図8に示すように、1人のアニメ・漫画キャラクタの予め記憶されているデータのリストを示している。
(2)オンライン処理
オンライン処理部分は、案内判断処理、案内提示処理及び案内対話処理を含むことができ、以下、それぞれの処理内容を具体的に説明する。
案内判断処理は、主にユーザが画像識別した画像に基づいて案内を表示する必要があるか否かを判断する処理である。例示的なフローチャートは図9のように、具体的に、画像を受信した後に画像識別を行い、図にエンティティが存在するか否かを判断し、エンティティがない場合、案内表示を行わず、エンティティが存在する場合、エンティティがアニメ・漫画キャラクタであるか否かを判断し、アニメ・漫画キャラクタでない場合、案内表示を行わず、アニメ・漫画キャラクタである場合、該アニメ・漫画キャラクタに対応するフィギュア商品が存在するか否かを判断し、対応するフィギュア商品がない場合、通常の商品案内を行い(例えば、画像識別結果ページに「同商品」の案内アイコンを追加する)、対応するフィギュア商品が存在する場合、該アニメ・漫画キャラクタ画像における人体姿勢を読み取り、かつ該人体姿勢にマッチングするフィギュア商品が存在するか否かを判断し、マッチングするフィギュア商品がない場合、通常の商品案内を行い、マッチングするフィギュア商品が存在する場合、本実施形態による商品案内を行い、例えば、トリガ操作後に、現在の画像を推薦商品の画像に切り替える。
上記の処理プロセスにおいて、該人体姿勢にマッチングするフィギュア商品が存在するか否かをどのように判断するかについては、以下の方法を用いて処理することができる。
ステップ1において、該アニメ・漫画キャラクタ画像の人体姿勢を読み取る。例えば、読み取ったデータは次の通りである。
上肢姿勢:左腕を曲げ右腕を落としている
下肢姿勢:立っている
ステップ2において、データベースにおいて該アニメ・漫画キャラクタのフィギュア商品リストに、人体姿勢が同一であるフィギュア商品が存在するか否かを閲覧し、存在する場合、マッチングに成功する。
ここで、「上肢姿勢」と「下肢姿勢」の両方が同一である場合、完全マッチングである。1項のみが同一である場合、不完全マッチングである。例えば、次の通りである。
上肢姿勢:左腕を曲げ右腕を落としている
下肢姿勢:座っている姿
ここで、「下肢姿勢」が異なるため、不完全マッチングである。
応用において、装置(又はシステム)を、「完全マッチング」が必要である場合、マッチングに成功したとみなすように設定してもよい。オプションとして、「不完全マッチング」である場合、マッチングに成功したとみなすように設定してもよい。
オプションとして、マッチングに成功した商品の数が複数である場合は、その中からランダムに1つの商品を推薦商品として決定してもよいし、他の優先戦略を用いて推薦商品を決定してもよい。
案内表示処理は、主に決定した推薦商品データに基づいて商品案内標識(商品案内提示等と称することもできる)を表示し、案内位置は、画像上又は画像の周辺の予め定めた位置又はランダムの位置であってもよい。図10は、画像識別結果ページに位置する案内提示を模式的に示しており、具体的に、画像上の中央下部に矩形の枠が表示されており、枠内の文字は例えば「クリックで次元を破る」とすることができ、「二次元」のアニメ・漫画キャラクタ画像を立体感のあるエンティティ商品画像に切り替えることに適している。図10におけるアニメ・漫画キャラクタ画像の下方の文字とサイズが比較的小さい画像は、通常の画像識別結果の表示である。
案内対話処理は、主にユーザの操作に応答し、ユーザが案内提示をクリックすると案内提示が消え、アニメ・漫画キャラクタ画像がフィギュア商品画像に切り替わり、ページ内容が推薦商品の内容に変わる。図11は、切り替えプロセスにおける複数のキーマップを模式的に示しており、左側は案内提示のある画像であり、案内提示をクリックすると、該提示枠は消えて、中央の画像(例えば、元の画像)であると表示し、その後、予め設定された期間内、例えば0.5秒又は1秒後に、右側に立体感のある商品画像であると表示し、切り替えプロセスが完了する。他の実施形態において、原図から推薦商品図へと予め設定された時間内に段階的に切り替えられるように設定してもよい。
図12は、他の実施形態により処理された画像識別画像と推薦商品画像との対比効果図を模式的に示している。本開示の少なくとも1つの実施形態により、「次元を破る」新たな案内方式を形成することができ、「人体姿勢」の高い相関度のマッチング制約により、ユーザを商品推薦にさらに引き付けることができ、これ実際により深いレベルで拡張してユーザの画像識別のニーズを満たすことになる。
以上、複数の実施形態を通して異なる角度から本開示の実施形態の具体的な設定及び実現方法について説明した。上記の少なくとも1つの実施形態の処理方法に対応し、本開示の実施形態は、図13を参照し、商品案内装置100は、第1の画像におけるキャラクタの身分情報を識別するための画像識別モジュール110と、第1の画像におけるキャラクタに対して姿勢識別を行い、姿勢情報を得るための姿勢識別モジュール120と、第1の画像におけるキャラクタの姿勢情報と、予め記憶されている複数の商品画像における同一のキャラクタの姿勢情報とをマッチングし、マッチングに成功した商品画像を第1の画像の推薦商品画像として決定するためのマッチング処理モジュール130と、第1の画像の範囲内又は周辺領域において商品案内標識を表示するための案内標識表示モジュール140と、商品案内標識がトリガされた後、第1の画像を推薦商品画像に切り替えるための画像切り替えモジュール150と、をさらに備える。
オプションとして、前記第1の画像におけるキャラクタの姿勢情報は、キャラクタの上肢姿勢及び下肢姿勢のうち少なくとも1つを含み、前記マッチングに成功した商品画像は、前記第1の画像におけるキャラクタの上肢姿勢と一致する商品画像を含む、あるいは、前記マッチングに成功した商品画像は、前記第1の画像におけるキャラクタの下肢姿勢と一致する商品画像を含む、あるいは、前記マッチングに成功した商品画像は、前記第1の画像におけるキャラクタの上肢姿勢及び下肢姿勢の両方に一致する商品画像を含む。
オプションとして、画像切り替えモジュールは、商品案内標識がトリガされた後の第1の予めに設定された時間内に、第1の画像を推薦商品画像に直接切り替える、あるいは、商品案内標識がトリガされた後の第2の予めに設定された時間内に、第1の画像を推薦商品画像に段階的に切り替える。
オプションとして、商品案内装置100は、画像収集モジュールと記憶モジュールとをさらに備えてもよく、ここで、画像収集モジュールは、キャラクタに基づいて作成された商品を含む商品画像を収集することに用いられ、画像識別モジュールは、収集された商品画像におけるキャラクタに対して身分識別を行い、各商品画像におけるキャラクタの身分情報を得ることにさらに用いられ、姿勢識別モジュールは、収集された商品画像におけるキャラクタに対して姿勢識別を行い、各商品画像におけるキャラクタの姿勢情報を得ることにさらに用いられ、記憶モジュールは、収集された商品画像と、各商品画像におけるキャラクタの身分情報と、各商品画像におけるキャラクタの姿勢情報とをデータベースに記憶することに用いられる。
オプションとして、画像識別モジュールは、身分識別モデルを通して、収集された商品画像におけるキャラクタに対して身分識別を行い、姿勢識別モジュールは、人体姿勢識別モデルを通して、収集された商品画像におけるキャラクタに対して姿勢識別を行う。ここで、身分識別モデルと、人体姿勢識別モデルとは、2つの異なるニューラルネットワークモデルである、あるいは、身分識別モデルと、人体姿勢識別モデルとは、身分識別能力及び人体姿勢識別能力を備える1つのニューラルネットワークモデルである。
本開示の実施形態による各装置における各モジュールの機能は、上記の方法において対応する説明を参照できるため、ここではさらに言及しない。
本開示の実施形態によれば、本開示は、電子デバイスと可読記憶媒体をさらに提供する。図13は、本開示の実施形態による商品案内方法を実現するための電子デバイスのブロック図である。電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータのような様々な形態のデジタルコンピュータを表すことができる。また、電子デバイスは携帯情報端末、携帯電話、スマートフォン、装着可能デバイス、及びその他の類似のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。ここで示した構成要素、それらの接続と関係、及びそれらの機能は例示的なものに過ぎず、本開示で説明されたもの及び/又は要求される本開示の実施を制限することは意図されない。
図13に示すように、該電子デバイスは、1つ又は複数のプロセッサ1001と、メモリ1002と、高速インターフェースと低速インターフェースとを含む各構成要素を接続するためのインターフェースとを含む。各構成要素は、異なるバスを利用して互いに接続し、共通のマザーボードに取り付けられてもよいし、必要に応じて他の方法で取り付けられてもよい。プロセッサは、電子デバイス内で実行される命令を処理してもよく、また、外部入出力デバイス(例えば、インターフェースに接続された表示デバイス)にグラフィックユーザインターフェース(Graphical User Interface、GUI)を表示するための、メモリ又はメモリ上に記憶されたグラフィカル情報の命令を含む。他の実施形態において、必要に応じて、複数のプロセッサ及び複数のバスのうち少なくとも1つを複数のメモリ及び複数のメモリとともに使用することができる。同様に、複数の電子デバイスを接続してもよく、各デバイスは、部分的に必要な動作、例えば、サーバアレイ、ブレードサーバの集合、又はマルチプロセッサシステムとして、提供する。図13においてプロセッサ1001を例とする。
メモリ1002は、本開示にて提供された非一過性のコンピュータ可読記憶媒体である。メモリは、本開示で提供される商品案内方法を少なくとも1つのプロセッサに実行させるように、少なくとも1つのプロセッサによって実行されることができる命令を記憶する。本開示における非一過性のコンピュータ可読記憶媒体は、本開示で提供された商品案内方法をコンピュータに実行させるためのコンピュータ命令を記憶する。
メモリ1002は、非一過性のコンピュータ可読記憶媒体として、非一過性のソフトウェアプログラム、非一過性のコンピュータ実行可能なプログラム及びモジュールを記憶するために使用されてもよく、本開示の実施形態における商品案内方法に対応するプログラム命令/モジュール、(例えば、図13に示される、画像識別モジュール110、姿勢識別モジュール120、マッチング処理モジュール130、案内標識表示モジュール140、画像切り替えモジュール150)である。プロセッサ1001は、メモリ1002に記憶されている非一過性のソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理、即ち上述した方法に関する実施形態に係る商品案内方法を実行する。
メモリ1002は、オペレーティングシステムや少なくとも1つの機能に必要なアプリケーションを記憶することができるプログラムの記憶領域と、商品案内方法に係る電子デバイスの使用によって生成されたデータなどを記憶することができるデータの記憶領域と、を含むことができる。さらに、メモリ1002は、高速ランダムアクセスメモリを含んでもよく、非一過性の固体記憶装置を含んでもよい。例えば、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一過性の固体記憶装置を含むことができる。いくつかの実施形態において、メモリ1002はオプションとして、プロセッサ1001に対して遠隔的に設定されたメモリを含み、これらの遠隔メモリは、ネットワークを介して商品案内方法に係る電子デバイスに接続されてもよい。上記のネットワークの例は、インターネット、企業内ネットワーク、ローカルネットワーク、モバイル通信ネットワーク及びその組み合わせを含むが、これらに限定されない。
本開示の実施形態の商品案内方法に対応する電子デバイスは、入力装置1003と出力装置1004とをさらに含むことができる。プロセッサ1001、メモリ1002、入力装置1003、及び出力装置1004は、バス又は他の方法で接続されてもよく、図13ではバスを介して接続されている。
入力装置1003は、入力された数字又は文字を受信し、商品案内方法に係る電子デバイスのユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチパネル、キーパッド、マウス、トラックボード、タッチパッド、指示棒、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどを含むことができる。出力装置1004は、表示装置、補助照明装置(例えばLED)、及び触覚フィードバック装置(例えば、振動モータ)などを含むことができる。この表示装置は、液晶ディスプレイ(Liquid Crystal Display、LCD)、発光ダイオード(Light Emitting Diode、LED)ディスプレイ及びプラズマディスプレイを含むことができるがこれらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。
本開示におけるシステム及び技術に係る様々な実施形態は、デジタル電子回路システム、集積回路システム、専用集積回路(Application Specific Integrated Circuits、ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、及びこれらの組み合わせのうち少なくとも1つによって実現されることができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムにおいて実装されてもよく、この1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラム可能なシステム上で実行されること、及び解釈されることのうち少なくとも1つがされてもよく、このプログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置より、データと命令を受信し、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置に、データと命令を送信する。
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードともいう)は、プログラマブルプロセッサのマシン命令を含み、過程指向プログラミング言語及びオブジェクト指向プログラミング言語のうち少なくとも1つと、アセンブリ/マシン言語とのうち少なくとも1つを用いてこれらの計算プログラムを実施することができる。本開示で使用されるように、「機械可読媒体」及び「コンピュータ可読媒体」という用語は、マシン命令及びデータのうち少なくとも1つをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、及び装置(例えば、磁気ディスク、光ディスク、メモリ、編集可能論理デバイス(programmable logic device、PLD)のうち少なくとも1つを意味し、機械読み取り可能な信号としてのマシン命令を受信する機械可読媒体を含む。「機械読み取り可能な信号」という用語は、マシン命令及びデータのうち少なくとも1つをプログラマブルプロセッサに提供するための任意の信号を意味する。
ユーザとのイントラクションを提供するために、本開示で説明されているシステムや技術は、コンピュータ上で実施されてもよく、また、ユーザに情報を表示するための表示装置(例えば、CRT(Cathode Ray Tube、ブラウン管)又はLCD(液晶ディスプレイ)モニタ)と、入力をコンピュータに提供するためのキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを備えてもよい。他の種類の装置も、ユーザとのイントラクションを提供するために使用され得る。例えば、ユーザに提供されたフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、ユーザからの入力は、いかなる形式(音響入力、音声入力、又は触覚入力を含む)で受信されてもよい。
本開示で説明されているシステム及び技術は、バックグラウンド構成要素を含む計算システム(例えば、データサーバとして)、又は中間部構成要素を含む計算システム(例えば、アプリケーションサーバ)、又は、フロントエンド構成要素を含む計算システム(例えば、グラフィカルユーザインタフェース又はネットワークブラウザを備えたユーザコンピュータであって、ユーザがこのグラフィカルユーザインタフェース又はネットワークブラウザを介して本開示で説明されたシステム及び技術に係る実施形態とインタラクションを行うことができるユーザコンピュータ)に実行されてもよく、又は、このようなバックグラウンド構成要素、中間部構成要素、又はフロントエンド構成要素の任意の組合せを含む計算システムにおいて実行されてもよい。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されてもよい。通信ネットワークの例えとして、ローカルネットワーク(Local Area Network、LAN)、広域ネットワーク(Wide Area Network、WAN)及びインターネットを含む。
コンピュータシステムは、クライアント及びサーバを含むことができる。クライアントとサーバは一般的に相互に離れており、通信ネットワークを介してインタラクションを行う。クライアントとサーバとの関係を持つコンピュータプログラムがそれぞれのコンピュータ上で実行されることによって、クライアントとサーバとの関係は構築される。
上記の様々な態様のフローを使用して、ステップを新たに順序付け、追加、又は削除することが可能であることを理解すべきである。例えば、本開示で記載された各ステップは、並列に実行しても良いし、順次に実行しても良いし、異なる順序で実行しても良い。本開示で開示された技術案が所望する結果を実現することができる限り、本開示ではこれに限定されない。
上記具体的な実施形態は、本開示の保護範囲に対する限定を構成するものではない。当業者は、設計事項やその他の要因によって、様々な修正、組み合わせ、サブ組み合わせ、及び代替が可能であることを理解するべきである。本開示の要旨及び原則内における変更、均等な置換及び改善等は、いずれも本開示の保護範囲に含まれるべきである。

Claims (15)

  1. 第1の画像におけるキャラクタの身分情報を識別することと、
    前記第1の画像におけるキャラクタに対して姿勢識別を行い、姿勢情報を得ることと、
    前記第1の画像におけるキャラクタの姿勢情報と、予め記憶されている複数の商品画像における同一のキャラクタの姿勢情報とをマッチングし、マッチングに成功した商品画像を前記第1の画像の推薦商品画像として決定することと、
    前記第1の画像の範囲内又は周辺領域において商品案内標識を表示することと、
    前記商品案内標識がトリガされた後、前記第1の画像を前記推薦商品画像に切り替えることと、を含む、
    商品案内方法。
  2. 前記第1の画像におけるキャラクタの姿勢情報は、キャラクタの上肢姿勢及び下肢姿勢のうち少なくとも1つを含み、
    前記マッチングに成功した商品画像は、前記第1の画像におけるキャラクタの上肢姿勢と一致する商品画像を含む、あるいは、
    前記マッチングに成功した商品画像は、前記第1の画像におけるキャラクタの下肢姿勢と一致する商品画像を含む、あるいは、
    前記マッチングに成功した商品画像は、前記第1の画像におけるキャラクタの上肢姿勢及び下肢姿勢の両方に一致する商品画像を含む、
    請求項1に記載の商品案内方法。
  3. 前記商品案内標識がトリガされた後、前記第1の画像を前記推薦商品画像に切り替えることは、
    前記商品案内標識がトリガされた後の第1の予めに設定された時間内に、前記第1の画像を前記推薦商品画像に直接切り替えること、あるいは、
    前記商品案内標識がトリガされた後の第2の予めに設定された時間内に、前記第1の画像を前記推薦商品画像に段階的に切り替えること、を含む
    請求項1に記載の商品案内方法。
  4. 前記第1の画像に対して画像識別処理を行う前に、前記商品案内方法は、
    キャラクタに基づいて作成された商品を含む商品画像を収集することと、
    収集された商品画像におけるキャラクタに対して身分識別を行い、各商品画像におけるキャラクタの身分情報を得ることと、
    前記収集された商品画像におけるキャラクタに対して姿勢識別を行い、各商品画像におけるキャラクタの姿勢情報を得ることと、
    前記収集された商品画像と、前記各商品画像におけるキャラクタの身分情報と、前記各商品画像におけるキャラクタの姿勢情報とをデータベースに記憶することと、をさらに含む、
    請求項1に記載の商品案内方法。
  5. 身分識別モデルを通して、前記収集された商品画像におけるキャラクタに対して身分識別を行い、
    人体姿勢識別モデルを通して、前記収集された商品画像におけるキャラクタに対して姿勢識別を行い、
    前記身分識別モデルと、前記人体姿勢識別モデルとは、2つの異なるニューラルネットワークモデルである、あるいは、前記身分識別モデルと、前記人体姿勢識別モデルとは、身分識別能力及び人体姿勢識別能力を備える1つのニューラルネットワークモデルである、
    請求項4に記載の商品案内方法。
  6. 前記キャラクタは、カートゥーンキャラクタ、アニメキャラクタ、漫画キャラクタ、映画・テレビ作品キャラクタのうちの少なくとも1つを含む、
    請求項1〜請求項5までのいずれか1項に記載の商品案内方法。
  7. 第1の画像におけるキャラクタの身分情報を識別するための画像識別モジュールと、
    前記第1の画像におけるキャラクタに対して姿勢識別を行い、姿勢情報を得るための姿勢識別モジュールと、
    前記第1の画像におけるキャラクタの姿勢情報と、予め記憶されている複数の商品画像における同一のキャラクタの姿勢情報とをマッチングし、マッチングに成功した商品画像を前記第1の画像の推薦商品画像として決定するためのマッチング処理モジュールと、
    前記第1の画像の範囲内又は周辺領域において商品案内標識を表示するための案内標識表示モジュールと、
    前記商品案内標識がトリガされた後、前記第1の画像を前記推薦商品画像に切り替えるための画像切り替えモジュールと、を備える、
    商品案内装置。
  8. 前記第1の画像におけるキャラクタの姿勢情報は、キャラクタの上肢姿勢及び下肢姿勢のうち少なくとも1つを含み、
    前記マッチングに成功した商品画像は、前記第1の画像におけるキャラクタの上肢姿勢と一致する商品画像を含む、あるいは、
    前記マッチングに成功した商品画像は、前記第1の画像におけるキャラクタの下肢姿勢と一致する商品画像を含む、あるいは、
    前記マッチングに成功した商品画像は、前記第1の画像におけるキャラクタの上肢姿勢及び下肢姿勢の両方に一致する商品画像を含む、
    請求項7に記載の商品案内装置。
  9. 前記画像切り替えモジュールは、
    前記商品案内標識がトリガされた後の第1の予めに設定された時間内に、前記第1の画像を前記推薦商品画像に直接切り替える、あるいは、
    前記商品案内標識がトリガされた後の第2の予めに設定された時間内に、前記第1の画像を前記推薦商品画像に段階的に切り替える、
    請求項7に記載の商品案内装置。
  10. 画像収集モジュールと、記憶モジュールと、をさらに備え、
    前記画像収集モジュールは、キャラクタに基づいて作成された商品を含む商品画像を収集することに用いられ、
    前記画像識別モジュールは、収集された商品画像におけるキャラクタに対して身分識別を行い、各商品画像におけるキャラクタの身分情報を得ることにさらに用いられ、
    前記姿勢識別モジュールは、前記収集された商品画像におけるキャラクタに対して姿勢識別を行い、各商品画像におけるキャラクタの姿勢情報を得ることにさらに用いられ、
    前記記憶モジュールは、前記収集された商品画像と、前記各商品画像におけるキャラクタの身分情報と、前記各商品画像におけるキャラクタの姿勢情報とをデータベースに記憶することに用いられる、
    請求項7に記載の商品案内装置。
  11. 前記画像識別モジュールは、身分識別モデルを通して、前記収集された商品画像におけるキャラクタに対して身分識別を行い、前記姿勢識別モジュールは、人体姿勢識別モデルを通して、前記収集された商品画像におけるキャラクタに対して姿勢識別を行い、
    前記身分識別モデルと、前記人体姿勢識別モデルとは、2つの異なるニューラルネットワークモデルである、あるいは、前記身分識別モデルと、前記人体姿勢識別モデルとは、身分識別能力及び人体姿勢識別能力を備える1つのニューラルネットワークモデルである、
    請求項10に記載の商品案内装置。
  12. 前記キャラクタは、カートゥーンキャラクタ、アニメキャラクタ、漫画キャラクタ、映画・テレビ作品キャラクタのうちの少なくとも1つを含む、
    請求項7〜請求項11までのいずれか1項に記載の商品案内装置。
  13. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信接続されるメモリと、を備え、
    前記メモリには、前記少なくとも1つのプロセッサで実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、請求項1〜請求項6までのいずれか1項に記載の商品案内方法を実行させる、
    電子デバイス。
  14. コンピュータに請求項1〜請求項6までのいずれか1項に記載の商品案内方法を実行させる命令を記憶するための非一時的なコンピュータ可読記憶媒体。
  15. コンピュータにおいて、プロセッサにより実行されると、請求項1〜請求項6までのいずれか1項に記載の商品案内方法を実現することを特徴とするプログラム。
JP2021121060A 2020-11-23 2021-07-21 商品案内方法、装置、デバイス、記憶媒体、及びプログラム Active JP7168837B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011322983.2A CN112396494B (zh) 2020-11-23 2020-11-23 商品引导方法、装置、设备及存储介质
CN202011322983.2 2020-11-23

Publications (2)

Publication Number Publication Date
JP2021170391A true JP2021170391A (ja) 2021-10-28
JP7168837B2 JP7168837B2 (ja) 2022-11-10

Family

ID=74607065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021121060A Active JP7168837B2 (ja) 2020-11-23 2021-07-21 商品案内方法、装置、デバイス、記憶媒体、及びプログラム

Country Status (5)

Country Link
US (1) US20210366172A1 (ja)
EP (1) EP3901892A3 (ja)
JP (1) JP7168837B2 (ja)
KR (1) KR20210139203A (ja)
CN (1) CN112396494B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543578B (zh) * 2019-08-09 2024-05-14 华为技术有限公司 物体识别方法及装置
CN116506691B (zh) * 2023-06-14 2023-10-27 北京达佳互联信息技术有限公司 多媒体资源的处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004304261A (ja) * 2003-03-28 2004-10-28 Casio Comput Co Ltd 画像出力装置、画像出力方法、画像出力処理プログラム、および画像配信サーバ、画像配信処理プログラム
JP2011141848A (ja) * 2010-01-09 2011-07-21 Animate:Kk 仮想ショッピングモールシステム及び関連付装置並びにプログラム
JP2014016882A (ja) * 2012-07-10 2014-01-30 Yahoo Japan Corp 情報提供装置、情報提供方法および情報提供プログラム
JP2018195166A (ja) * 2017-05-19 2018-12-06 富士通株式会社 姿勢判定プログラム、姿勢判定装置及び姿勢判定方法
JP2019197353A (ja) * 2018-05-09 2019-11-14 コニカミノルタ株式会社 属性決定装置、属性決定システムおよび属性決定方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8130219B2 (en) * 2007-06-11 2012-03-06 Autodesk, Inc. Metadata for avatar generation in virtual environments
US10049482B2 (en) * 2011-07-22 2018-08-14 Adobe Systems Incorporated Systems and methods for animation recommendations
US20140078144A1 (en) * 2012-09-14 2014-03-20 Squee, Inc. Systems and methods for avatar creation
CN104765891A (zh) * 2015-05-06 2015-07-08 苏州搜客信息技术有限公司 一种基于图像的搜索购物方法
CN106570714B (zh) * 2015-10-08 2021-01-15 阿里巴巴集团控股有限公司 一种搭配对象图片的推荐方法、映射关系建立方法及装置
CN106096009A (zh) * 2016-06-23 2016-11-09 北京小米移动软件有限公司 消息生成方法及装置
CN106815309A (zh) * 2016-12-20 2017-06-09 北京奇虎科技有限公司 一种图像推送方法、装置以及移动终端
KR101986327B1 (ko) * 2017-08-18 2019-06-05 강다겸 자세 가이드 제공 방법 및 그 장치
CN109951628A (zh) * 2017-12-21 2019-06-28 广东欧珀移动通信有限公司 模型构建方法、拍照方法、装置、存储介质及终端
US10896493B2 (en) * 2018-11-13 2021-01-19 Adobe Inc. Intelligent identification of replacement regions for mixing and replacing of persons in group portraits
KR101958818B1 (ko) * 2018-11-16 2019-07-02 성주은 개인 맞춤형 통증 관리 방법 및 장치
CN113535047A (zh) * 2019-05-06 2021-10-22 苹果公司 头像与多个应用程序的集成
CN110543578B (zh) * 2019-08-09 2024-05-14 华为技术有限公司 物体识别方法及装置
CN110785753B (zh) * 2019-09-27 2024-06-11 京东方科技集团股份有限公司 用于搜索图像的方法、装置及存储介质
CN110866563B (zh) * 2019-11-20 2022-04-29 咪咕文化科技有限公司 相似视频检测、推荐方法、电子设备和存储介质
CN111223170B (zh) * 2020-01-07 2022-06-10 腾讯科技(深圳)有限公司 动画生成方法、装置、电子设备和存储介质
CN111476319B (zh) * 2020-05-08 2023-07-25 网易(杭州)网络有限公司 商品推荐方法、装置、存储介质和计算设备
US11494932B2 (en) * 2020-06-02 2022-11-08 Naver Corporation Distillation of part experts for whole-body pose estimation
TWI775202B (zh) * 2020-11-03 2022-08-21 財團法人資訊工業策進會 動作姿勢的指導系統及方法
US11531697B2 (en) * 2020-11-03 2022-12-20 Adobe Inc. Identifying and providing digital images depicting human poses utilizing visual interactive content search and virtual mannequins

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004304261A (ja) * 2003-03-28 2004-10-28 Casio Comput Co Ltd 画像出力装置、画像出力方法、画像出力処理プログラム、および画像配信サーバ、画像配信処理プログラム
JP2011141848A (ja) * 2010-01-09 2011-07-21 Animate:Kk 仮想ショッピングモールシステム及び関連付装置並びにプログラム
JP2014016882A (ja) * 2012-07-10 2014-01-30 Yahoo Japan Corp 情報提供装置、情報提供方法および情報提供プログラム
JP2018195166A (ja) * 2017-05-19 2018-12-06 富士通株式会社 姿勢判定プログラム、姿勢判定装置及び姿勢判定方法
JP2019197353A (ja) * 2018-05-09 2019-11-14 コニカミノルタ株式会社 属性決定装置、属性決定システムおよび属性決定方法

Also Published As

Publication number Publication date
CN112396494A (zh) 2021-02-23
KR20210139203A (ko) 2021-11-22
EP3901892A2 (en) 2021-10-27
CN112396494B (zh) 2024-06-21
US20210366172A1 (en) 2021-11-25
EP3901892A3 (en) 2022-03-02
JP7168837B2 (ja) 2022-11-10

Similar Documents

Publication Publication Date Title
KR102596920B1 (ko) 카메라 플랫폼 및 객체 재고 제어
US10147239B2 (en) Content creation tool
CN111860167B (zh) 人脸融合模型获取及人脸融合方法、装置及存储介质
KR101667899B1 (ko) 체험 콘텐츠 데이터세트에 대한 캠페인 최적화
EP2972950B1 (en) Segmentation of content delivery
KR102511094B1 (ko) 디지털 이미지 캡처 세션 및 메타데이터 연관
JP2021170391A (ja) 商品案内方法、装置、デバイス、記憶媒体、及びプログラム
KR101488662B1 (ko) Nui 장치를 통하여 사용자와 상호작용하는 인터페이스 제공방법 및 제공장치
JP7269979B2 (ja) 歩行者を検出するための方法及び装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
CN112000828B (zh) 搜索表情图片的方法、装置、电子设备和可读存储介质
CN112269517B (zh) 交互界面的生成方法和装置
CN112783543A (zh) 小程序分发物料的生成方法、装置、设备及介质
CN113630606B (zh) 视频水印处理方法、装置、电子设备及存储介质
CN116824014B (zh) 用于虚拟形象的数据生成方法、装置、电子设备、介质
US11810577B2 (en) Dialogue management using lattice walking
CN116360906A (zh) 交互控制方法、装置、头戴显示设备及介质
CN117850655A (zh) 信息输入方法、装置、设备和介质
CN111385489A (zh) 一种短视频封面的制作方法、装置、设备和存储介质
JP2005250632A (ja) コミュニティ情報提供装置およびプログラム
CN113051501A (zh) 信息投放方法、装置、设备和介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221004

R150 Certificate of patent or registration of utility model

Ref document number: 7168837

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150