JP6695454B1 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP6695454B1 JP6695454B1 JP2019006893A JP2019006893A JP6695454B1 JP 6695454 B1 JP6695454 B1 JP 6695454B1 JP 2019006893 A JP2019006893 A JP 2019006893A JP 2019006893 A JP2019006893 A JP 2019006893A JP 6695454 B1 JP6695454 B1 JP 6695454B1
- Authority
- JP
- Japan
- Prior art keywords
- product
- recognition
- image
- recognized
- identification information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 32
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000010586 diagram Methods 0.000 abstract description 7
- 238000003384 imaging method Methods 0.000 description 25
- 238000013135 deep learning Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 15
- 238000003702 image correction Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 5
- 238000002372 labelling Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Cash Registers Or Receiving Machines (AREA)
Abstract
Description
本実施形態では、大型量販店やスーパーマーケットなどにおいて、商品画像から商品を認識するシステムを想定するが、商品を販売するあらゆる店舗(コンビニエンスストアや専門店など)にも適用可能である。また、商品の認識に限らず、撮像画像に含まれる物体を認識する場合にも適用可能である。以下、物体は、商品を例にして説明するが、これに限られるものではない。
<システム構成>
図1は、本実施形態に係る認識システム1の概略構成を示す図である。図1に示すように、認識システム1は、第1撮像装置102と、学習装置104と、認識装置106と、第2撮像装置108とを有する。また、上述した装置の全部又は一部は、通信ネットワークを介して相互通信可能に接続されている。通信ネットワークは、例えば、インターネット、LAN、専用線、電話回線、企業内ネットワーク、移動体通信網、Bluetooth(登録商標)、WiFi(Wireless Fidelity)、その他の通信回線、それらの組み合わせ等のいずれであってもよく、有線であるか無線であるかを問わない。なお、認識システム1は、第1撮像装置102と学習装置104とを学習フェーズの第1システム、認識装置106と第2撮像装置108とを認識フェーズの第2システムとして構成してもよい。
図2は、本実施形態に係る情報処理装置20のハードウェア構成の一例を示す図である。情報処理装置20は、学習装置104又は認識装置106のハードウェアとして実装可能である。図2に示すように、情報処理装置20は、プロセッサ202と、メモリ204と、ストレージ206と、入出力インタフェース(入出力I/F)208と、通信インタフェース(通信I/F)210とを含む。情報処理装置200のHWの各構成要素は、例えばバスBを介して相互に接続される。
図3は、本実施形態に係る学習装置104の機能構成の一例を示す図である。図3に示す例では、学習装置104は、画像補正部302と、深層学習部304とを有する。画像補正部302及び深層学習部304は、例えば図2に示すプロセッサ202や作業領域としてのメモリ204などにより実現されうる。
ここで、本実施形態における画像補正の例について説明する。図4は、画像補正の一例を示す図である。商品画像A1は、撮像された商品画像から商品部分が切り出された部分画像(以下、「部分画像A1」とも称す。)である。
)をそれぞれ生成する。生成された学習モデルには、類似商品リストが付与される。類似商品リストは、深層学習部304が、商品画像同士の類似度などを用いて類似商品を判別し、類似商品をグループ化し、グループにグループIDを付与することで生成可能である。
図5は、本実施形態における認識装置106の機能構成の一例を示す図である。図5に示す例では、認識装置106は、第1制御部502と、第1認識処理部504と、第2認識処理部506とを有する。第1制御部502と、第1認識処理部504と、第2認識処理部506とは、例えば図2に示すプロセッサ202や作業領域としてのメモリ204などにより実現されうる。
ここで、図6は、類似商品の学習対象部分を示すための図である。図6に示す例では、各商品S1〜S3は、各部分画像R102,R104,R106以外はほぼ同じである。これらの商品S1〜S3は、類似商品として、1つのグループに割り当てられ、グループIDが付与される。第2認識部534は、例えば各部分画像R102,R104,R106を用いて学習された学習モデルを有する。
次に、実施形態に係る認識システム1の動作について説明する。
<システムの全体処理>
図7は、実施形態におけるシステムの全体処理の一例を示すフローチャートである。図7に示す例では、認識システム1において、ステップS102で、第1撮像装置102は、学習対象の商品の商品画像を撮像する。後段の処理である学習において3次元モデルが作成できるように、様々な角度から商品が大量に撮像されるとよい。
次に、本実施形態における学習装置104の学習処理について説明する。図8は、実施形態における学習処理の一例を示すフローチャートである。
次に、本実施形態における認識装置106の認識処理について説明する。図9は、実施形態における認識処理の一例を示すフローチャートである。
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。このため、上記実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。例えば、上述した各処理ステップは処理内容に矛盾を生じない範囲で任意に順番を変更し、または並列に実行することができる。
Claims (7)
- 各商品の商品識別情報がラベル付けされた複数の商品画像を用いる学習によって生成された商品認識のための第1モデルと、複数の類似商品を含むグループのグループ識別情報とに基づき、商品の認識処理を行う第1認識部を1又は複数有する第1認識処理部と、
前記複数の類似商品の商品画像を用いる学習によって生成された類似商品認識のための第2モデルに基づき、類似商品の認識処理を行う第2認識部を1又は複数有する第2認識処理部と、
認識対象の第1商品画像を取得する画像取得部と、
前記第1モデルを用いて前記第1商品画像の商品を認識した前記第1認識処理部から、認識された商品が前記類似商品であれば、前記類似商品を含むグループのグループ識別情報を取得し、認識された商品が前記類似商品でなければ、前記認識された商品の商品識別情報を取得する第1取得部と、
前記グループ識別情報が取得された場合、前記第2モデルを用いて前記第1商品画像の商品を認識した前記第2認識処理部から、認識された商品の商品識別情報を取得する第2取得部と、
前記第1取得部、又は前記第2取得部により取得された前記商品識別情報を出力する出力部と、
を備える情報処理装置。 - 前記第1モデルは、前記商品画像内の商品部分の画像と、複数の背景画像のうちの任意の背景画像との組み合わせで学習されたモデルである、請求項1に記載の情報処理装置。
- 前記複数の背景画像は、色が異なる背景画像、手の画像、及び他の商品の画像のうち少なくとも1つを含む、請求項2に記載の情報処理装置。
- 前記第2モデルは、前記類似商品の商品画像内で、他の商品と類似する部分画像を用いて学習されたモデルである、請求項1から3のいずれか一項に記載の情報処理装置。
- 前記第1モデルは、任意の角度から商品を認識可能な3次元モデルを含む、請求項1から4のいずれか一項に記載の情報処理装置。
- 各商品の商品識別情報がラベル付けされた複数の商品画像を用いる学習によって生成された商品認識のための第1モデルと、複数の類似商品を含むグループのグループ識別情報とに基づき、商品の認識処理を行う第1認識部を1又は複数有する第1認識処理部と、
前記複数の類似商品の商品画像を用いる学習によって生成された類似商品認識のための第2モデルに基づき、類似商品の認識処理を行う第2認識部を1又は複数有する第2認識処理部と、
制御部と、を有する情報処理装置が実行する情報処理方法であって、
前記制御部は、
認識対象の第1商品画像を取得し、
前記第1モデルを用いて前記第1商品画像の商品を認識した前記第1認識処理部から、認識された商品が前記類似商品であれば、前記類似商品を含むグループのグループ識別情報を取得し、認識された商品が前記類似商品でなければ、前記認識された商品の商品識別情報を取得し、
前記グループ識別情報が取得された場合、前記第2モデルを用いて前記第1商品画像の商品を認識した前記第2認識処理部から、認識された商品の商品識別情報を取得し、
取得された前記商品識別情報を出力する、情報処理方法。 - 各商品の商品識別情報がラベル付けされた複数の商品画像を用いる学習によって生成された商品認識のための第1モデルと、複数の類似商品を含むグループのグループ識別情報とに基づき、商品の認識処理を行う第1認識部を1又は複数有する第1認識処理部と、
前記複数の類似商品の商品画像を用いる学習によって生成された類似商品認識のための第2モデルに基づき、類似商品の認識処理を行う第2認識部を1又は複数有する第2認識処理部と、
制御部と、を有する情報処理装置に実行させるためのプログラムであって、
前記制御部に、
認識対象の第1商品画像を取得し、
前記第1モデルを用いて前記第1商品画像の商品を認識した前記第1認識処理部から、認識された商品が前記類似商品であれば、前記類似商品を含むグループのグループ識別情報を取得し、認識された商品が前記類似商品でなければ、前記認識された商品の商品識別情報を取得し、
前記グループ識別情報が取得された場合、前記第2モデルを用いて前記第1商品画像の商品を認識した前記第2認識処理部から、認識された商品の商品識別情報を取得し、
取得された前記商品識別情報を出力する、処理を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019006893A JP6695454B1 (ja) | 2019-01-18 | 2019-01-18 | 情報処理装置、情報処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019006893A JP6695454B1 (ja) | 2019-01-18 | 2019-01-18 | 情報処理装置、情報処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6695454B1 true JP6695454B1 (ja) | 2020-05-20 |
JP2020119001A JP2020119001A (ja) | 2020-08-06 |
Family
ID=70682338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019006893A Expired - Fee Related JP6695454B1 (ja) | 2019-01-18 | 2019-01-18 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6695454B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2022009782A1 (ja) | 2020-07-10 | 2022-01-13 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5869988B2 (ja) * | 2012-08-24 | 2016-02-24 | 富士フイルム株式会社 | 物品照合装置および方法並びにプログラム |
JP6541226B2 (ja) * | 2015-09-18 | 2019-07-10 | Kddi株式会社 | 情報端末装置及びプログラム |
-
2019
- 2019-01-18 JP JP2019006893A patent/JP6695454B1/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2020119001A (ja) | 2020-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10936911B2 (en) | Logo detection | |
US10650495B2 (en) | High resolution style transfer | |
CN108229343B (zh) | 目标对象关键点检测方法、深度学习神经网络及装置 | |
US20190043216A1 (en) | Information processing apparatus and estimating method for estimating line-of-sight direction of person, and learning apparatus and learning method | |
US10943363B2 (en) | Image processing apparatus, and image processing method | |
US20130258198A1 (en) | Video search system and method | |
US20170278057A1 (en) | Information processing apparatus, shelf label management system, control method, and program | |
JP2016194834A (ja) | 整合判定方法、整合判定プログラム、及び整合判定装置 | |
US9305227B1 (en) | Hybrid optical character recognition | |
US8958634B2 (en) | Image processing device that displays retrieved image similar to target image | |
US10866633B2 (en) | Signing with your eyes | |
US20160110909A1 (en) | Method and apparatus for creating texture map and method of creating database | |
JP6695454B1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US11527067B2 (en) | Electronic device, action instance generation method, and recording medium | |
US20230237687A1 (en) | Product identification apparatus, product identification method, and non-transitory computer-readable medium | |
JP6623565B2 (ja) | 棚割情報生成装置、棚割情報生成システム、棚割情報生成方法、撮像装置、およびプログラム | |
WO2018033952A1 (ja) | パノラマ画像合成解析システム、パノラマ画像合成解析方法及びプログラム | |
JP7406878B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN113167568B (zh) | 坐标计算装置、坐标计算方法和计算机可读记录介质 | |
US9036874B2 (en) | Image processing and recording system preidentifying and prestoring images with predetermined features and method thereof | |
US10706315B2 (en) | Image processing device, image processing method, and computer program product | |
CN109313506B (zh) | 信息处理装置、信息处理方法和程序 | |
JP2017058657A (ja) | 情報処理装置、制御方法、コンピュータプログラム及び記憶媒体 | |
US12148023B2 (en) | Processing apparatus, processing method, and non-transitory storage medium | |
WO2024166536A1 (ja) | 推定プログラム、機械学習方法、推定装置、及び非一時的記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190405 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200330 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200421 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6695454 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |