JP7525990B2 - 主被写体判定装置、撮像装置、主被写体判定方法、及びプログラム - Google Patents
主被写体判定装置、撮像装置、主被写体判定方法、及びプログラム Download PDFInfo
- Publication number
- JP7525990B2 JP7525990B2 JP2019196616A JP2019196616A JP7525990B2 JP 7525990 B2 JP7525990 B2 JP 7525990B2 JP 2019196616 A JP2019196616 A JP 2019196616A JP 2019196616 A JP2019196616 A JP 2019196616A JP 7525990 B2 JP7525990 B2 JP 7525990B2
- Authority
- JP
- Japan
- Prior art keywords
- main subject
- subjects
- image
- subject
- determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003384 imaging method Methods 0.000 title claims description 42
- 238000000034 method Methods 0.000 title claims description 41
- 238000001514 detection method Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 50
- 230000008569 process Effects 0.000 description 25
- 210000002569 neuron Anatomy 0.000 description 17
- 238000010586 diagram Methods 0.000 description 11
- 230000005484 gravity Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 210000003423 ankle Anatomy 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000001513 elbow Anatomy 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 210000001624 hip Anatomy 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 210000002414 leg Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000002832 shoulder Anatomy 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/23—Recognition of whole body movements, e.g. for sport training
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/617—Upgrading or updating of programs or applications for camera control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
- H04N23/671—Focus control based on electronic image sensor signals in combination with active ranging signals, e.g. using light or sound signals emitted toward objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
- H04N23/675—Focus control based on electronic image sensor signals comprising setting of focusing regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Social Psychology (AREA)
- Psychiatry (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Description
<<撮像装置100の全体構成>>
図1は、主被写体判定装置を含む撮像装置100の構成を示すブロック図である。撮像装置100は、被写体を撮影して、動画や静止画のデータをテープや固体メモリ、光ディスクや磁気ディスクなどの各種メディアに記録するデジタルスチルカメラやビデオカメラなどであるが、これらに限定されるものではない。以下では、被写体が人物である場合を例に説明を行う。また、主被写体は、ユーザが意図した撮像制御の対象となる被写体を表すものとする。なお、図1に示した構成は、撮像装置100の構成の一例に過ぎない。
図2及び図3を参照して、画像処理部152が実行する主被写体判定処理について説明する。図2は、画像処理部152の詳細な構成の一部を示すブロック図である。図3は、主被写体判定処理のフローチャートである。本フローチャートの各ステップの処理は、特に断らない限り、画像処理部152の各部が主制御部151の制御下で動作することにより実現される。以下では、複数人がプレーする球技を主被写体判定処理の対象の撮影シーンとして説明を行うが、本実施形態を適用可能な撮影シーンはこれに限らない。
(文献1)
Redmon, Joseph, et al., "You only look once: Unified, real-time object detection.", Proceedings of the IEEE conference on computer vision and pattern recognition, 2016.
(文献2)
Cao, Zhe, et al., "Realtime multi-person 2d pose estimation using part affinity fields.", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017.
確率算出部205において、各関節の座標、並びに固有物体の座標及び大きさに基づいて主被写体らしさを表す確率を算出する方法について説明する。以下では、機械学習の一手法であるニューラルネットワークを用いる場合について説明する。
式(1)において、xiは入力層501のi番目のニューロン504に入力される値を表す。和は、j番目のニューロンと接続されている、入力層501の全てのニューロン504に対してとるものとする。bjはバイアスと呼ばれ、j番目のニューロン504の発火のしやすさをコントロールするパラメータである。また、式(2)で定義される関数hは、ReLU(Rectified Linear Unit)と呼ばれる活性化関数である。活性化関数としては、シグモイド関数など別の関数を用いることも可能である。
式(3)において、zjは中間層502のj番目のニューロン504が出力する値を表し、i,k=0,1である。0は非主被写体、1は主被写体に対応する。和は、k番目のニューロンと接続されている、中間層502の全てのニューロンに対してとるものとする。また、式(4)で定義される関数fは、ソフトマックス関数と呼ばれ、k番目のクラスに属する確率値を出力する。本実施形態では、f(y1)を主被写体らしさを表す確率として用いる。
式(5)において、添え字のmは学習対象の被写体のインデックスを表している。ymは出力層503におけるk=1のニューロン504から出力される確率値であり、tmは正解ラベルである。損失関数は、式(5)の他にも、平均二乗誤差など、正解ラベルとの一致度を測れる関数であれば、何でもよい。式(5)に基づいて最適化することにより、正解ラベルと出力される確率値とが近づくように重みやバイアスを決定することができる。
第1の実施形態において、姿勢情報の取得に誤差がある場合や、欠損値があった場合には、正確に確率値が算出できず、確率値が低くなることが想定される。また、確率の最大値に近い確率を有する被写体が複数存在する場合も考えられる。このような場合に単純に確率が最大の被写体を主被写体と判定すると、判定精度が低下する可能性がある。
P=P1+(P1-P2) ・・・(6)
式(6)を用いる方法以外にも、例えば、複数の過去のフレーム(処理対象画像の前に撮影された複数の画像)の主被写体情報を読みこみ、加速度などを考慮して予測する方法を用いてもよい。
第3の実施形態では、処理の高速化のため、処理の対象領域を限定して主被写体を判定する構成について説明する。第3の実施形態において、撮像装置100の基本的な構成は第1の実施形態と同様である(図1参照)。また、画像処理部152の基本的な構成については、第1の実施形態と同様であってもよいし、第2の実施形態と同様であってもよい(図2及び図6参照)。以下、主に第1及び第2の実施形態と異なる点について説明する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (19)
- 第1の画像から複数の被写体を検出する被写体検出手段と、
前記複数の被写体それぞれの複数の関節の位置を取得することによって、各被写体の姿勢情報を取得する取得手段と、
前記複数の被写体それぞれについて、前記被写体の前記姿勢情報に基づいて前記被写体が前記第1の画像の主被写体である可能性の度合いに対応する信頼度を算出する算出手段と、
前記複数の被写体について算出された複数の前記信頼度に基づいて、前記複数の被写体の中から前記第1の画像の主被写体を判定する判定手段と、
を備え、
前記算出手段は、事前に行われた機械学習の結果に基づいて前記信頼度を算出する
ことを特徴とする主被写体判定装置。 - 前記被写体検出手段は、前記複数の被写体として複数の人物を検出し、
前記取得手段は、前記複数の被写体それぞれの前記姿勢情報として、前記人物の複数の関節の位置を取得する
ことを特徴とする請求項1に記載の主被写体判定装置。 - 前記第1の画像から、前記複数の被写体とは異なる所定の種類の物体を検出する物体検出手段を更に備え、
前記算出手段は、前記複数の被写体それぞれについて、前記被写体の前記姿勢情報と前記物体の位置及び大きさの少なくとも一方とに基づいて前記信頼度を算出する
ことを特徴とする請求項1又は2に記載の主被写体判定装置。 - 前記物体検出手段は、前記所定の種類の物体として、前記第1の画像の撮影シーンに基づいて決定される種類の物体を検出する
ことを特徴とする請求項3に記載の主被写体判定装置。 - 前記物体の位置に基づいて、前記第1の画像における主被写体の判定対象領域を設定する設定手段を更に備え、
前記複数の被写体は、前記判定対象領域に含まれる被写体である
ことを特徴とする請求項3又は4に記載の主被写体判定装置。 - 前記第1の画像より時系列が前の複数の画像の主被写体の位置に基づいて、前記第1の画像における主被写体の位置を予測する予測手段と、
前記予測された位置に基づいて、前記第1の画像における主被写体の判定対象領域を設定する設定手段と、
を更に備え、
前記複数の被写体は、前記判定対象領域に含まれる被写体である
ことを特徴とする請求項1乃至4のいずれか1項に記載の主被写体判定装置。 - 前記第1の画像より時系列が前の複数の画像における主被写体の位置に基づいて、前記第1の画像における主被写体の位置を予測する予測手段を更に備え、
前記判定手段は、前記複数の被写体の中に第1の閾値を超える信頼度を持つ被写体が存在するか否かを判定し、
前記複数の被写体の中に前記第1の閾値を超える信頼度を持つ被写体が存在しない場合、前記判定手段は、前記予測された位置に基づいて前記第1の画像の主被写体を判定する
ことを特徴とする請求項1乃至5のいずれか1項に記載の主被写体判定装置。 - 前記判定手段は、前記第1の画像の主被写体の情報を利用する撮像装置に設定されている撮影モードの種類に応じて、前記第1の閾値を変更する
ことを特徴とする請求項7に記載の主被写体判定装置。 - 前記第1の画像より時系列が前の複数の画像における主被写体の位置に基づいて、前記第1の画像における主被写体の位置を予測する予測手段を更に備え、
前記判定手段は、前記複数の前記信頼度の最大値を取得し、前記複数の前記信頼度の中に前記最大値との差の絶対値が第2の閾値未満である信頼度が複数存在するか否かを判定し、
前記複数の前記信頼度の中に前記最大値との差の絶対値が前記第2の閾値未満である信頼度が複数存在する場合、前記判定手段は、前記予測された位置に基づいて前記第1の画像の主被写体を判定する
ことを特徴とする請求項1乃至5のいずれか1項に記載の主被写体判定装置。 - 前記判定手段は、前記複数の前記信頼度の最大値を取得し、前記複数の前記信頼度の中に前記最大値との差の絶対値が第2の閾値未満である信頼度が複数存在するか否かを判定し、
前記複数の前記信頼度の中に前記最大値との差の絶対値が前記第2の閾値未満である信頼度が複数存在する場合、前記判定手段は、前記最大値との差の絶対値が前記第2の閾値未満である信頼度を持つ被写体のうち、前記複数の被写体のうち前記第1の画像の中心に最も近い被写体を、前記第1の画像の主被写体として判定する
ことを特徴とする請求項1乃至5のいずれか1項に記載の主被写体判定装置。 - 前記判定手段は、前記第1の画像の主被写体の情報を利用する撮像装置に設定されている撮影モードの種類に応じて、前記第2の閾値を変更する
ことを特徴とする請求項9又は10に記載の主被写体判定装置。 - 前記信頼度は、前記被写体が前記第1の画像の主被写体である確率を示す
ことを特徴とする請求項1乃至11のいずれか1項に記載の主被写体判定装置。 - 前記判定手段は、前記複数の前記信頼度に基づいて、前記複数の被写体のうち前記第1の画像の主被写体である可能性が最も高い被写体を前記第1の画像の主被写体として判定する
ことを特徴とする請求項1乃至12のいずれか1項に記載の主被写体判定装置。 - 第1の画像から複数の被写体を検出する被写体検出手段と、
前記複数の被写体それぞれの複数の関節の位置を取得することによって、各被写体の姿勢情報を取得する取得手段と、
前記取得手段にて取得された前記複数の被写体それぞれの前記姿勢情報に基づいて、前記複数の被写体の中から前記第1の画像の主被写体を判定する判定手段と、
前記第1の画像より時系列が前の複数の画像の主被写体の位置に基づいて、前記第1の画像における主被写体の位置を予測する予測手段と、
前記予測された位置に基づいて、前記第1の画像における主被写体の判定対象領域を設定する設定手段と、
を備え、
前記複数の被写体は、前記判定対象領域に含まれる被写体である
ことを特徴とする主被写体判定装置。 - 請求項1乃至14のいずれか1項に記載の主被写体判定装置と、
撮像手段と、
を備え、
前記第1の画像は、前記撮像手段により撮像された画像である
ことを特徴とする撮像装置。 - 前記判定手段により判定された前記第1の画像の主被写体の情報に基づいて撮像制御を行う撮像制御手段を更に備える
ことを特徴とする請求項15に記載の撮像装置。 - 主被写体判定装置が実行する主被写体判定方法であって、
第1の画像から複数の被写体を検出する被写体検出工程と、
前記複数の被写体それぞれの複数の関節の位置を取得することによって、各被写体の姿勢情報を取得する取得工程と、
前記複数の被写体それぞれについて、前記被写体の前記姿勢情報に基づいて前記被写体が前記第1の画像の主被写体である可能性の度合いに対応する信頼度を算出する算出工程と、
前記複数の被写体について算出された複数の前記信頼度に基づいて、前記複数の被写体の中から前記第1の画像の主被写体を判定する判定工程と、
を備え、
前記算出工程では、事前に行われた機械学習の結果に基づいて前記信頼度を算出する
ことを特徴とする主被写体判定方法。 - 主被写体判定装置が実行する主被写体判定方法であって、
第1の画像から複数の被写体を検出する被写体検出工程と、
前記複数の被写体それぞれの複数の関節の位置を取得することによって、各被写体の姿勢情報を取得する取得工程と、
前記取得工程にて取得された前記複数の被写体それぞれの前記姿勢情報に基づいて、前記複数の被写体の中から前記第1の画像の主被写体を判定する判定工程と、
前記第1の画像より時系列が前の複数の画像の主被写体の位置に基づいて、前記第1の画像における主被写体の位置を予測する予測工程と、
前記予測された位置に基づいて、前記第1の画像における主被写体の判定対象領域を設定する設定工程と、
を備え、
前記複数の被写体は、前記判定対象領域に含まれる被写体である
ことを特徴とする主被写体判定方法。 - コンピュータを、請求項1乃至14のいずれか1項に記載の主被写体判定装置の各手段として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019196616A JP7525990B2 (ja) | 2019-10-29 | 2019-10-29 | 主被写体判定装置、撮像装置、主被写体判定方法、及びプログラム |
US17/080,445 US11394870B2 (en) | 2019-10-29 | 2020-10-26 | Main subject determining apparatus, image capturing apparatus, main subject determining method, and storage medium |
US17/846,710 US20220321792A1 (en) | 2019-10-29 | 2022-06-22 | Main subject determining apparatus, image capturing apparatus, main subject determining method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019196616A JP7525990B2 (ja) | 2019-10-29 | 2019-10-29 | 主被写体判定装置、撮像装置、主被写体判定方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021071794A JP2021071794A (ja) | 2021-05-06 |
JP2021071794A5 JP2021071794A5 (ja) | 2022-11-08 |
JP7525990B2 true JP7525990B2 (ja) | 2024-07-31 |
Family
ID=75586505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019196616A Active JP7525990B2 (ja) | 2019-10-29 | 2019-10-29 | 主被写体判定装置、撮像装置、主被写体判定方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US11394870B2 (ja) |
JP (1) | JP7525990B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7444604B2 (ja) * | 2019-12-26 | 2024-03-06 | キヤノン株式会社 | 画像処理装置及び方法、及び撮像装置 |
EP4096209B1 (en) * | 2020-01-24 | 2024-09-18 | Sony Group Corporation | Information processing device, information processing method, and information processing program |
JP7566586B2 (ja) * | 2020-10-30 | 2024-10-15 | 株式会社東芝 | 推定装置、推定システム、推定方法及びプログラム |
US11394865B1 (en) * | 2021-06-28 | 2022-07-19 | Western Digital Technologies, Inc. | Low-power, fast-response machine learning autofocus enhancements |
JP2023084461A (ja) * | 2021-12-07 | 2023-06-19 | キヤノン株式会社 | 主被写体判定装置、撮像装置、主被写体判定方法、及びプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001076149A (ja) | 1999-09-06 | 2001-03-23 | Fuji Photo Film Co Ltd | 主要被写体抽出方法および装置 |
JP2013206273A (ja) | 2012-03-29 | 2013-10-07 | Sony Corp | 情報処理装置、情報処理方法、および情報処理システム |
JP2016046642A (ja) | 2014-08-21 | 2016-04-04 | キヤノン株式会社 | 情報処理システム、情報処理方法及びプログラム |
WO2019012817A1 (ja) | 2017-07-14 | 2019-01-17 | ソニー株式会社 | 画像処理装置、画像処理装置の画像処理方法、プログラム |
JP2019106631A (ja) | 2017-12-12 | 2019-06-27 | セコム株式会社 | 画像監視装置 |
WO2020178876A1 (en) | 2019-03-01 | 2020-09-10 | Nec Corporation | Image forming apparatus, determination apparatus, image forming method, and non-transitory computer readable medium storing image forming program |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7130454B1 (en) * | 1998-07-20 | 2006-10-31 | Viisage Technology, Inc. | Real-time facial recognition and verification system |
US20060018516A1 (en) * | 2004-07-22 | 2006-01-26 | Masoud Osama T | Monitoring activity using video information |
JP4665780B2 (ja) * | 2006-01-30 | 2011-04-06 | ソニー株式会社 | 顔重要度判定装置、方法、および撮像装置 |
US8073190B2 (en) * | 2007-11-16 | 2011-12-06 | Sportvision, Inc. | 3D textured objects for virtual viewpoint animations |
US8085982B1 (en) * | 2008-06-20 | 2011-12-27 | Google Inc. | Object tracking in video with visual constraints |
JP5285575B2 (ja) | 2009-11-04 | 2013-09-11 | 日本放送協会 | 人物行動判定装置及びそのプログラム |
JP5757063B2 (ja) * | 2010-03-29 | 2015-07-29 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP2012070222A (ja) | 2010-09-24 | 2012-04-05 | Nec Casio Mobile Communications Ltd | 撮像装置、撮像方法、及び撮像プログラム |
JP6032921B2 (ja) * | 2012-03-30 | 2016-11-30 | キヤノン株式会社 | 物体検出装置及びその方法、プログラム |
WO2014104360A1 (ja) * | 2012-12-28 | 2014-07-03 | 株式会社東芝 | 動作情報処理装置及び方法 |
US9323991B2 (en) * | 2013-11-26 | 2016-04-26 | Xerox Corporation | Method and system for video-based vehicle tracking adaptable to traffic conditions |
CA2973126A1 (en) * | 2014-01-07 | 2015-07-16 | Arb Labs Inc. | Systems and methods of monitoring activities at a gaming venue |
WO2017015947A1 (en) * | 2015-07-30 | 2017-02-02 | Xiaogang Wang | A system and a method for object tracking |
US9940544B2 (en) * | 2016-06-08 | 2018-04-10 | Adobe Systems Incorporated | Event image curation |
CN107239728B (zh) * | 2017-01-04 | 2021-02-02 | 赛灵思电子科技(北京)有限公司 | 基于深度学习姿态估计的无人机交互装置与方法 |
US10713794B1 (en) * | 2017-03-16 | 2020-07-14 | Facebook, Inc. | Method and system for using machine-learning for object instance segmentation |
US10929829B1 (en) * | 2017-05-04 | 2021-02-23 | Amazon Technologies, Inc. | User identification and account access using gait analysis |
US10748376B2 (en) * | 2017-09-21 | 2020-08-18 | NEX Team Inc. | Real-time game tracking with a mobile device using artificial intelligence |
US10628961B2 (en) * | 2017-10-13 | 2020-04-21 | Qualcomm Incorporated | Object tracking for neural network systems |
CN108224691B (zh) * | 2017-12-22 | 2019-08-16 | 银河水滴科技(北京)有限公司 | 一种空调系统控制方法和装置 |
US11074711B1 (en) * | 2018-06-15 | 2021-07-27 | Bertec Corporation | System for estimating a pose of one or more persons in a scene |
US11238612B2 (en) * | 2018-08-28 | 2022-02-01 | Beijing Jingdong Shangke Information Technology Co., Ltd. | Device and method of tracking poses of multiple objects based on single-object pose estimator |
WO2020069634A1 (en) * | 2018-10-02 | 2020-04-09 | Intel Corporation | Method and system for game status determination |
US10666858B2 (en) * | 2018-10-30 | 2020-05-26 | Sony Corporation | Deep-learning-based system to assist camera autofocus |
US11281896B2 (en) * | 2018-11-15 | 2022-03-22 | Smith & Nephew, Inc. | Physical activity quantification and monitoring |
US10937169B2 (en) * | 2018-12-18 | 2021-03-02 | Qualcomm Incorporated | Motion-assisted image segmentation and object detection |
US11288835B2 (en) * | 2019-09-20 | 2022-03-29 | Beijing Jingdong Shangke Information Technology Co., Ltd. | Lighttrack: system and method for online top-down human pose tracking |
US11144766B2 (en) * | 2019-09-25 | 2021-10-12 | Sony Group Corporation | Method for fast visual data annotation |
-
2019
- 2019-10-29 JP JP2019196616A patent/JP7525990B2/ja active Active
-
2020
- 2020-10-26 US US17/080,445 patent/US11394870B2/en active Active
-
2022
- 2022-06-22 US US17/846,710 patent/US20220321792A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001076149A (ja) | 1999-09-06 | 2001-03-23 | Fuji Photo Film Co Ltd | 主要被写体抽出方法および装置 |
JP2013206273A (ja) | 2012-03-29 | 2013-10-07 | Sony Corp | 情報処理装置、情報処理方法、および情報処理システム |
JP2016046642A (ja) | 2014-08-21 | 2016-04-04 | キヤノン株式会社 | 情報処理システム、情報処理方法及びプログラム |
WO2019012817A1 (ja) | 2017-07-14 | 2019-01-17 | ソニー株式会社 | 画像処理装置、画像処理装置の画像処理方法、プログラム |
JP2019106631A (ja) | 2017-12-12 | 2019-06-27 | セコム株式会社 | 画像監視装置 |
WO2020178876A1 (en) | 2019-03-01 | 2020-09-10 | Nec Corporation | Image forming apparatus, determination apparatus, image forming method, and non-transitory computer readable medium storing image forming program |
Non-Patent Citations (1)
Title |
---|
Kranthi Kiran GV ET AL,Real-Time Aerial Suspicious Analysis (ASANA) System for the Identification and Re-Identification of Suspicious Individuals using the Bayesian ScatterNet Hybrid (BSH) Network,2019 IEEE/CVF International Conference on Computer Vision Workshop (ICCVW),米国,IEEE,2019年10月28日,p73-81,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9022217,DOI: 10.1109/ICCVW.2019.00015 |
Also Published As
Publication number | Publication date |
---|---|
US20210127068A1 (en) | 2021-04-29 |
US20220321792A1 (en) | 2022-10-06 |
US11394870B2 (en) | 2022-07-19 |
JP2021071794A (ja) | 2021-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7525990B2 (ja) | 主被写体判定装置、撮像装置、主被写体判定方法、及びプログラム | |
US8314854B2 (en) | Apparatus and method for image recognition of facial areas in photographic images from a digital camera | |
US7889886B2 (en) | Image capturing apparatus and image capturing method | |
JP4497236B2 (ja) | 検出用情報登録装置、電子機器、検出用情報登録装置の制御方法、電子機器の制御方法、検出用情報登録装置制御プログラム、電子機器の制御プログラム | |
US8831282B2 (en) | Imaging device including a face detector | |
JP6049448B2 (ja) | 被写体領域追跡装置、その制御方法及びプログラム | |
CN102542254B (zh) | 图像处理装置及图像处理方法 | |
US10013632B2 (en) | Object tracking apparatus, control method therefor and storage medium | |
US20200412982A1 (en) | Laminated image pickup device, image pickup apparatus, image pickup method, and recording medium recorded with image pickup program | |
JPWO2021095085A1 (ja) | 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム | |
US12002279B2 (en) | Image processing apparatus and method, and image capturing apparatus | |
JP6555940B2 (ja) | 被写体追跡装置、撮像装置、及び被写体追跡装置の制御方法 | |
JP2019134204A (ja) | 撮像装置 | |
JP2013179614A (ja) | 撮像装置 | |
JP7566471B2 (ja) | 画像処理装置、撮像装置、画像処理方法およびプログラム | |
US20230177860A1 (en) | Main object determination apparatus, image capturing apparatus, and method for controlling main object determination apparatus | |
JP2022099120A (ja) | 被写体追尾装置およびその制御方法 | |
WO2023106103A1 (ja) | 画像処理装置およびその制御方法 | |
US20230276117A1 (en) | Main object determination apparatus, imaging apparatus, and control method for controlling main object determination apparatus | |
JPH10255058A (ja) | 動作検出装置および動作検出方法 | |
US20240078830A1 (en) | Image processing apparatus and image processing method | |
US20230140436A1 (en) | Action determination apparatus, image capturing apparatus, action determination method, and storage medium | |
JP2023086274A (ja) | 画像処理装置およびその制御方法 | |
JP2024056441A (ja) | 画像処理装置、画像処理装置の制御方法およびプログラム | |
TW202411949A (zh) | 臉部屬性的串級偵測 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221028 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221028 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240719 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7525990 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |