JP2020095707A - ディープブラインド画像領域予測を用いたアライメントフリービデオ変化検出 - Google Patents
ディープブラインド画像領域予測を用いたアライメントフリービデオ変化検出 Download PDFInfo
- Publication number
- JP2020095707A JP2020095707A JP2019211687A JP2019211687A JP2020095707A JP 2020095707 A JP2020095707 A JP 2020095707A JP 2019211687 A JP2019211687 A JP 2019211687A JP 2019211687 A JP2019211687 A JP 2019211687A JP 2020095707 A JP2020095707 A JP 2020095707A
- Authority
- JP
- Japan
- Prior art keywords
- patch
- image
- query image
- reference image
- reconstruction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/48—Matching video sequences
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Closed-Circuit Television Systems (AREA)
Abstract
Description
図3の画像310のような画像は、視覚的要素から構成される。用語「画素」、「画素位置」、および「画像位置」は、本明細書全体を通して、撮像された画像内の視覚要素のうちの1つを指すために互換的に使用される。画像の各画素は、集合的に「画素値」と呼ばれる1つ以上の値によって記述され、画像内の撮像されたシーンの特性を特徴付ける。画素値は、単一の強度値(画素位置におけるシーンの輝度を特徴付ける)、値のトリプレット(画素位置におけるシーンの色を特徴付ける)等を含む。
参照画像シーケンスおよびクエリ画像を撮像するステップと、参照画像に基づいて再構成モデルをトレーニングするステップと、トレーニングされた再構成モデルを使用してクエリ画像を再構成するステップと、シーン変化を検出するためにクエリ画像と再構成されたクエリ画像とを比較するステップと、を含むAVCD構成が開示される。開示されたAVCD構成は、同一の視点から又は同一の環境条件の下でシーンを撮像するために、基準画像シーケンス及びクエリ画像を必要としない。さらに、開示されたAVCD構成は、参照画像に対するクエリ画像の時間的または空間的な位置合わせを必要としない。これは、AVCD構成がクエリ画像と、既に互いに位置合わせされ且つ同じ視点および環境条件を有する再構成されたクエリ画像とを比較するためである。最後に、開示されたAVCD構成は、参照シーケンスの長さとは無関係に、比較ステップおよび検出ステップのための固定された計算コストで実施することができる。
図2Aおよび図2Bは、説明した各種AVCD構成が実施可能な汎用コンピュータシステム250を示している。
・ メモリ位置228、229、230から命令231をフェッチするかまたは読み出すフェッチ動作
・ 制御ユニット239が、どの命令がフェッチされたかを判定するデコード動作
・ 制御ユニット239及び/又はALU240が命令を実行する実行動作
を有する。
図4は、1つのAVCD構成による、参照画像シーケンスとクエリ画像とを比較することによってシーンの変化を検出する方法400を示す。方法400はハードディスクドライブ210に備えられ、プロセッサ205によってその実行が制御されるソフトウェアアプリケーションプログラム233の1つまたは複数のソフトウェアコードモジュールとして実施することができる。以下の説明は、方法400の主要なステップについての詳細、例、および代替的な実装を提供する。サブプロセス430および450のさらなる詳細、例、および代替の実装は、それぞれ図5および図7を参照して後述される。
Claims (14)
- 移動カメラにより、異なる時間に撮像された画像間のシーンの変化を検出する方法であって、
前記移動カメラによって撮像された参照画像に基づく再構成モデルを用いて、前記移動カメラによって撮像されたクエリ画像に対応する画像を生成するステップと、
前記クエリ画像と前記生成された画像とを比較することによって前記シーンの変化を検出するステップと、
を有することを特徴とする方法。 - 更に、
前記参照画像から前記再構成モデルをトレーニングするステップを有し、該ステップは、
前記参照画像における1以上のパッチバウンディングボックスを決定するステップと、
前記再構成モデルを用いて、前記参照画像における前記1以上のパッチバウンディングボックスについて予測パッチを計算するステップと、
前記参照画像の前記1以上のパッチバウンディングボックスおよび対応する予測パッチに基づいてトレーニング損失を計算するステップと、
前記トレーニング損失に基づいて再構成モデルを更新するステップと、を有することを特徴とする請求項1に記載の方法。 - 前記予測パッチの計算、前記トレーニング損失の計算、および前記再構成モデルの更新は、トレーニングが収束するまで繰り返されることを特徴とする請求項2に記載の方法。
- 前記再構成モデルのトレーニングにおいて、前記参照画像の前記1以上のパッチバウンディングボックスは、前記参照画像において検出されたキーポイントに基づいて決定されることを特徴とする請求項2に記載の方法。
- 前記クエリ画像に対応する画像を生成するステップは、
前記クエリ画像における1以上のパッチバウンディングボックスを決定するステップと、
前記再構成モデルを用いて、前記クエリ画像の前記1以上のパッチバウンディングボックスのそれぞれについて予測パッチを計算するステップと、
前記クエリ画像の、前記1以上のパッチバウンディングボックスおよび対応する予測パッチに基づいて、前記予測パッチについて予測誤差を計算するステップと、
前記予測パッチおよび対応する予測誤差に基づいて、各画素位置で予測画素値を選択することによって前記クエリ画像を再構成するステップと、を有することを特徴とする請求項1に記載の方法。 - 前記予測画素値は、
予測誤差が最も小さい予測パッチから予測されることを特徴とする請求項5に記載の方法。 - 前記予測パッチの計算は、
前記参照画像の前記1以上のパッチバウンディングボックスのそれぞれを取り囲む環状領域から特徴を抽出し、前記抽出された特徴に基づいて計算されることを特徴とする請求項2に記載の方法。 - 更に、
前記環状領域から前記特徴が抽出されるように、前記特徴を抽出する前に前記参照画像を前処理するステップを有することを特徴とする請求項7に記載の方法。 - 前記予測パッチの計算は、
前記クエリ画像の前記1以上のパッチバウンディングボックスのそれぞれを取り囲む環状領域から抽出された特徴に基づいて計算されることを特徴とする請求項5に記載の方法。 - 更に、
前記環状領域から前記特徴が抽出されるように、前記特徴を抽出する前に前記クエリ画像を前処理するステップを有することを特徴とする請求項9に記載の方法。 - 前記参照画像は、異なる視点で前記シーンが撮像された複数の画像であることを特徴とする請求項1に記載の方法。
- 前記再構成モデルは、逆ガウスフィルタを備えることを特徴とする請求項1に記載の方法。
- 請求項1ないし請求項12のうちいずれか1項に記載の方法をコンピュータに実行させるためのプログラム。
- 請求項13に記載のプログラムを記憶したコンピュータ可読な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/216,868 US10915755B2 (en) | 2018-12-11 | 2018-12-11 | Alignment-free video change detection using deep blind image region prediction |
US16/216,868 | 2018-12-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020095707A true JP2020095707A (ja) | 2020-06-18 |
JP6967056B2 JP6967056B2 (ja) | 2021-11-17 |
Family
ID=70971034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019211687A Active JP6967056B2 (ja) | 2018-12-11 | 2019-11-22 | ディープブラインド画像領域予測を用いたアライメントフリービデオ変化検出 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10915755B2 (ja) |
JP (1) | JP6967056B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024009661A1 (ja) * | 2022-07-04 | 2024-01-11 | 国立大学法人静岡大学 | 推定システム、推定方法、および推定プログラム |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11080835B2 (en) * | 2019-01-09 | 2021-08-03 | Disney Enterprises, Inc. | Pixel error detection system |
CN113824949A (zh) * | 2020-06-19 | 2021-12-21 | 中兴通讯股份有限公司 | 一种摄像机视频质量诊断方法、设备和存储介质 |
CN112541462A (zh) * | 2020-12-21 | 2021-03-23 | 南京烨鸿智慧信息技术有限公司 | 用于有机废气的光净化效果检测的神经网络的训练方法 |
JP2022145001A (ja) * | 2021-03-19 | 2022-10-03 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10214328A (ja) * | 1997-01-30 | 1998-08-11 | Hitachi Software Eng Co Ltd | 画像情報解析装置及び画像情報解析プログラムを有する記憶媒体 |
JP2001266110A (ja) * | 2000-03-16 | 2001-09-28 | Ntt Data Corp | 画像位置合わせ方式、及び方法 |
JP2009538582A (ja) * | 2006-05-24 | 2009-11-05 | イメージリーコン,エルエルシー | 画像のノイズ除去及び制御されたブレ除去のための曲率保存フィルタ |
JP2013114510A (ja) * | 2011-11-29 | 2013-06-10 | Nippon Hoso Kyokai <Nhk> | 画像空間超解像装置及びプログラム |
JP2018097506A (ja) * | 2016-12-12 | 2018-06-21 | 株式会社日立製作所 | 衛星画像処理システム及び方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8427472B2 (en) * | 2005-02-08 | 2013-04-23 | Seegrid Corporation | Multidimensional evidence grids and system and methods for applying same |
GB0920111D0 (en) | 2009-11-18 | 2009-12-30 | Bae Systems Plc | Image processing |
US8620093B2 (en) * | 2010-03-15 | 2013-12-31 | The United States Of America As Represented By The Secretary Of The Army | Method and system for image registration and change detection |
KR102128319B1 (ko) * | 2014-10-24 | 2020-07-09 | 에스케이 텔레콤주식회사 | 팬틸트줌 카메라 기반의 영상 재생방법 및 장치 |
-
2018
- 2018-12-11 US US16/216,868 patent/US10915755B2/en active Active
-
2019
- 2019-11-22 JP JP2019211687A patent/JP6967056B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10214328A (ja) * | 1997-01-30 | 1998-08-11 | Hitachi Software Eng Co Ltd | 画像情報解析装置及び画像情報解析プログラムを有する記憶媒体 |
JP2001266110A (ja) * | 2000-03-16 | 2001-09-28 | Ntt Data Corp | 画像位置合わせ方式、及び方法 |
JP2009538582A (ja) * | 2006-05-24 | 2009-11-05 | イメージリーコン,エルエルシー | 画像のノイズ除去及び制御されたブレ除去のための曲率保存フィルタ |
JP2013114510A (ja) * | 2011-11-29 | 2013-06-10 | Nippon Hoso Kyokai <Nhk> | 画像空間超解像装置及びプログラム |
JP2018097506A (ja) * | 2016-12-12 | 2018-06-21 | 株式会社日立製作所 | 衛星画像処理システム及び方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024009661A1 (ja) * | 2022-07-04 | 2024-01-11 | 国立大学法人静岡大学 | 推定システム、推定方法、および推定プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6967056B2 (ja) | 2021-11-17 |
US10915755B2 (en) | 2021-02-09 |
US20200184224A1 (en) | 2020-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6967056B2 (ja) | ディープブラインド画像領域予測を用いたアライメントフリービデオ変化検出 | |
JP7221089B2 (ja) | 動的な交通参加者の除去による位置推定と地図生成の安定した同時実行 | |
WO2022100470A1 (en) | Systems and methods for target detection | |
US11443454B2 (en) | Method for estimating the pose of a camera in the frame of reference of a three-dimensional scene, device, augmented reality system and computer program therefor | |
US8977060B2 (en) | Motion stabilization and detection of articulated objects | |
CN109035304B (zh) | 目标跟踪方法、介质、计算设备和装置 | |
US9230175B2 (en) | System and method for motion detection in a surveillance video | |
US10503981B2 (en) | Method and apparatus for determining similarity of objects in images | |
US10192314B2 (en) | Method, system and apparatus for determining a lowest point of a target object in an image | |
RU2484531C2 (ru) | Устройство обработки видеоинформации системы охранной сигнализации | |
US11080559B2 (en) | Product onboarding machine | |
CN111881853B (zh) | 一种超大桥隧中异常行为识别方法和装置 | |
Zhao et al. | Stochastic human segmentation from a static camera | |
US20200027207A1 (en) | Negative Sample Enhanced Object Detection Machine | |
WO2009152509A1 (en) | Method and system for crowd segmentation | |
AU2015203666A1 (en) | Methods and systems for controlling a camera to perform a task | |
Wang et al. | Intrusion detection for high-speed railways based on unsupervised anomaly detection models | |
US10706499B2 (en) | Image processing using an artificial neural network | |
CN110969173A (zh) | 目标分类方法及装置 | |
CN113158963A (zh) | 一种高空抛物的检测方法及装置 | |
Fuertes et al. | People detection with omnidirectional cameras using a spatial grid of deep learning foveatic classifiers | |
Raja et al. | Ugen: Uav and gan-aided ensemble network for post-disaster survivor detection through oran | |
US20220222940A1 (en) | Methods of real-time spatio-temporal activity detection and categorization from untrimmed video segments | |
Walczak et al. | Locating occupants in preschool classrooms using a multiple RGB-D sensor system | |
Tian et al. | High confidence detection for moving target in aerial video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191122 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210305 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211022 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6967056 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |