[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2007329788A - 画像符号化装置 - Google Patents

画像符号化装置 Download PDF

Info

Publication number
JP2007329788A
JP2007329788A JP2006160490A JP2006160490A JP2007329788A JP 2007329788 A JP2007329788 A JP 2007329788A JP 2006160490 A JP2006160490 A JP 2006160490A JP 2006160490 A JP2006160490 A JP 2006160490A JP 2007329788 A JP2007329788 A JP 2007329788A
Authority
JP
Japan
Prior art keywords
roi
area
primary
image
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006160490A
Other languages
English (en)
Inventor
Kenji Kobayashi
健二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2006160490A priority Critical patent/JP2007329788A/ja
Publication of JP2007329788A publication Critical patent/JP2007329788A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 ROI領域とROI領域の間の領域を,効率的に画質を向上させることのできる画像符号化装置を提供する。
【解決手段】 ビデオカメラからの画像のキャプチャを行う画像入力部110と画像入力部から入力される画像の動き情報からROI領域を決定する1次ROI領域決定部112と装置全体の制御や認識に関わるアルゴリズムの実行や入力される画像の動き情報等の算出及び1次ROI領域部で決定された複数の1次ROI領域より注目する2つの1次ROI領域を選択するCPU111とCPU111で選択された2つの1次ROI領域情報から2次ROI領域を決定する2次ROI領域決定部113と人物認識や物体認識に使用するデータベースやCPU111での演算で得られた結果を格納する内部メモリ114と得られた1次及び2次のROI領域の情報を用いて入力画像の圧縮を行う画像圧縮部115とを有する。
【選択図】 図1

Description

本発明は,動画像の圧縮を行う画像符号化装置に関するものである。
従来の画像符号化装置は,画像中の動き検出を行い,検出された動き部分をROI(Region Of Interest)領域として高画質化すると言う方法が考案されている。(例えば,特許文献1参照)。
特開2004−200739号公報(19頁,第1図)
しかしながら,従来の画像符号化装置においては,画像中に動きが存在している部分はROI領域として画質が向上するが,ROI領域とROI領域の間は画質の向上をしない為,その位置にセキュリティ上の重要な情報があった場合には,その情報の精度が失われてしまうと言う課題があった。また,広範囲をROI領域とした場合には,符号量が増えすぎてしまい,記録時間が短くなってしまうと言う課題があった。
本発明は,従来の課題を解決するためになされたもので,ROI領域とROI領域の間の領域を,効果的に画質を向上させることのできる画像符号化装置を提供することを目的とする。
本発明の画像符号化装置は,外部からの入力画像を取り込む画像入力部と,画像入力部から入力される画像の動き情報等からROI領域を決定する1次ROI領域決定部と,装置全体の制御や認識に関わるアルゴリズムの実行や,入力される画像の動き情報等の算出及び,前記1次ROI領域部で決定された複数の1次ROI領域より注目する2つの1次ROI領域を選択するCPUと,前記CPUで選択された2つの1次ROI領域情報から,2次ROI領域を決定する2次ROI領域決定部と,人物認識や物体認識に使用するデータベースや,前記CPUでの演算で得られた結果を格納する内部メモリと,得られた1次,2次のROI領域の情報を用いて入力画像の圧縮を行う画像圧縮部とを有する。
この構成により,1次ROI領域に挟まれつつも,従来の画像符号化装置では背景領域と同程度の画質となっていた領域を,2次ROI領域とする事により画質を向上させる事が可能となる。ここで背景領域とは,注目すべき人や物体が存在しない,セキュリティ上重要ではない画像中の領域である。
この2次ROI領域に割り当てる符号量は,1次ROI領域に対して低い符号量を割り当てる様にレート制御を行う事により,動き情報検出等により設定された1次ROI領域の面積を拡張して広範囲を高画質化する従来方式に対して,効果的に符号量を分配できる。
また,本発明の画像符号化装置は,ユーザーから与えられた情報により,画面上に固定のROI領域を設定する事が可能な固定ROI領域決定部を有する。
この構成により,ユーザーは重点的に監視を行いたい領域を固定ROI領域とする事ができる。この固定ROI領域に割り当てる符号量は,移動物体等の他のROI領域が接近した場合のみ,通常のROI領域としての符号量を割り当て,他のROI領域が周辺に存
在しない場合には,背景領域と同等の符号量となるようにレート制御を行う。これにより,セキュリティ上重要ではない時点での符号量を低く抑える事が可能となり,且つ他のROI領域が固定ROI領域に接近したときには,両ROI領域間の領域の情報も高精度で得ることができ,セキュリティ上重要な情報を効率よく記録することが可能となる。
さらに,本発明の画像符号化装置は,前記画像圧縮部が,前記1次ROI領域決定部より得られたROI領域の情報と,前記CPUで算出した動き情報を用いて,動き方向前側の画質を向上させるレート制御を行うことを特徴とする構成を有する。
この構成により,画質を向上させた動き方向前方の発生符号量は増加するが,それに対応して動き方向の後方の符号量を下げる事により,発生符号量を抑制する。これにより,重要な情報が含まれている動き方向前方部分の画質の向上を,総発生符号量を増加させること無く実現する事が可能となる。
本発明により,重要な1次ROI領域に挟まれつつも,従来の画像符号化装置では背景領域と同程度の画質となっていた領域を,2次ROI領域として画質を向上させる事が可能となる。2次ROI領域に割り当てる符号量は,動き情報等で決定した1次ROI領域よりも少ない符号量を割り当てる様にレート制御を行う。これにより,動き情報等により得られた1次ROI領域の面積を拡張して広範囲の画質を向上させる従来方式に対して,効果的に符号量を分配する事が可能な画像符号化装置を提供することができるものである。
以下,本発明の実施の形態について,図面を用いて説明する。
(第1実施形態)
本発明の第1実施形態の画像符号化装置を図1に示す。図1において,本発明の実施の形態の画像符号化装置100は,ビデオカメラ等からの画像のキャプチャを行う画像入力部110と,画像入力部110から入力される画像の動き情報等からROI領域を決定する1次ROI領域決定部112と,装置全体の制御や認識に関わるアルゴリズムの実行や,入力される画像の動き情報等の算出及び,1次ROI領域部112で決定された複数の1次ROI領域より注目する2つの1次ROI領域を選択するCPU111と,CPU111で選択された2つの1次ROI領域情報から,2次ROI領域を決定する2次ROI領域決定部113と,人物認識や物体認識に使用するデータベースや,CPU111での演算で得られた結果を格納する内部メモリ114と,得られた1次,2次のROI領域の情報を用いて入力画像の圧縮を行う画像圧縮部1716とを有する。
以上のように構成された画像符号化装置について,図2のフローチャートを用いて動作を説明する。
ステップS201では,入力された画像から計算される物体の動き情報等を用いて1次ROI領域を決定する。物体の動き情報を使用する場合には,例えば前フレームの画像と現フレームの差分を計算し,差分が大きい場合には動きがあると判定して1次ROI領域とする。顔の認識情報や特定の物体の認識情報を使用する場合には,予め内部メモリ114に顔や物体のデータベースを保存しておき,それらのデータと照合を行って一致した場合に,1次ROI領域とする。図3の301に,物体の動き情報により検出された1次ROI領域の例を示す。
ステップS202では,決定された1次ROI領域が2つ以上であればS203に,1
つ以下であればS211に遷移する。
ステップS203では,選択された2つ以上の1次ROI領域から,注目する2つの1次ROI領域を選択する。選択の条件としては,1次ROI領域の大きさ,認識された顔情報による優先順位付け,物体の動きの速さ等がある。例えば1次ROI領域の大きさを用いる場合には,複数の1次ROI領域のそれぞれの面積を計算し,面積の大きい順に2つ1次ROI領域を選択する。
ステップS204では,選択された2つの1次ROI領域を包含する,最小の長方形を図4の401の様に決定する。
ステップS205では,決定された2つの長方形領域の,画像中の座標の位置関係を判定する。図5の520の様に2つの長方形領域のY成分に重複部分が有る場合には,「Y成分に重複部分有り」と判定する。図6の620の様に2つの長方形領域のX成分に重複部分が有る場合には,「X成分に重複部分有り」と判定する。図7の様に2つの長方形領域のX成分にもY成分にも重複部分が無い場合には,「X成分もY成分も重複部分なし」と判定する。図8の801の様に2つの長方形領域が重なる場合には,「長方形領域の重なり有り」と判定する。
ステップS206では,S205で判定された位置関係により,分岐処理を行う。「Y成分に重複部分有り」と判定された場合には,2次ROI領域決定方法A(S207)へ遷移する。「X成分に重複部分有り」と判定された場合には,2次ROI領域決定方法B(S208)へ遷移する。「X成分もY成分も重複部分なし」と判定された場合には,2次ROI領域決定方法C(S209)へ遷移する。「長方形領域の重なり有り」と判定された場合には,2次ROI領域決定方法D(S210)へ遷移する。
ステップS207では,2つの1次ROI領域のY成分に重複部分がある場合の2次ROI領域決定方法A(詳細は後ほど説明する)。処理の後,S211へ遷移する。
ステップS208では,2つの1次ROI領域のX成分に重複部分がある場合の2次ROI領域決定方法B(詳細は後ほど説明する)。処理の後,S211へ遷移する。
ステップS209では,2つの1次ROI領域のX成分,Y成分共に重複部分が無い場合の2次ROI領域決定方法C(詳細は後ほど説明する)。処理の後,S211へ遷移する。
ステップS210では,2つの1次ROI領域により構成される長方形領域が重なる場合の2次ROI領域決定方法D(詳細は後ほど説明する)。処理の後,S211へ遷移する。
ステップS211では,決定された全てのROI領域情報に対して画像圧縮処理を行う。符号量の割り当ての優先順位は,「選択された注目する2つの1次ROI領域」,「追加した2次ROI領域」,「背景領域」の順番とし,この条件の下でレート制御を実施し,圧縮した画像データを出力する。
図9のフローチャート及び図10を用いて2次ROI領域決定方法A(S207)の動作を説明する。
これ以降,図表番号に対応する(X,Y)座標を,(X_図表番号,Y_図表番号)と記述する。例えば,図10の1001の(X,Y)座標は,(X_1001,Y_1001)と表記す
る。
ステップS901では,2つの1次ROI領域の距離を求める。ここで距離とは,1つ目の1次ROI領域による長方形領域1000と,2つ目の1次ROI領域による長方形領域1010との間のX方向の距離(図10の1020)である。
ステップS902では,S901で計算した2つの長方形領域のX方向の距離(1020)が,予め設定された閾値以下であるかどうかを判断する。距離の閾値は,内部メモリ114内に格納されており,ユーザーが任意に変更する事も可能である。長方形領域のX方向の距離(1020)が閾値以下であればS903に遷移し,閾値を超えている場合は処理を終了する。
ステップS903では,2次ROI領域の4隅のX座標を決定する。図10の例では,1つ目のX座標(原点より)は,より座標原点に近い1つ目の1次ROI領域による長方形領域1000の右端であるX_1002(=X_1004)とする。2つ目のX座標(原点から離れている方)は,座標原点から離れている2つ目の1次ROI領域による長方形領域1010の左端であるX_1011(=X_1013)とする。
ステップS904では,2次ROI領域の4隅のY座標を決定する。図10の例では,1つ目Y座標(原点より)は,1つ目の1次ROI領域による長方形領域1000の下辺のY座標と,2つ目の1次ROI領域による長方形領域1010の下辺を比較し,Y座標の大きい方を選択する(図10のY_1004)。また,2つ目Y座標(原点から離れた方)は,1つ目の1次ROI領域による長方形領域1000の上辺のY座標と,2つ目の1次ROI領域による長方形領域1010の上辺のY座標を比較し,Y座標の小さい方を選択する(図10のY_1011)。
ステップS905では,S903及びS904で決定した座標を元に,2次ROI領域1030を決定する。2次ROI領域1030の長方形の4隅の座標(X,Y)はそれぞれ,図10の1031で指し示している(X_1002,Y_1011),1032で指し示している(X_1011,Y_1011),1033で指し示している(X_1002,Y_1004),1034で指し示している(X_1011,Y_1004)である。
図11のフローチャート及び図12を用いて2次ROI領域決定方法B(S208)の動作を説明する。
ステップS1101では,2つの1次ROI領域の距離を求める。ここで距離とは,1つ目の1次ROI領域による長方形領域1200と,2つ目の1次ROI領域による長方形領域1210との間のY方向の距離(図12の1220)である。
ステップS1102では,S1101で計算した2つの長方形領域のY方向の距離(1220)が,予め設定された閾値以下であるかどうかを判断する。長方形領域のY方向の距離(1220)が閾値以下であればS1103に遷移し,閾値を超えている場合は処理を終了する。
ステップS1103では,2次ROI領域の4隅のX座標を決定する。図12の例では,1つ目のX座標(原点より)は,1つ目の1次ROI領域による長方形領域1200の左辺のX座標と,2つ目の1次ROI領域による長方形領域1210の左辺を比較し,X座標の大きい方を選択する(図12のY_1213)。また,2つ目のX座標(原点から離れた方)は,1つ目の1次ROI領域による長方形領域1200の右辺のX座標と,2つ目の1次ROI領域による長方形領域1210の右辺のX座標を比較し,X座標の小さい方を
選択する(図12のY_1202)。
ステップS1104では,2次ROI領域のY座標を決定する。図12の例では,1つ目のY座標(原点より)は,より座標原点に近い1つ目の1次ROI領域による長方形領域1200の上辺であるY_1201(=Y_1201)とする。2つ目のY座標(原点から離れている方)は,座標原点から離れている2つ目の1次ROI領域による長方形領域1010の下辺であるY_1213(=Y_1214)とする。
ステップS1105では,S1103及びS1104で決定した座標を元に,長方形の2次ROI領域1230を決定する。2次ROI領域1230の長方形の4隅の座標(X,Y)はそれぞれ,図12の1231で指し示している(X_1213,Y_1213),1232で指し示している(X_1202,Y_1213),1233で指し示している(X_1213,Y_1201),1234で指し示している(X_1202,Y_1202)である。
図13のフローチャート及び図14を用いて2次ROI領域決定方法C(S209)の動作を説明する。
ステップS1301では,2つの1次ROI領域の距離を求める。ここで距離とは,1つ目の1次ROI領域による長方形領域1400と,2つ目の1次ROI領域による長方形領域1410との間のX方向の距離(図14の1420)と,Y方向の距離(図14の1421)との和である。
ステップS1302では,S1301で計算した2つの長方形領域のX方向の距離(1420)Y方向の距離(1421)との和が,予め設定された閾値以下であるかどうかを判断する。長方形領域の距離が閾値以下であればS1403に遷移し,閾値を超えている場合は処理を終了する。
ステップS1303では,2次ROI領域のX座標を決定する。図14の例では,1つ目のX座標(原点より)は,1つ目の1次ROI領域による長方形領域1400の右上の頂点1402のX座標(X_1402)であり,2つ目のX座標(原点より離れた方)は,1次ROI領域による長方形領域1410の左下の頂点1413のX座標(X_1413)である。
ステップS1304では,2次ROI領域のY座標を決定する。図14の例では,1つ目のX座標(原点より)は,1つ目の1次ROI領域による長方形領域1400の右上の頂点1402のY座標(Y_1402)であり,2つ目のX座標(原点より離れた方)は,1次ROI領域による長方形領域1410の左下の頂点1413のY座標(Y_1413)である。
ステップS1305では,S1303及びS1304で決定した座標を元に,2次ROI領域1430を決定する。2次ROI領域1430の長方形の4隅の座標(X,Y)はそれぞれ,図14の1431で指し示している(X_1402,Y_1413),1432で指し示している(X_1413,Y_1413),1433で指し示している(X_1402,Y_1402),1434で指し示している(X_1413,Y_1402)である。
図15のフローチャート及び図16を用いて2次ROI領域決定方法D(S210)の動作を説明する。
ステップS1501では,2つの1次ROI領域の長方形領域が重複する部分の状態を確認する。重複部分全てがROI領域であった場合は処理を終了する。重複部分に1次R
OI領域ではないブロックが存在する場合には,S1502へ遷移する。
ステップS1502では,2次ROI領域を決定する。2つの1次ROI領域による長方形領域の重複部分(1601)で,ROI領域ではないブロック全てを2次ROI領域(1602)とする。
以上のような本発明の第1実施形態によれば,重要な1次ROI領域に挟まれつつも,従来の画像符号化装置では背景領域と同程度の画質となっていた領域を,2次ROI領域として画質の向上ができる。ここで2次ROI領域に割り当てる符号量は,動き情報等で決定した1次ROI領域よりも符号量を割り当てないようにレート制御を行う。これにより,動き情報等から決定したROI領域の面積を拡張する従来の方式よりも,効果的に符号量を分配することが可能となる。
(第2実施形態)
本発明の第2実施形態の画像符号化装置を図17に示す。図17において,本実施形態の画像符号化装置1700は,ビデオカメラ等からの画像のキャプチャを行う画像入力部1710と,画像入力部1710から入力される画像の動き情報等からROI領域を決定する1次ROI領域決定部1712と,装置全体の制御や認識に関わるアルゴリズムの実行や,入力される画像の動き情報等の算出及び,1次ROI領域部1712で決定された複数の1次ROI領域より注目する1つの1次ROI領域を選択するCPU1711と,ユーザーからの固定ROI領域設定情報を受け付ける外部入力部1715と,ROI領域選択部1712で選択された1次ROI領域及び,外部入力部1715においてユーザが設定した固定ROI領域の2つのROI領域情報から,2次ROI領域を決定する2次ROI領域決定部1713と,認識に使用するデータベースや,CPU1711での演算で得られた結果を格納する内部メモリ1714と,得られた1次,2次,固定のROI領域の情報を用いて入力画像の圧縮を行う画像圧縮部1716とを有する。
以上のように構成された画像符号化装置について,図18のフローチャートを用いて動作を説明する。
ステップS1800では,ユーザーにより外部入力部1715を介して設定された情報を用いて,CPU1711に於いて固定ROI領域を決定する。図19の1901に,ユーザーにより設定された固定ROI領域の例を示す。ここで決定された固定ROI領域のレート制御の詳細な説明は,S1811にて説明する。
ステップS1801では,入力された画像から計算される物体の動き情報や,顔の認識情報,特定物体の認識情報等,画像より得られる各種の情報を用いて1次ROI領域を決定する。S201と同様の処理である。
ステップS1802では,決定された1次ROI領域が1つ以上であればS1803に遷移し,1次ROI領域が0の場合はS1811に遷移する。
ステップS1803では,決定された1つ以上の1次ROI領域から,注目する1つの1次ROI領域を決定する。1次ROI領域の大きさや,認識された顔による優先順位付け,物体の動きの速さ等を用いて1つの領域を選択する。決定の方法は任意である。
ステップS1804では,S1800で決定した固定ROI領域及び,S1803で決定した注目する1つの1次ROI領域に対し,包含する最小の長方形を図4の401の様に決定する。
ステップS1805では,決定された2つの長方形領域の,画像中の座標の位置関係を判定する。判定方法は,S205と同様である。
ステップS1806では,S1805で判定された位置関係により,分岐処理を行う。分岐処理は,S206と同様である。
ステップS1807では,2つのROI領域のY成分に重複部分がある場合の2次ROI領域決定方法。S207と同様の処理の為,詳細な説明は省略する。処理完了後,S1811へ遷移する。
ステップS1808では,2つのROI領域のX成分に重複部分がある場合の2次ROI領域決定方法。S208と同様の処理の為,詳細な説明は省略する。処理の後,S1811へ遷移する。
ステップS1809では,2つのROI領域のX成分,Y成分共に重複部分が無い場合の2次ROI領域決定方法。S207と同様の処理の為,詳細な説明は省略する。処理の後,S1811へ遷移する。
S1810では,2つのROI領域により構成される長方形領域が重なる場合の2次ROI領域決定方法。S207と同様の処理の為,詳細な説明は省略する。処理の後,S1811へ遷移する。
S1811では,決定された全てのROI領域情報を用いて,画像圧縮処理を行う。詳細は後ほど説明する。
図20のフローチャートを用いて,画像圧縮処理(S1811)を説明する。
ステップS2001では,動き情報等による1次ROI領域が1つ以上存在している場合,S2002へ遷移する。1次ROI領域が1つも存在していない場合は,S2005に遷移する。
ステップS2002では,2次ROI領域が存在している場合はS2003へ遷移し,存在していない場合はS2004へ遷移する。
ステップS2003では,本処理は,2つのROI領域が接近しており,2次ROI領域が存在している場合のレート制御である。符号量の割り当ての優先順位は,「選択された1次ROI領域」と「固定ROI領域」を最優先とし,その次に「追加した2次ROI領域」,最後に「背景領域」とする。この条件の下でレート制御を実施し,S2006へ遷移する。
ステップS2004では,本処理は,2つのROI領域が接近しておらず,2次ROI領域が存在していない場合のレート制御である。符号量の割り当ての優先順位は,「選択された1次ROI領域」,その次に「背景領域」とする。2つのROI領域が隣接していない場合には,「固定ROI領域」への符号量の割り当ては「背景領域」と同じとする。この条件の下でレート制御を実施し,S2006へ遷移する。
ステップS2005では,1次ROI領域が存在していない場合のレート制御。この場合は,「固定ROI」領域も「背景領域」と同等の符号量割り当てを行い,特に画質を向上させる処理は行わない。この条件の下でレート制御を実施し,S2006へ遷移する。
ステップS2006では,レート制御を除いた画像圧縮処理であり,S2003,S2004,S2005で実施したレート制御結果を用いて画像の圧縮を行い,エンコードされたストリームを出力する。
このような本発明の第2実施形態によれば,ユーザーが設定する重点的に監視を行いたい固定ROI領域に対して,他の1次ROI領域が固定ROI領域に接近したときのみ,固定ROI領域に符号量を割り当てる事により,重要ではない時点での発生符号量を低く抑える事が可能となる。更に,他の1次ROI領域が固定ROI領域に接近したときには,1次ROI領域と固定ROI領域との間を2次ROI領域として画質を向上させることができ,セキュリティ上有用な情報を記録する事が可能となる。
(第3実施形態)
本発明の第3実施形態の画像圧縮装置の構成は図1と同様である。本実施形態の画像圧縮装置について,図21のフローチャートを用いて動作を説明する。
ステップS2101では,入力された画像から計算される物体の動き情報や,顔の認識情報,特定物体の認識情報等,画像より得られる各種の情報を用いて1次ROI領域を決定する。S201と同様の処理の為,詳細な説明は省略する。
ステップS2102では,決定された1次ROI領域が2つ以上であればS2103に,1つ以下であればS2111に遷移する。
ステップS2103では,決定された2つ以上の1次ROI領域から,注目する2つの1次ROI領域を選択する。S203と同様の処理の為,詳細な説明は省略する。
ステップS2104では,選択された注目する2つの1次ROI領域それぞれに対し,包含する最小の長方形を図4の401の様に決定する。S204と同様の処理の為,詳細な説明は省略する。
ステップS2105では,決定された2つの長方形領域の,画像中の座標の位置関係を判定する。S205と同様の処理の為,詳細な説明は省略する。
ステップS2106では,S2105で判定された位置関係により,分岐処理を行う。S206と同様の処理の為,詳細な説明は省略する。
ステップS2107では,2つの1次ROI領域のY成分に重複部分がある場合の,2次ROI領域決定方法。S207と同様の処理の為,詳細な説明は省略する。
ステップS2108では,2つの1次ROI領域のX成分に重複部分がある場合の,2次ROI領域決定方法。S208と同様の処理の為,詳細な説明は省略する。
ステップS2109では,2つの1次ROI領域のX成分,Y成分共に重複部分が無い場合の,2次ROI領域決定方法。S209と同様の処理の為,詳細な説明は省略する。
ステップS2110では,2つの1次ROI領域により構成される長方形領域が重なる場合の,2次ROI領域決定方法。S210と同様の処理の為,詳細な説明は省略する。
ステップS2111では,決定された全てのROI領域情報を用いて,画像圧縮処理を行う。詳細な説明は後ほど行う。
図22のフローチャート及び図23を用いて画像圧縮処理(S2111)の動作を説明する。この例では,1次ROI領域の動き方向は右とし,2302の例に示すように,動き方向に対応するマクロブロックの幅を5とした例について説明する。
ステップS2200では,演算対象の1次ROI領域選択。2つ存在する1次ROI領域から,まだ選択されていない1次ROI領域を1つ選択する。
ステップS2201では,1次ROI領域の動き判定処理。入力画像を元に,CPU111は1次ROI領域の動き方向を求める。本実施例では動き方向は右であるが,動き方向は右に限らず任意の方向が選択可能である。
ステップS2202では,動き方向に対応するROI領域の幅が2マクロブロック以上の場合はS2203へ遷移し,動き方向に対応するROI領域の幅が2マクロブロック未満,つまり幅が1マクロブロックの場合には,S2210へ遷移する。図23の2301の例では,動き方向が横方向であり,横方向のROI領域の幅2302は5マクロブロックであるので,S2203へ遷移する。
ステップS2203では,1次ROI領域分割処理。 動き方向と,動き方向に対応するROI領域の幅情報を用いて,動き方向の前方と後方で領域を2つに分割する。動き方向前方に位置するROI領域に,通常のROI領域より符号量を多く割り当てる。この領域を前方領域と定義する。一方,動き方向後方に位置するROI領域は,通常のROI領域より符号量を下げる。この領域を後方領域と定義する。
動き方向のROI領域のマクロブロックの幅を(MB_WIDTH)と定義する。前方領域の動き方向の幅を(FWD_WIDTH)と定義し,その値を式(1)に示す。動き方向の一番先頭のマクロブロックより,FWD_WIDTHの幅に含まれる1次ROI領域全てを前方領域2310とする。
Figure 2007329788

・・・(1)
後方領域の動き方向の幅を(BACK_WIDTH)と定義し,その値を式(2)に示す。動き方向の一番後方のマクロブロックより,BACK_WIDTHの幅に含まれる1次ROI領域全てを後方領域2311とする。
Figure 2007329788

・・・(2)
図23の2301の例では,動き方向に対応するROI領域のマクロブロックの幅(MB_WIDTH)は5であり,式(1)より前方領域の幅(FWD_WIDTH)は3となる(2303)。従って,2310で示す領域が前方領域となる。また式(2)より,後方領域の
幅(BACK_WIDTH)は2となる(2304)。従って,2311で示す領域が後方領域となる。
ステップS2204では,S2203で求めた後方領域の幅(BACK_WIDTH)が2以上であれば,S2205へ遷移し,後方領域の幅(BACK_WIDTH)が1であればS2206へ遷移する。
ステップS2205では,後方領域レート制御A。後方領域を更に後方領域Aと後方領域Bの2つに分割し,それぞれの領域の目標符号量を設定してレート制御を行う。各目標符号量は,通常のROI領域の目標符号量より下げる様に設定する。なお,この例では後方領域の分割数を2としたが,分割数は2以上の任意の整数を取ることが可能である。
後方領域Aの幅(BACK_WIDTH_A)を式(3)で定義する。後方領域内に於いて,進行方向の一番先頭のマクロブロックから(BACK_WIDTH_A)分のマクロブロックが,後方領域Aとなる。(図23の例では2320)
Figure 2007329788

・・・(3)
後方領域Bの幅(BACK_WIDTH_B)を式(4)で定義する。後方領域内に於いて,進行方向の一番後方のマクロブロックより(BACK_WIDTH_B)分のマクロブロックが,後方領域Bとなる。(図23の例では2321)
Figure 2007329788

・・・(4)
後方領域Bの目標符号量は,背景領域と同等に設定する。一方,後方領域Aの目標符号量は,通常のROI領域の目標符号量と,背景領域の目標符号量の中間値に設定する。
これらの設定により,後方領域を1次ROI領域として符号化した場合より,発生符号量は減少する。この発生符号量の減少の総和を(REDUCE_AMOUNT)と定義する。
ステップS2206では,後方領域レート制御B。後方領域の幅が,マクロブロック1つの場合のレート制御。後方領域の目標符号量を背景領域と同等に設定する。この設定により,後方領域を1次ROI領域として符号化した場合より,発生符号量は減少する。この発生符号量の減少の総和を(REDUCE_AMOUNT)と定義する。
ステップS2207では,S2203で求めた前方領域の幅(FWD_WIDTH)が2以上であれば,S2208へ遷移し,前方領域の幅(FWD_WIDTH)が1であればS2209へ遷移する。
ステップS2208では,前方領域レート制御A。前方領域を更に前方領域Aと前方領域Bの2つに分割し,それぞれの領域の目標符号量を,1次ROI領域として符号化した場合より上になるように設定し,レート制御を行う。
前方領域Aの幅(FWD_WIDTH_A)を式(5)で定義する。前方領域内に於いて,進
行方向の一番先頭のマクロブロックから(FWD_WIDTH_A)分のマクロブロックが前方領域Aとなる。(図23の例では2330)
Figure 2007329788

・・・(5)
前方領域Bの幅(FWD_WIDTH_B)を式(6)で定義する。前方領域内に於いて,進行方向の一番後方のマクロブロックから(FWD_WIDTH_B)分のマクロブロックが前方領域Bとなる。(図23の例では2331)
Figure 2007329788

・・・(6)
前方領域Aに含まれる1次ROI領域のマクロブロック数を(FWD_NUM_A)とし,前方領域Bに含まれる1次ROI領域のマクロブロック数を(FWD_NUM_B)とする。
前方領域Aに追加で割り当てる符号量は,前方領域Bに対して画質を向上させる為に,前方領域Bに追加で割り当てる符号量より多く設定し,その比率αを式(7)で定義する。
Figure 2007329788

・・・(7)
αは1を超える実数とし,ユーザーが任意に設定できる。
ここで,各マクロブロックの目標符号量の計算に使用する値(ADD_TARGET)を,式(8)を用いて算出する。
Figure 2007329788

・・・(8)
1次ROI領域の各マクロブロックの目標符号量を(TARGET_MB)と定義し,前方領域Aの各マクロブロックの目標符号量(TARGET_FWD_MB_A)を式(9)を用いて算出し,前方領域Bの各マクロブロックの目標符号量(TARGET_FWD_MB_B)を式(10)を用いて算出する。
Figure 2007329788

・・・(9)
Figure 2007329788

・・・(10)
ステップS2209・・・前方領域レート制御B。前方領域の幅が,マクロブロック1つの場合のレート制御。前方領域に含まれる1次ROI領域のマクロブロック数を(FWD_NUM)と定義し,通常のROI領域の各マクロブロックの目標符号量を(TARGET_MB)と定義すると,前方領域の各マクロブロックの目標符号量(TARGET_FWD_MB)は,S2205又はS2206で求めた(REDUCE_AMOUNT)から,式(11)を用いて算出し,この値を用いてレート制御を行う。
Figure 2007329788

・・・(11)
ステップS2210…レート制御D。動き方向に対応する幅が,マクロブロック1つ分の場合には,1次ROI領域の目標符号量は1次ROI領域と同じ値に設定し,レート制御を行う。
ステップS2211…2つ目の1次ROI領域の処理が終了していない場合はS2200に戻り,2つ目の1次ROI領域に対するレート制御を行う。2つ目の1次ROI領域の処理が終了している場合には,S2212へ遷移する。
ステップS2212…求めた2つの1次ROI領域の符号量目標値を用いて,画像の符号化を行う。
2次ROI領域の符号量の目標値は,背景領域より高く,1次ROI領域の目標値の平均値より下回るように設定する。
以上のように本発明の第3の実施の形態によれば,1次ROI領域の動き方向前側の発生符号量を増加させ,その増加量に対応して進行方向の後ろ側の符号量を下げる事により,ROI領域全体の発生符号量を抑制する。このように符号量を制御する事により,総発生符号量を増加させる事無く,重要な情報が含まれている動き方向前方部分の画質を向上させる事ができる。
以上のように,本発明の画像符号化装置は,重要なROI領域に挟まれつつも,従来の画像符号化装置では背景領域と同程度の画質となっていた領域をROI領域として定義し画質の向上が可能となる。この新たに追加されたROI領域に割り当てる符号量は,動き検出等で決定したROI領域の符号量を超えないように,発生符号量のレート制御を行う。このようなレート制御を行うことにより,動き検出等により得られたROI領域の面積を拡張すると言う従来方式に対して,発生符号量を抑えることが可能となる。従って,重
要なイベントが起こった際に,ROIの周辺に対して効果的に符号量を割り当てることが可能となる効果を有し,セキュリティ向けの画像符号化装置等として有用である。
本発明の第1実施形態における画像符号化装置のブロック図 本発明の第1実施形態における画像符号化装置の動作説明の為のフロー図 本発明の第1〜第3実施形態における動き情報による1次ROI領域の決定の様子を示した説明図 本発明の第1〜第3実施形態における1次ROI領域を包含する最小の長方形を示した説明図 本発明の第1〜第3実施形態におけるY成分に重複部分がある場合の2つの1次ROI領域の位置関係を示した説明図 本発明の第1〜第3実施形態におけるX成分に重複部分がある場合の2つの1次ROI領域の位置関係を示した説明図 本発明の第1〜第3実施形態におけるX成分にもY成分にも重複部分が無い場合の2つの1次ROI領域の位置関係を示した説明図 本発明の第1〜第3実施形態における1次ROI領域により求められる2つの長方形領域が重なる場合の位置関係を示した説明図 本発明の第1〜第3実施形態における2次ROI領域決定方法Aの動作説明の為のフロー図 本発明の第1〜第3実施形態における2次ROI領域決定方法Aの動作説明の為の説明図 本発明の第1〜第3実施形態における2次ROI領域決定方法Bの動作説明の為のフロー図 本発明の第1〜第3実施形態における2次ROI領域決定方法Bの動作説明の為の説明図 本発明の第1〜第3実施形態における2次ROI領域決定方法Cの動作説明の為のフロー図 本発明の第1〜第3実施形態における2次ROI領域決定方法Cの動作説明の為の説明図 本発明の第1〜第3実施形態における2次ROI領域決定方法Dの動作説明の為のフロー図 本発明の第1〜第3の実施の形態における2次ROI領域決定方法Dの動作説明の為の説明図 本発明の第2実施形態における画像符号化装置のブロック図 本発明の第2実施形態における画像符号化装置の動作説明の為のフロー図 本発明の第2実施形態における固定ROI領域決定の例を示す説明図 本発明の第2実施形態における画像圧縮処理の動作説明の為のフロー図 本発明の第3実施形態における画像符号化装置の動作説明の為のフロー図 本発明の第3実施形態における画像圧縮処理の動作説明の為のフロー図 本発明の第3実施形態における1次ROI領域内のレート制御の説明の為の図
符号の説明
100 画像符号化装置
110 画像入力部
111 1次ROI領域決定部
112 ROI領域選択部
113 2次ROI領域決部
114 内部メモリ
115 画像圧縮部
301 動き領域による1次ROI領域
401 ROI領域を包含する最小の長方形
501 1つ目のROI領域を包含する長方形の角
502 1つ目のROI領域を包含する長方形の角
503 1つ目のROI領域を包含する長方形の角
504 1つ目のROI領域を包含する長方形の角
511 2つ目のROI領域を包含する長方形の角
512 2つ目のROI領域を包含する長方形の角
513 2つ目のROI領域を包含する長方形の角
514 2つ目のROI領域を包含する長方形の角
520 2つの長方形のYの重複部分
620 2つの長方形のXの重複部分
801 2つの長方形の重なり部分
1000 2次ROI決定方法Aにおける1つ目のROI領域を包含する長方形
1001 2次ROI決定方法Aにおける1つ目のROI領域を包含する長方形の角
1002 2次ROI決定方法Aにおける1つ目のROI領域を包含する長方形の角
1003 2次ROI決定方法Aにおける1つ目のROI領域を包含する長方形の角
1004 2次ROI決定方法Aにおける1つ目のROI領域を包含する長方形の角
1010 2次ROI決定方法Aにおける2つ目のROI領域を包含する長方形
1011 2次ROI決定方法Aにおける2つ目のROI領域を包含する長方形の角
1012 2次ROI決定方法Aにおける2つ目のROI領域を包含する長方形の角
1013 2次ROI決定方法Aにおける2つ目のROI領域を包含する長方形の角
1014 2次ROI決定方法Aにおける2つ目のROI領域を包含する長方形の角
1020 2次ROI決定方法Aにおける2つ目のROI領域の距離
1030 2次ROI決定方法Aによって追加される2次ROI領域
1031 2次ROI決定方法Aによって追加される2次ROI領域の角
1032 2次ROI決定方法Aによって追加される2次ROI領域の角
1033 2次ROI決定方法Aによって追加される2次ROI領域の角
1034 2次ROI決定方法Aによって追加される2次ROI領域の角
1200 2次ROI決定方法Bにおける1つ目のROI領域を包含する長方形
1201 2次ROI決定方法Bにおける1つ目のROI領域を包含する長方形の角
1202 2次ROI決定方法Bにおける1つ目のROI領域を包含する長方形の角
1203 2次ROI決定方法Bにおける1つ目のROI領域を包含する長方形の角
1204 2次ROI決定方法Bにおける1つ目のROI領域を包含する長方形の角
1210 2次ROI決定方法Bにおける2つ目のROI領域を包含する長方形
1211 2次ROI決定方法Bにおける2つ目のROI領域を包含する長方形の角
1212 2次ROI決定方法Bにおける2つ目のROI領域を包含する長方形の角
1213 2次ROI決定方法Bにおける2つ目のROI領域を包含する長方形の角
1214 2次ROI決定方法Bにおける2つ目のROI領域を包含する長方形の角
1220 2次ROI決定方法Bにおける2つ目のROI領域の距離
1230 2次ROI決定方法Bによって追加される2次ROI領域
1231 2次ROI決定方法Bによって追加される2次ROI領域の角
1232 2次ROI決定方法Bによって追加される2次ROI領域の角
1233 2次ROI決定方法Bによって追加される2次ROI領域の角
1234 2次ROI決定方法Bによって追加される2次ROI領域の角
1400 2次ROI決定方法Cにおける1つ目のROI領域を包含する長方形
1401 2次ROI決定方法Cにおける1つ目のROI領域を包含する長方形の角
1402 2次ROI決定方法Cにおける1つ目のROI領域を包含する長方形の角
1403 2次ROI決定方法Cにおける1つ目のROI領域を包含する長方形の角
1404 2次ROI決定方法Cにおける1つ目のROI領域を包含する長方形の角
1410 2次ROI決定方法Cにおける2つ目のROI領域を包含する長方形
1411 2次ROI決定方法Cにおける2つ目のROI領域を包含する長方形の角
1412 2次ROI決定方法Cにおける2つ目のROI領域を包含する長方形の角
1413 2次ROI決定方法Cにおける2つ目のROI領域を包含する長方形の角
1414 2次ROI決定方法Cにおける2つ目のROI領域を包含する長方形の角
1420 2次ROI決定方法Cにおける2つ目のROI領域のX方向の距離
1421 2次ROI決定方法Cにおける2つ目のROI領域のY方向の距離
1430 2次ROI決定方法Cによって追加される2次ROI領域
1431 2次ROI決定方法Cによって追加される2次ROI領域の角
1432 2次ROI決定方法Cによって追加される2次ROI領域の角
1433 2次ROI決定方法Cによって追加される2次ROI領域の角
1434 2次ROI決定方法Cによって追加される2次ROI領域の角
1601 2次ROI決定方法Dにおける2つの長方形領域の重なり部分
1602 2次ROI決定方法Dによって追加される2次ROI領域
1700 第2実施形態における画像符号化装置
1710 画像入力部
1711 CPU
1712 1次ROI領域決定部
1713 2次ROI領域決定部
1714 内部メモリ
1715 外部入力部
1716 画像圧縮部
1901 外部入力により決定された固定ROI領域の例
2301 第3実施形態における動きによるROI領域例
2302 動き方向の幅ROI領域のマクロブロックの幅(MB_WIDTH)
2303 前方領域の動き方向の幅(FWD_WIDTH)
2304 後方領域の動き方向の幅(BACK_WIDTH)
2310 動きによるROI領域の前方領域
2311 動きによるROI領域の後方領域
2320 後方領域A
2321 後方領域B
2330 前方領域A
2331 前方領域B

Claims (3)

  1. 外部からの入力画像を取り込む画像入力部と、
    画像入力部から入力される画像の動き情報等からROI領域を決定する1次ROI領域決定部と、
    装置全体の制御や認識に関わるアルゴリズムの実行や、入力される画像の動き情報等の算出及び前記1次ROI領域部で決定された複数の1次ROI領域より注目する2つの1次ROI領域を選択するCPUと、前記CPUで選択された2つの1次ROI領域情報から2次ROI領域を決定する2次ROI領域決定部と、
    人物認識や物体認識に使用するデータベースや前記CPUでの演算で得られた結果を格納する内部メモリと、
    得られた1次、2次のROI領域の情報を用いて入力画像の圧縮を行う画像圧縮部とを有することを特徴とする画像符号化装置。
  2. ユーザーからの入力情報により、固定のROI領域を設定する事が可能な固定ROI領域決定部を有することを特徴とする請求項1記載の画像符号化装置。
  3. 前記画像圧縮部は、前記1次ROI領域決定部より得られた1次ROI領域情報と、前記CPUで算出した入力画像の動き情報とを元に前記1次ROI領域内のレート制御で処理することを特徴とする請求項1または2記載の画像符号化装置。
JP2006160490A 2006-06-09 2006-06-09 画像符号化装置 Pending JP2007329788A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006160490A JP2007329788A (ja) 2006-06-09 2006-06-09 画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006160490A JP2007329788A (ja) 2006-06-09 2006-06-09 画像符号化装置

Publications (1)

Publication Number Publication Date
JP2007329788A true JP2007329788A (ja) 2007-12-20

Family

ID=38929948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006160490A Pending JP2007329788A (ja) 2006-06-09 2006-06-09 画像符号化装置

Country Status (1)

Country Link
JP (1) JP2007329788A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010193441A (ja) * 2009-01-26 2010-09-02 Panasonic Corp 動画像処理装置、動画像処理方法および撮像装置
WO2012020856A1 (en) * 2010-08-10 2012-02-16 Lg Electronics Inc. Region of interest based video synopsis
JP2012257125A (ja) * 2011-06-09 2012-12-27 Canon Inc 画像処理装置、画像処理方法
JP2019009508A (ja) * 2017-06-20 2019-01-17 キヤノン株式会社 画像処理装置およびその制御方法、撮像装置、監視システム
KR20210130993A (ko) * 2020-04-23 2021-11-02 한국전자통신연구원 약품 조제 자동화 시스템을 위한 포장지 정품 인식 장치 및 방법

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010193441A (ja) * 2009-01-26 2010-09-02 Panasonic Corp 動画像処理装置、動画像処理方法および撮像装置
WO2012020856A1 (en) * 2010-08-10 2012-02-16 Lg Electronics Inc. Region of interest based video synopsis
CN103069457A (zh) * 2010-08-10 2013-04-24 Lg电子株式会社 基于感兴趣区的视频概要
US9269245B2 (en) 2010-08-10 2016-02-23 Lg Electronics Inc. Region of interest based video synopsis
JP2012257125A (ja) * 2011-06-09 2012-12-27 Canon Inc 画像処理装置、画像処理方法
JP2019009508A (ja) * 2017-06-20 2019-01-17 キヤノン株式会社 画像処理装置およびその制御方法、撮像装置、監視システム
KR20210130993A (ko) * 2020-04-23 2021-11-02 한국전자통신연구원 약품 조제 자동화 시스템을 위한 포장지 정품 인식 장치 및 방법
KR102382568B1 (ko) 2020-04-23 2022-04-05 한국전자통신연구원 약품 조제 자동화 시스템을 위한 포장지 정품 인식 장치 및 방법

Similar Documents

Publication Publication Date Title
KR102092846B1 (ko) 3차원 영상 줌을 수행하는 영상 처리 장치 및 방법
JP5768126B2 (ja) 選択基準を使用した主要ビデオスニペットの決定
KR101134668B1 (ko) 화상 생성 방법, 장치 및 그 프로그램과 프로그램을 기록한 기록매체
TWI521948B (zh) Image processing apparatus, decoding method, intra-frame decoding apparatus, intra-frame decoding method, and intra-frame coding apparatus
KR101136506B1 (ko) 화상 생성 방법, 장치 및 그 프로그램 및 프로그램을 기록한 기록매체
JP6223059B2 (ja) 撮像装置、その制御方法およびプログラム
JP2018107793A (ja) 仮想視点画像の生成装置、生成方法及びプログラム
TW201250626A (en) Information processing system, information processing device, imaging device, and information processing method
TW200910975A (en) Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
JP2007329788A (ja) 画像符号化装置
JP2009047497A (ja) 立体撮像装置および立体撮像装置の制御方法並びにプログラム
CN103716643A (zh) 用于使用内容信息改进视频编码的系统和方法
JP2010232734A (ja) 画像符号化装置及び画像符号化方法
JP2010166548A (ja) 画像符号化装置及びその制御方法
KR20170097745A (ko) 재귀적 계층적 프로세스를 사용하여 외삽된 이미지를 생성하기 위한 장치 및 방법
JPWO2010070809A1 (ja) 撮像装置
KR20100103776A (ko) 화상 처리 장치, 동화상 재생 장치, 이것들에 있어서의 처리 방법 및 프로그램
JP2009047496A (ja) 立体撮像装置および立体撮像装置の制御方法並びにプログラム
JP2009047498A (ja) 立体撮像装置および立体撮像装置の制御方法並びにプログラム
JP6137302B2 (ja) 符号化装置、符号化方法、および符号化プログラム
JP6116436B2 (ja) 画像処理装置および画像処理方法
JP2009047495A (ja) 立体撮像装置および立体撮像装置の制御方法並びにプログラム
CN103491309A (zh) 图像数据的采集方法和终端
TW201519158A (zh) 電子裝置及其影片物體追蹤方法
JP6090430B2 (ja) 符号化装置、方法、プログラム、コンピュータシステム、記録媒体