[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2019057900A - 符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システム - Google Patents

符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システム Download PDF

Info

Publication number
JP2019057900A
JP2019057900A JP2017182859A JP2017182859A JP2019057900A JP 2019057900 A JP2019057900 A JP 2019057900A JP 2017182859 A JP2017182859 A JP 2017182859A JP 2017182859 A JP2017182859 A JP 2017182859A JP 2019057900 A JP2019057900 A JP 2019057900A
Authority
JP
Japan
Prior art keywords
image
picture
processing
key picture
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017182859A
Other languages
English (en)
Other versions
JP6915473B2 (ja
Inventor
和仁 迫水
Kazuhito Sakomizu
和仁 迫水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2017182859A priority Critical patent/JP6915473B2/ja
Publication of JP2019057900A publication Critical patent/JP2019057900A/ja
Application granted granted Critical
Publication of JP6915473B2 publication Critical patent/JP6915473B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 ROI符号化の特長を維持したまま、背景領域全体の画質低下を緩和できる符号化装置が望まれている。【解決手段】 本発明は、入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、背景領域の情報量を削減するための前処理を注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、所定の画像符号化方式を用いて、符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部とを有し、前処理部は、前処理ピクチャタイプを決定し出力する前処理ピクチャタイプ制御部と、前処理ピクチャタイプがキーピクチャである場合には注目領域付与画像を、非キーピクチャである場合には注目領域付与画像に対してキーピクチャを参照するフィルタリングを施した画像を、符号化前画像として出力するDRCフィルタ部と、前処理バッファとを有することを特徴とする。【選択図】 図1

Description

本発明は、符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システムに関し、例えば、映像を圧縮するシステムに適用可能である。
近年、監視カメラの普及が進み、さらなる高解像度化、高フレームレート化、及び多視点化も望まれている。しかし、高解像度化、高フレームレート化、及び多視点化は、動画像の符号量の著しい増加を引き起こし、通信コストやストレージコストの増加を招く。
そこで、この問題を緩和するため、動画像より注目領域を検出し、注目領域に多くのビット数を配分する方式が提案されている。注目領域とは、例えば、顔領域である。なお、以下では、注目領域のことをRegion of Interestの略である「ROI」と呼ぶものとする。また、注目領域に多くのビット数を配分する方式を「ROI符号化」と呼ぶものとする。
特許文献1では、符号量と映像、品質を制御するパラメータをブロックごとに与えられるというエンコーダの機能を利用して、エンコーダに与えるパラメータをブロックごとに制御することで、ROI以外の領域である非注目領域の情報量をROIの情報量よりも削減するシステム構成を提案している。なお、以下、この明細書では、非注目領域のことを「背景領域」と呼ぶものとする。また、背景領域は必ずしも静止状態とは限られないものとする。
このようにエンコーダが提供する機能を用いて情報量を削減すれば、効率よく確実に符号量を削減することが可能である。H.264/MPEG−4 AVC(Advanced Video Coding:以下、「AVC」とも呼ぶ)やH.265/MPEG−H HEVC(High Efficiency Video Coding:以下、「HEVC」とも呼ぶ)のような主要な規格は、領域ごとに品質を制御する機能を備えているため、この機能を利用することは、ROIに多くのビット数を配分する代表的な方式と言える。
一方、例えば、コストや互換性などの諸事情により、映像品質制御パラメータをブロックごとに与える機能を有していないエンコーダの利用が不可避の場合、前述の方式を採用することはできない。このような場合でも、エンコーダに依存せず、領域ごとに映像品質を制御可能な技術として特許文献2に記載の技術が提案されている。
特許文献2では、エンコーダに依存せずに背景領域の情報量を削減するために、背景領域に低域通過フィルタによる前処理をおこない、高周波成分の情報を取り除くことで背景領域の情報量を抑圧することを提案するものである。
図15は、特許文献2に代表される従来の画像符号化装置を、画像処理システムの一部として組み込んだ場合の構成例を示す図である。
図15において、画像処理システムZは、入力された入力画像の内、背景領域に属する画素をROIの情報よりも少ないビット数で圧縮し、ビットストリームとして出力する画像符号化装置X1と、入力されたビットストリームを、復号し、出力画像を出力する画像復号装置X2とから構成される。
画像符号化装置X1は、入力画像にROIを付与し、ROI付与画像を出力するROI設定部402と、背景領域の情報量を削減するための前処理をROI付与画像に施し、符号化前画像として出力する前処理部U1と、AVC等の画像符号化方式を用いて符号化前画像を圧縮し、ビットストリームを出力するエンコーダ部406とを有する。ここで、前処理とは、例えばガウシアンフィルタを畳み込むことで、高周波成分を抑圧する処理などがある。
ROI設定部402は、入力画像にROIを付与する機能であるが、ROIの特定手段に関しては特定されない。例えば、ROIの特定手段として、入力画像に対して顔検出アルゴリズムや人物検出アルゴリズム、ナンバープレート検出アルゴリズム、車体検出アルゴリズム等を適用することで入力画像の中からROIの位置と大きさを検出することで特定するという方法が考えられる。また、ROI補助情報として、例えば手動で入力されたROIの位置と座標によって特定するという方法も考えられるし、図示しないユーザインタフェースを介して入力されたROIの位置と座標によって特定するものでも良い。さらに、ROI補助情報として、たとえば入力画像に対応する赤外線カメラ画像や深度センサ画像を利用してROIを特定するという方法でも良い。
ROI設定部402は、特定されたROIの座標や大きさ等を含む情報をROI情報として出力しても良い。出力されたROI情報は、例えば付加情報パケットという形態でビットストリームに多重化されても良いし、画像に情報を埋め込むことでビットストリームに埋め込まれても良い。図15では、例えば前述の方法でROI情報をビットストリームに挿入する役割をエンコーダ部406が担っている。
画像復号装置X2は、入力されたビットストリームデータをエンコーダ部406に対応する方式で復号し、復号画像(出力画像)として出力するデコーダ部407を有する。
なお、図15では、画像符号化装置X1が前処理によって背景領域の情報量をROIの情報量よりも削減する例を示しているが、画像符号化装置X1のエンコーダ部406をエンコーダが備える領域ごとに品質を制御する機能を利用してROIに多くのビット数を配分するものにすることで、特許文献1に代表される映像符号化システムを組み込んだ構成例となる。
この場合、前処理部U1は、品質パラメータを制御する機能を担当すると考えれば良い。
特開2009−49979号公報 特開平04−219089号公報
J.Ascenso, C.Brites, and F.Pereira. Motion compensated refinement for low complexity pixel based distributed video coding. In Proceedings. IEEE Conference on Advanced Video and Signal Based Surveillance, 2005., pages593−598. IEEE, 2005 Yuri Vatis, Sven Klomp,and Jorn Ostermann. Enhanced Reconstruction of the Quantised Transform Coefficients for WYNER−ZIV Coding. In Multimedia and Expo, 2007 IEEE International Conference on, number Figure 2, pages 172−175. IEEE, ju1 2007. Denis Kubasov, Jayanth Nayak and Christine Gui11emot. Optima1 Reconstructionin Wyner−Ziv Video Coding with Mu1tip1e Side Information. In 2007 IEEE 9th Workshop on Mu1timedia Signa1 Processing, pages183−186, IEEE, 2007.
以上のように、前処理部U1を利用することで、ROIに多くのビット数を配分することは可能である。
しかしながら、その原理上、背景領域全体の画質低下は避けられない。
そのため、映像の伝送コストや蓄積コストを下げられるというROI符号化の特長を維持したまま、背景領域全体の画質低下を緩和できる符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システムが望まれている。
第1の本発明は、入力画像を符号化する符号化装置において、(1)前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、(2)前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、(3)所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部とを有し、前記前処理部は、(4)前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、(5)前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対してキーピクチャを参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部と、(6)前記DRCフィルタ部用のバッファである前処理バッファとを有し、(7)前記DRCフィルタ部は、キーピクチャと判定されている前記注目領域付与画像を前処理用蓄積ピクチャとして出力することで前記前処理バッファに蓄積し、非キーピクチャと判定されている前記注目領域付与画像を、キーピクチャの情報を用いてフィルタリングするために、キーピクチャの情報を前処理用参照ピクチャとして前記前処理バッファから抽出することを特徴とする。
第2の本発明の複号装置は、(1)入力画像に注目領域が付与され、注目領域が付与された入力画像の内、背景領域の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、(2)前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、(3)前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像にキーピクチャを参照するフィルタリングを施した画像を、出力画像として出力するIDRCフィルタ部と、(4)前記IDRCフィルタ部用のバッファである後処理バッファとを有し、(5)前記IDRCフィルタ部は、キーピクチャと判定されている前記復号画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記復号画像をキーピクチャの情報を用いてフィルタリングするために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出することを特徴とする。
第3の本発明の画像処理システムは、入力画像を符号化して符号化データを生成する符号化装置と、前記符号化装置が生成した前記符号化データを復号して復号画像を生成する復号装置とを備える画像処理システムにおいて、前記符号化装置として第1の本発明の符号化装置を適用し、前記復号装置として第2の本発明の復号装置を適用したことを特徴とする。
第4の本発明の符号化プログラムは、入力画像を符号化する符号化装置に搭載されるコンピュータを、(1)前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、(2)前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、(3)所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部として機能させ、前記前処理部は、(4)前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、(5)前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対してキーピクチャを参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部と、(6)前記DRCフィルタ部用のバッファである前処理バッファとを有し、(7)前記DRCフィルタ部は、キーピクチャと判定されている前記注目領域付与画像を前処理用蓄積ピクチャとして出力することで前記前処理バッファに蓄積し、非キーピクチャと判定されている前記注目領域付与画像を、キーピクチャの情報を用いてフィルタリングするために、キーピクチャの情報を前処理用参照ピクチャとして前記前処理バッファから抽出することを特徴とする。
第5の本発明の複号プログラムは、コンピュータを、(1)入力画像に注目領域が付与され、注目領域が付与された入力画像の内、背景領域の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、(2)前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、(3)前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像にキーピクチャを参照するフィルタリングを施した画像を、出力画像として出力するIDRCフィルタ部と、(4)前記IDRCフィルタ部用のバッファである後処理バッファとして機能させ、(5)前記IDRCフィルタ部は、キーピクチャと判定されている前記復号画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記復号画像をキーピクチャの情報を用いてフィルタリングするために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出することを特徴とする。
第6の本発明は、入力画像を符号化する符号化装置において、(1)前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、(2)前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、(3)所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部とを有し、前記前処理部は、(4)前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、(5)前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対して仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部とを有することを特徴とする。
第7の本発明の複号装置は、(1)入力画像に注目領域が付与され、注目領域が付与された入力画像の内、背景領域の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、(2)前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、(3)前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像に仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、再構成前画像として出力するIDRCフィルタ部と、(4)前記後処理ピクチャタイプが、キーピクチャである場合には前記再構成前画像を、非キーピクチャである場合には前記再構成前画像にキーピクチャを用いた再構成処理を施した画像を、出力画像として出力する再構成部と、(5)前記再構成部用のバッファである後処理バッファとを有し、(6)前記再構成部は、キーピクチャと判定されている前記再構成前画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記再構成前画像を、キーピクチャの情報を用いて再構成処理するために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出することを特徴とする。
第8の本発明の画像処理システムは、入力画像を符号化して符号化データを生成する符号化装置と、前記符号化装置が生成した前記符号化データを復号して復号画像を生成する復号装置とを備える画像処理システムにおいて、前記符号化装置として第6の本発明の符号化装置を適用し、前記復号装置として第7の本発明の復号装置を適用したことを特徴とする。
第9の本発明の符号化プログラムは、入力画像を符号化する符号化装置に搭載されるコンピュータを、(1)前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、(2)前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、(3)所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部として機能させ、前記前処理部は、(4)前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、(5)前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対して仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部とを有することを特徴とする。
第10の本発明の復号プログラムは、コンピュータを、(1)入力画像に注目領域が付与され、注目領域が付与された入力画像の内、背景領域の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、(2)前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、(3)前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像に仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、再構成前画像として出力するIDRCフィルタ部と、(4)前記後処理ピクチャタイプが、キーピクチャである場合には前記再構成前画像を、非キーピクチャである場合には前記再構成前画像にキーピクチャを用いた再構成処理を施した画像を、出力画像として出力する再構成部と、(5)前記再構成部用のバッファである後処理バッファとして機能させ、(6)前記再構成部は、キーピクチャと判定されている前記再構成前画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記再構成前画像を、キーピクチャの情報を用いて再構成処理するために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出することを特徴とする。
第11の本発明は、入力画像を符号化する符号化装置において、(1)前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、(2)前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、(3)所定の画像符号化方式を用いて、前記背景領域には粗い量子化を、注目領域には細かい量子化をおこなうように誘導する符号化用品質パラメータに基づき前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部とを有し、前記前処理部は、(4)前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、(5)前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対して仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、内部画像として出力するDRCフィルタ部と(6)前記前処理ピクチャタイプが非キーピクチャである場合には、前記内部画像に注目領域の位置や大きさを表す注目領域情報に基づき前記符号化用品質パラメータを付与した上で、前記符号化前画像として出力する品質パラメータ制御部とを有することを特徴とする。
第12の本発明の画像処理システムは、入力画像を符号化して符号化データを生成する符号化装置と、前記符号化装置が生成した前記符号化データを復号して復号画像を生成する復号装置とを備える画像処理システムにおいて、前記符号化装置として第11の本発明の符号化装置を適用し、前記復号装置として第7の本発明の復号装置を適用したことを特徴とする。
第13の本発明は、入力画像を符号化する符号化装置において、(1)前記入力画像の情報量を削減するための前処理を施し、符号化前画像として出力する前処理部と、(2)所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部とを有し、前記前処理部は、(3)前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、(4)前記前処理ピクチャタイプがキーピクチャである場合には前記入力画像を、非キーピクチャである場合には前記入力画像に対して仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部とを有することを特徴とする。
第14の本発明は、(1)入力画像の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、(2)前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、(3)前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像に仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、再構成前画像として出力するIDRCフィルタ部と、(4)前記後処理ピクチャタイプが、キーピクチャである場合には前記再構成前画像を、非キーピクチャである場合には前記再構成前画像にキーピクチャを用いた再構成処理を施した画像を、出力画像として出力する再構成部と、(5)前記再構成部用のバッファである後処理バッファとを有し、(6)前記再構成部は、キーピクチャと判定されている前記再構成前画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記再構成前画像を、キーピクチャの情報を用いて再構成処理するために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出することを特徴とする。
第15の本発明の画像処理システムは、入力画像を符号化して符号化データを生成する符号化装置と、前記符号化装置が生成した前記符号化データを復号して復号画像を生成する復号装置とを備える画像処理システムにおいて、前記符号化装置として第13の本発明の符号化装置を適用し、前記復号装置として第14の本発明の復号装置を適用したことを特徴とする。
本発明によれば、映像の伝送コストや蓄積コストを下げられるというROI符号化の特長を維持したまま、背景領域全体の画質低下を緩和できる。
第1の実施形態に係る画像処理システムの構成について示すブロック図である。 第1の実施形態に係る画像処理システムの動作を示すフローチャートである。 第1の実施形態に係る特定されたROIの補正例を示す図である。 第1の実施形態に係る非キーピクチャに対して行うフィルタリングの一例を示すフローチャート(その1)である。 第1の実施形態に係る非キーピクチャに対して行うフィルタリングの一例を示すフローチャート(その2)である。 第1の実施形態に係る非キーピクチャに対して行うフィルタリングの一例を示すフローチャート(その3)である。 第2の実施形態に係る画像処理システムの構成について示すブロック図である。 第2の実施形態に係る画像処理システムの動作を示すフローチャートである。 第2の実施形態に係る再構成部の再構成処理を示すフローチャート(その1)である。 第2の実施形態に係る再構成部の再構成処理を示すフローチャート(その2)である。 第2の実施形態に係る再構成部の再構成処理を示すフローチャート(その3)である。 第2の実施形態に係るルックアップテーブルの一例を示す図である。 第3の実施形態に係る画像処理システムの構成について示すブロック図である。 第3の実施形態に係る画像処理システムの動作を示すフローチャートである。 特許文献2に代表される従来の画像符号化装置を、画像処理システムの一部として組み込んだ場合の構成例について示すブロック図である。
(A)第1の実施形態
以下、本発明による符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システムの第1の実施形態を、図面を参照しながら詳述する。以下では、本発明の符号化装置を画像符号化装置に適用し、本発明の復号装置を画像復号装置に適用した例について説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る画像処理システム1の構成について示すブロック図である。なお、図1において、実線の矢印は、この実施形態における必須の処理(及び情報)の流れを示しているが、破線の矢印は必ずしもこの実施形態の効果を奏するために必須の処理(及び情報)では無い。以下、破線の矢印に係る処理(及び情報)については、適宜補足的に説明するものとする。
画像処理システム1は、入力画像を符号化してストリーム(ビット列)を出力する画像符号化装置10と、画像符号化装置10で符号化されたストリーム(ビットストリーム)を復号して復号画像を出力する画像復号装置20とを有している。
画像符号化装置10から出力されたストリームを画像復号装置20に入力する媒体は限定されないものである。例えば、画像符号化装置10から出力されたストリームを、通信(例えば、インターネット等)により画像復号装置20に送信するようにしても良いし、画像符号化装置10から出力されたストリームのデータをデータ記録媒体(例えば、DVDやHDD等の媒体)に記録してオフラインで画像復号装置20に入力するようにしても良い。
この実施形態では、画像符号化装置10は入力画像ごとの符号化を行うものとして説明するが、画像符号化装置10に連続して複数の入力画像を処理させることで動画像の符号化処理に適用するようにしても良い。また、画像復号装置20についても同様に、連続して複数の符号化データのストリームを復号処理させることにより、動画像の復号処理に適用するようにしても良い。
次に、画像符号化装置10の内部構成について説明する。図1は、第1の実施形態に係る画像符号化装置10の機能的構成について示すブロック図でもある。画像符号化装置は、ハードウェア(例えば、専用の半導体チップ等)で構成するようにしても良いし、一部又は全部を、ソフトウェア的に構成するようにしても良い。
画像符号化装置10は、ROI設定部402、前処理部200、及びエンコーダ部406を有している。ROI設定部402及びエンコーダ部406の機能は前述の図15で説明したものと同様の機能を有する。
前処理部200は、入力画像について、「キーピクチャ」か「非キーピクチャ」か何れか一方を指し示す「前処理ピクチャタイプ」を決定し出力する前処理ピクチャタイプ制御部101と、前処理ピクチャタイプを参照し、キーピクチャである場合にはROI付与画像を、非キーピクチャである場合にはROI付与画像にキーピクチャを参照するフィルタリングを施した画像を、符号化前画像として出力するDRCフィルタ部103と、DRCフィルタ部103用のバッファである前処理バッファ104とを有する。
また、DRCフィルタ部103は、キーピクチャと判定されているROI付与画像を前処理用蓄積ピクチャとして出力することで前処理バッファ104に蓄積し、非キーピクチャと判定されているROI付与画像をキーピクチャの情報を用いてフィルタリングするために、キーピクチャを前処理用参照ピクチャとして前処理バッファ104から取り出すものでもある。
前処理ピクチャタイプ制御部101が、どのようにピクチャタイプを判定するかについては種々の方法を適用することができる。具体的な方法例は後述するが、例えば入力画像やROI付与画像に基づき決定する方法もあるため、図1では入力画像やROI付与画像を前処理ピクチャタイプ制御部101に入力する例も点線で示している。
ROI設定部402は、前述の図15で説明した機能に加えて、動作条件を付与することもできる。具体的な方法例は後述するが、例えば前処理ピクチャタイプ(図1では点線で示す通り、前処理ピクチャタイプ制御部101から入力される)に応じて動作条件を決定する。
エンコーダ部406は、前述の図15で説明した機能に加えて、ROI情報を伝送する場合と同じように、付加情報パケットや画像への埋め込みによって、前処理ピクチャタイプ(図1では点線で示す通り、前処理ピクチャタイプ制御部101から入力される)をビットストリームに挿入しても良い。また、ピクチャタイプの決定方法は、後述する後処理ピクチャタイプ制御部108と手動設定や伝送によって共有する必要があるが、付加情報パケットや画像への埋め込みによって、ピクチャタイプの決定方法をビットストリームに挿入しても良い。
次に、画像復号装置20の内部構成について説明する。図1は、第1の実施形態に係る画像復号装置20の機能的構成について示すブロック図でもある。画像符号化装置は、ハードウェア(例えば、専用の半導体チップ等)で構成するようにしても良いし、一部又は全部を、ソフトウェア的に構成するようにしても良い。
画像復号装置20は、デコーダ部407と復号画像を入力し、出力画像を出力する後処理部300とを有している。
後処理部300は、後処理ピクチャタイプを決定し出力する後処理ピクチャタイプ制御部108と、後処理ピクチャタイプを参照し、キーピクチャであることを指し示している場合には復号画像を、非キーピクチャであることを指し示している場合には復号画像にキーピクチャを参照するフィルタリングを施した画像を、出力画像として出力するIDRCフィルタ部109と、IDRCフィルタ部109用のバッファである後処理バッファ110とを有している。
また、IDRCフィルタ部109は、キーピクチャと判定されている復号画像を後処理用蓄積ピクチャとして出力することで後処理バッファ110に蓄積し、非キーピクチャと判定されている復号画像をキーピクチャの情報を用いてフィルタリングするために、キーピクチャを後処理用参照ピクチャとして後処理バッファ110から取り出すものでもある。
後処理ピクチャタイプ制御部108がどのようにピクチャタイプを判定するかについては種々の方法を適用することができる。具体的な方法例は後述するが、例えばビットストリームに埋め込まれた情報や復号画像に基づき決定する方法もあるため、図1ではピクチャタイプ補助情報を後処理ピクチャタイプ制御部108に入力する例も点線で示している。ピクチャタイプ補助情報とは、例えばピクチャタイプ自体や復号画像、ピクチャタイプの決定方法などである。
(A−2)第1の実施形態の動作
次に、第1の実施形態に係る画像処理システム1の動作を、図面を参照しながら詳細に説明する。図2は、第1の実施形態に係る画像処理システムの動作を示すフローチャートである。以下では、画像符号化装置10及び画像復号装置20の動作を各々分けて説明する。
(A−2−1)画像符号化装置10の動作
図2(A)は、第1の実施形態に係る画像符号化装置の動作を示すフローチャートである。
まず、前処理ピクチャタイプ制御部101は、入力画像のピクチャタイプを決定し、前処理ピクチャタイプとして出力する(S11)。なお、ピクチャタイプの決定方法には幾通りもの方法が考えられるが、例えば、以下の(1)〜(3)の方法が考えられる。
(1)予め定められたキーピクチャ間隔に基づき周期的に決定する方法
例えば、前処理ピクチャタイプ制御部101は、キーピクチャ間隔を2に設定した場合、1枚ごとにキーピクチャと非キーピクチャを切り替える。具体的には、T枚目をキーピクチャとした場合、(T+1)枚目を非キーピクチャとして、(T+2)枚目を再びキーピクチャにする。同様に、前処理ピクチャタイプ制御部101は、キーピクチャ間隔を3に設定した場合、T枚目をキーピクチャとした場合、(T+1)枚目と(T+2)枚目を非キーピクチャとして、(T+3)枚目を再びキーピクチャにする。
(2)入力画像の性質に応じて決定する方法
前処理ピクチャタイプ制御部101は、画像の性質、例えば動きがあるかなどを既存のコンピュータビジョンの手法を利用して解析し、例えば入力画像の中に動きのある領域が無いと判定されたとき、当該入力画像をキーピクチャにして、それ以外の入力画像を非キーピクチャにする。
より具体的には、例えば、処理対象の入カ画像とその直前に入力された入力画像とを用いて画素ごと若しくは1個以上の画素の集合であるブロックごと、又は画像全体で動きベクトルを推定し、予め定めた閾値以上の大きさを持つ動きベクトルが存在しなかった場合や1個以上の動きベクトルの平均動きベクトルを計算し、平均動きベクトルの大きさが予め定めた閾値より小さい場合に、当該処理対象の入力画像をキーピクチャとする。
また、過去N個の入力画像分のピクチャタイプ判定結果を遡り、そのなかにキーピクチャと判定された入力画像が存在しない場合に限り、画像全体で動きが無いと判定された入力画像をキーピクチャにして、それ以外の入力画像を非キーピクチャにするのも有効である。
(3)ROIの有無に応じて決定する方法
例えば、前処理ピクチャタイプ制御部101は、ROI付与画像にROIが存在しない場合にキーピクチャと判定し、ROIが存在する場合に非キーピクチャと判定する。これは、ROIが存在しないとき、画像全体に動きはないだろうという仮定の下での判定とも言える(言い換えれば、前述の(2)の手法の特例とも言える)。
前述の(2)の手法と同様に、過去N個の入力画像分のピクチャタイプ判定結果を遡り、そのなかにキーピクチャと判定された入力画像が存在しない場合に限り、ROIが存在しない入力画像をキーピクチャにして、それ以外の入力画像を非キーピクチャにするのも有効である。また、前述の(1)〜(3)の方法を組み合わせるという方法も考えられる。
なお、決定したピクチャタイプは、エンコーダ部406を介して画像復号装置20側に伝送しても良い。また、ピクチャタイプの決定方法は、エンコーダ部406を介して画像復号装置20側に伝送しても良いし、手動設定により後処理ピクチャタイプ制御部108と共有しても良い。
次に、ROI設定部402において、入カ画像にROIを付与し、ROI付与画像をDRCフィルタ部103に出力する(S12)。
ここで、ROI設定部402は、全ての入力画像にROIを付与しても良いし、例えば、前処理ピクチャタイプが非キーピクチャであることを指している場合にのみROIを付与しても良い。ROIを付与するピクチャを非キーピクチャのみに限定することで、演算量を削減できるという効果が得られる。なぜならば、この実施形態では、非キーピクチャの背景領域に対してフィルタリングが適用されるため、この実施形態に限定すれば、ROIを特定する理由は非キーピクチャにしかないためである。ROIを特定し情報を付与するのにも一定の演算量が必要となるため、不必要なROI設定部402の動作を止めることで演算量を削減できる。
また、特定されたROIは、例えば以下の(1)〜(3)のいずれかの補正を経たものでも良い。(1)予め定められた大きさのブロックに属する画素のうち1画素でもROIに含まれているならば、当該ブロックに含まれる画素は、全てROIに属するとする。(2)予め定められた大きさのブロックに属する画素のうち半数以上がROIに含まれているならば、当該ブロックに含まれる画素はすべてROIに属するとする。(3)予め定められた大きさのブロックに属するすべての画素がROIに含まれているときのみ、当該ブロックに含まれる画素はROIに属するとしたりする。
図3は、第1の実施形態に係る特定されたROIの補正例を示す図である。図3は、前述の方法例のうち(2)の方法で補正する場合をイメージ化したものである。図3では、各ブロック(B1〜B3)のサイズを幅4画素、高さ4画素としている。例えば、ブロックB3はROIに含まれる画素が9であるため(つまり、半分以上であるため)に、当該ブロックに含まれる画素はROIに属するとする。エンコーダ部406で採用され得る多くの画像符号化方式では、特定の大きさのブロックごとに予測したり変換したりすることで情報量を削減するため、ROIと背景領域の境界も、画像符号化方式が採用するブロックの境界と一致していることが望ましい。本補正は、ROIと背景領域の境界と、画像符号化方式が採用するブロックの境界とを一致させるための処理である。
次に、DRCフィルタ部103は、前処理ピクチャタイプを参照し、ROI付与画像がキーピクチャであれば、ROI付与画像を前処理用参照ピクチャ及び符号化前画像として出力する(S13)。一方、DRCフィルタ部103は、ROI付与画像が非キーピクチャであれば、前処理バッファ104から前処理用参照ピクチャを取り出し、ROI付与画像のうち背景領域に分類される画素にフィルタリングを施し、符号化前画像として出力する。
図4(A)は、DRCフィルタ部103が非キーピクチャに対して行うフィルタリングの一例を示すフローチャートである。
図4において、pはROI付与画像のi番目の画素値、rはキーピクチャのi番目の画素値である。また、Rは情報量の削減量を操作するための係数でダイナミックレンジの圧縮率にあたる0.0〜1.0のパラメータである。pが符号化前画像のi番目の画素値であり、xやx、xは中間値である。
例えば、図4(A)のフローチャートが示す画像処理を背景領域に属する画素に対して適用する。本手法では、ROIに属する画素については、pを無加工でpとする。背景領域の画素値pのダイナミックレンジを、キーピクチャの画素値rを中心に圧縮することで、情報量を削減する(S101〜S103)。なお、ステップS103では、ダイナミックレンジを圧縮する際に四捨五入する場合の例を示しているが、四捨五入を行う場合にのみ本実施形態の効果が出るわけではない為、四捨五入以外の切り捨てや切り上げをおこなう形態でも一定の効果は存在する。
ステップS101〜S103の処理により、ダイナミックレンジを圧縮した後、圧縮した中間値xに128を加算する(S104)。ダイナミックレンジを圧縮した後に、その中心値を128に移しているのは、非キーピクチャの情報量を確実に削減するためである。もし、中心値をrのまま維持すると、非キーピクチャ自体はキーピクチャと同じような画素値分布の情報量を持つことになり、非キーピクチャの情報量がほとんど削減されないという結果になる場合があるためである。具体的には、エンコーダ部406において、イントラピクチャとして符号化するかインターピクチャとして符号化するかを指定できない場合で、非キーピクチャがイントラピクチャとして符号化されたときに、情報量がほとんど削減されないという結果になる。なぜならば、前述のとおり非キーピクチャ自体はキーピクチャと同じような画素値分布を持ち、つまりエントロピー(圧縮限界)がほとんど変わらないためである。なお、中心値をr以外の値にするときに、本例では差分値のダイナミックレンジを正負で同等に確保するため中心値を128に移しているが、中心値を128以外の値としても一定の効果は存在する。
エンコーダ部406において、キーピクチャと判定されている符号化前画像をイントラピクチャとして符号化し、非キーピクチャと判定されている符号化前画像をインターピクチャとして符号化すると指定できる場合には、中心値をrのまま維持しても、ピクチャ間の差分が小さくなるため符号量の削減効果は得られる。そのため、エンコーダ部406がキーピクチャと判定されている符号化前画像をイントラピクチャとして符号化し、非キーピクチャと判定されている符号化前画像をインターピクチャとして符号化するように制御することと、例えば、図5(ステップS301の処理)のように中心値をrのまま維持することも本発明の実施例の一つとする。
なお、本実施例(ステップS102の処理)において、ROI付与画像の画素値とキーピクチャの画素値の差分値xに対してダイナミックレンジを半分にする演算、具体的にはx=x÷2を実行しているが、これはxのダイナミックレンジが減算によってpのダイナミックレンジの2倍になっているためである。ダイナミックレンジを等倍に揃えなければ、pがアンダーフロー又はオーバーフローする可能性があり、たとえ、アンダーフロー及びオーパーフロー対策としてクリッピング処理を入れたとしても画質の低下が発生しうる。そこで、ダイナミックレンジを等倍に揃えるためにx=x÷2を実行している。ただし、本処理には差分値の精度低下に繋がるという副作用もあるため、ピクチャ間の変動が小さいことが予め分かっているビデオを入力する場合は、ダイナミックレンジを等倍に揃えないほうが高品質に符号化できる。そのため、ダイナミックレンジを等倍に揃えない構成も実施例の一つである。この場合、代わりに最後にpをその定義域(例えば0〜255)でクリッピングしても良い。
また、仮に非キーピクチャをフィルタリングするときに、取り出し可能なキーピクチャが前処理バッファ104に存在しない場合には、図6のように、予め定めた固定の中心値(図6では、例として128を採用)を仮想的なキーピクチャの画素値rとして使用しても良い。また、図6の例では、出力時の中心値を128にしているが、前述のとおり、出力時に中心値を128としても良いし、128以外の画素値を中心値としても一定の効果は存在する。図6の例では、前述のとおり128を中心にダイナミックレンジを圧縮し(S501、S502)、出力時の中心値も128としているため(S503)、前述のアンダーフローやオーバーフローが発生する可能性はない。そのため、図6では前述のダイナミックレンジを等倍に揃える処理を行わない場合の例を示している。もちろん、図6の例の派生として、ダイナミックレンジを等倍に揃える例も考えられる。
なお、この明細書でしばしば述べた「128」は画素値が8ビット整数値であることを想定したものであり、画素値の表現範囲に応じて適宜変更して良い。例えば、画素値が0からMまでの値を取り得る画像である場合、つまり画素値の定義域が0からMまでの場合、128の代わりにM/2を用いても良い。
さらに、フィルタリングに用いるキーピクチャは、時系列に並んだ画像のうち、つまりタイムスタンプ順に並んだ画像のうち、フィルタリングの対象である非キーピクチャの直前に位置するキーピクチャとするのが最も単純な方法であるが、最寄りのキーピクチャ、つまり非キーピクチャのタイムスタンプに最も近いタイムスタンプを持つ直前または直後に位置するキーピクチャとしても良い。
そして、エンコーダ部406では、AVC等の画像符号化方式を用いて、符号化前画像を圧縮し、ビットストリームを出力する(S14)。
(A−2−2)画像復号装置20の動作
図2(B)は、第1の実施形態に係る画像復号装置20の動作を示すフローチャートである。
まず、デコーダ部407は、画像符号化装置10からビットストリームを受け取り、AVC等の画像符号化方式を用いて復号し、復号画像を出力する(S21)。
後処理ピクチャタイプ制御部108は、復号画像のピクチャタイプを決定し、後処理ピクチャタイプとして出力する(S22)。なお、ピクチャタイプの決定方法には種々様々な方法を適用することができるが、例えば、以下の方法を挙げることができる。
(1)予め定められたキーピクチャ間隔に基づき周期的に決定する方法
例えば、キーピクチャ間隔を2に設定した場合、1枚ごとにキーピクチャと非キーピクチャを切り替える。具体的には、T枚目をキーピクチャとした場合、(T+1)枚目を非キーピクチャとして、(T+2)枚目を再びキーピクチャにする。同様に、キーピクチャ間隔を3に設定した場合、T枚目をキーピクチャとした場合、(T+1)枚目と(T+2)枚目を非キーピクチャとして、(T+3)枚目を再びキーピクチャにする。
(2)復号画像をピクチャタイプ補助情報として扱い、復号画像の性質に応じて決定する方法
復号画像の性質、例えば動きがあるかなどを既存のコンピュータビジョンの手法を利用して解析し、例えば復号画像の中に動きのある領域が無いと判定されたとき、当該復号画像をキーピクチャにして、それ以外の復号画像を非キーピクチャにする。より具体的には、例えば処理対象の復号画像とその直前に入力された復号画像とを用いて画素ごと若しくは1個以上の画素の集合であるブロックごと、又は画像全体で動きベクトルを推定し、予め定めた閾値以上の大きさを持つ動きベクトルが存在しなかった場合や1個以上の動きベクトルの平均動きベクトルを計算し、平均動きベクトルの大きさが予め定めた閾値より小さい場合に、当該処理対象の復号画像をキーピクチャとする。
過去N個の復号画像分のピクチャタイプ判定結果を遡り、そのなかにキーピクチャと判定された復号画像が存在しない場合に限り、画像全体で動きが無いと判定された復号画像をキーピクチャにして、それ以外の復号画像を非キーピクチャにするのも有効である。
(3)復号画像をピクチャタイプ補助情報として扱い、ROIの有無に応じて決定する方法
例えば、復号画像にROIが存在しない場合にキーピクチャと判定し、ROIが存在する場合に非キーピクチャと判定する。ROIが存在しないとき、画像全体に動きはないだろうという仮定の下での判定とも言える。前述の(2)の特例とも言える。
また、前述の(2)と同様に、過去N個の復号画像分のピクチャタイプ判定結果を遡り、そのなかにキーピクチャと判定された復号画像が存在しない場合に限り、ROIが存在しない復号画像をキーピクチャにして、それ以外の復号画像を非キーピクチャにするのも有効である。
(4)前処理ピクチャタイプ制御部101の決定をピクチャタイプ補助情報として扱い当該情報に応じて決定する方法
前述のとおり、前処理ピクチャタイプ制御部101で判定されたピクチャタイプは、付加情報パケットや画像への埋め込みによって、ビットストリームに挿入しても良い。仮にビットストリームにピクチャタイプに関する情報が埋め込まれている場合、当該情報を持ってピクチャタイプを判定する。
また、後処理ピクチャタイプ制御部108は前述の(1)〜(4)の方法を組み合わせる方法を採用しても良い。どのような方法で決定するかは、予め決めておいても良いし、ピクチャタイプ補助情報より取得しても良い。
IDRCフィルタ部109は、後処理ピクチャタイプを参照し、復号画像がキーピクチャであれば、復号画像を後処理用参照ピクチャおよび出力画像として出力し、復号画像が非キーピクチャであれば、後処理バッファ110から後処理用参照ピクチャを取り出し、復号画像のうち背景領域に分類される画素にフィルタリングを施し、出力画像として出力する。
IDRCフィルタ部109が非キーピクチャに対しておこなうフィルタリングの具体的な方法例を、図4(B)(変形例として、図5(B)、図6(B))に示す。
図4(B)において、qは復号画像のq番目の画素値、r’はキーピクチャのi番目の画素値、Rはダイナミックレンジの圧縮率Rの逆数でR=1/R、qが出力画像のi番目の画素値であり、yやy、yは中間値である。Rは、手動設定や伝送によってDRCフィルタ部103とIDRCフィルタ部109とで共有されているものとする。
本フローチャートが示す画像処理を背景領域に属する画素に対して適用する。本手法では、ROIに属する画素については、qを無加工でqとする。背景領域の画素値qのダイナミックレンジを、キーピクチャの画素値r’を中心に拡大することで、ダイナミックレンジの伸長をおこなう。なお、DRCフィルタの動作について説明している段落でも述べたとおり、本例では、ダイナミックレンジを圧縮する際に四捨五入する場合の例を示しているが、四捨五入を行う場合にのみ本発明の効果が出るわけではない為、四捨五入以外の切り捨てや切り上げをおこなう形態でも一定の効果は存在する。
IDRCフィルタ部109の機能(図4(B)〜図6(B)の処理を含む)は、DRCフィルタ部103の機能の逆演算に相当するため、詳細な説明は省略する(S23)。
なお、符号化前画像の画素値の中心値をr以外の値にする場合に、本例では差分値のダイナミックレンジを正負で同等に確保するため当該中心値を128に移しているが、DRCフィルタ部103の動作の項でも説明の通り中心値を128以外の値としても一定の効果は存在する。この場合、IDRCフィルタ部109は、DRCフィルタ部103が符号化前画像の中心値として使用した中心値を中心にダイナミックレンジを伸長するようにする。具体的には、図4(B)や図6(B)のIDRCフィルタ部109の動作において、初めにqより128を差し引くのではなく、DRCフィルタ部103で使用した中心値で差し引くようにする。中心値は、手動設定や伝送によってDRCフィルタ部103とIDRCフィルタ部109とで共有されているものとする。
また、DRCフィルタ部103で、ダイナミックレンジを等倍に揃えない場合、IDRCフィルタ部109においてもダイナミックレンジを等倍に揃える演算の逆演算にあたるy=y×2の実行(ステップS203の処理)は不要である。ダイナミックレンジを等倍に揃える演算の有無については、手動設定や伝送によってDRCフィルタ部103とIDRCフィルタ部109とで共有されているものとする。
もし、非キーピクチャをフィルタリングするときに、取り出し可能なキーピクチャが後処理バッファ110にない場合には、図6のように、たとえば仮想的なキーピクチャの画素値128をr’として使用しても良いことも同じである。仮想的なキーピクチャの画素値は、手動設定や伝送によってDRCフィルタ部103とIDRCフィルタ部109とで共有されているものとする。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
画像処理システム1では、入力画像をキーピクチャと非キーピクチャに分け、キーピクチャは無加工で符号化し、非キーピクチャはキーピクチャを用いてダイナミックレンジを圧縮してから符号化していることで、エンコーダの仕様および実装に手を加えることなしに、映像の伝送コストや蓄積コストを削減することができており、又キーピクチャを使用してダイナミックレンジの伸長も行っていることで、変化の小さい領域に関しては画質も維持されている。言い換えると、第1の実施形態の画像処理システム1は、ROIの品質は保証しつつ、画像全体の高画質化と符号量削減を両立できている。
(B)第2の実施形態
以下、本発明による符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システムの第2の実施形態を、図面を参照しながら詳述する。以下では、本発明の符号化装置を画像符号化装置に適用し、本発明の復号装置を画像復号装置に適用した例について説明する。
(B−1)第2の実施形態の構成
図7は、第2の実施形態に係る画像処理システム1Aの構成について示すブロック図である。なお、図7おいて、実線の矢印は、この実施形態における必須の処理(及び情報)の流れを示しているが、破線の矢印は必ずしもこの実施形態の効果を奏するために必須の処理(及び情報)では無い。以下、破線の矢印に係る処理(及び情報)については、適宜補足的に説明するものとする。
画像処理システム1Aでは、図1の画像符号化装置10と画像復号装置20が、画像符号化装置10Aと画像復号装置20Bに置き換わっている点で第1の実施形態と異なっている。以下では、第2の実施形態について第1の実施形態との差異を中心に説明する。
第2の実施形態の画像符号化装置10Aにおいて、前処理部200Aは、前処理ピクチャタイプ制御部101と、前処理ピクチャタイプを参照し、キーピクチャであることを指し示している場合にはROI付与画像を、非キーピクチャであることを指し示している場合にはROI付与画像に仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、符号化前画像として出力するDRCフィルタ部103とを有している。
第2の実施形態の画像復号装置20Aにおいて、後処理部300Aは、後処理ピクチャタイプ制御部108と、後処理ピクチャタイプを参照し、キーピクチャであることを指し示している場合には復号画像を、非キーピクチャであることを指し示している場合には復号画像に仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、再構成前画像として出力するIDRCフィルタ部109と、後処理ピクチャタイプを参照し、キーピクチャであることを指し示している場合には再構成前画像を、非キーピクチャであることを指し示している場合には再構成前画像にキーピクチャを用いた再構成処理を施した画像を、出力画像として出力する再構成部211と、再構成部211用のバッファである後処理バッファ110とを有している。
再構成部211は、キーピクチャと判定されている再構成前画像を後処理用蓄積ピクチャとして出力することで後処理バッファ110に蓄積し、非キーピクチャと判定されている再構成前画像をキーピクチャの情報を用いて再構成処理するために、キーピクチャを後処理用参照ピクチャとして後処理バッファ110から取り出すという機能も備える。
詳細は後述するが、再構成部211は、エンコーダ部406が使用した品質パラメータ(例えば量子化パラメータ)に応じた再構成をおこなうこともできるため、図3では品質パラメータを再構成部211に入力する例も点線で示している。
(B−2)第2の実施形態の動作
図8は、第2の実施形態に係る画像処理システムの動作を示すフローチャートである。図8と前述の図2の内、同一符号の処理は同様の処理であるので、以下では、第2の実施形態の画像処理システム1Aの特有の処理のみついて述べる。
(B−2−1)画像符号化装置10Aの動作
図8(A)は、第2の実施形態に係る画像符号化装置10Aの動作を示すフローチャートである。
前述のステップS12の後、DRCフィルタ部103は、前処理ピクチャタイプを参照し、ROI付与画像がキーピクチャであれば、ROI付与画像を符号化前画像として出力し、ROI付与画像が非キーピクチャであれば、ROI付与画像のうち背景領域に分類される画素に仮想的なキーピクチャの画素値を用いたフィルタリングを施し、符号化前画像として出力する(S31)。
(B−2−2)画像復号装置20Aの動作
図8(B)は、第2の実施形態に係る画像復号装置20Aの動作を示すフローチャートである。
前述のステップS22の後、IDRCフィルタ部109は、後処理ピクチャタイプを参照し、復号画像がキーピクチャであれば、復号画像を再構成前画像として出力し、復号画像が非キーピクチャであれば、復号画像のうち背景領域に分類される画素に仮想的なキーピクチャの画素値を用いたフィルタリングを施し、再構成前画像として出力する(S41)。
ここで、DRCフィルタ部103やIDRCフィルタ部109で使用するフィルタリングは、キーピクチャを使用しないもの存在する。従って、前述の図6で示したアルゴリズムを用いて、ダイナミックレンジを圧縮したり伸長したりする。具体的には、例えば128を仮想的なキーピクチャの画素値としてダイナミックレンジを圧縮したり伸長したりする。図6に関する詳細な説明は第1の実施形態で説明した通りである。
なお、第2の実施形態では、DRCフィルタ部103がキーピクチャに基づくフィルタリングを行っていないため、背景領域はダイナミックレンジが圧縮されているのみで、つまり画素値信号の振幅が抑圧されているだけで、映像として人間が認識可能なものとなっている。そのため、第2の実施形態では仮に後処理部300Aが存在しなくても一定の効果は得られる。同様に、IDRCフィルタ部109は利用可能で、再構成部211が存在しない場合でも一定の効果は得られる。この場合は、抑圧されていた振幅が限定的な精度で復元された映像を視聴することが可能になる。
次に、再構成部211は、後処理ピクチャタイプを参照し、再構成前画像がキーピクチャであれば、再構成前画像を後処理用参照ピクチャおよび出力画像として出力し、再構成前画像が非キーピクチャであれば、後処理バッファ110から後処理用参照ピクチャを取り出し、再構成前画像のうち背景領域に分類される画素に再構成処理を施し、出力画像として出力する(S42)。
以下では、再構成部211で再構成をおこなうための具体的なアルゴリズム例を図9〜図11を挙げてそれぞれ説明する。
図9は第2の実施形態に係る再構成部の再構成処理を示すフローチャート(その1)である。
図9において、sはキーピクチャのi番目の画素値、Lは出力画像のi番目の画素値の存在区間の下限値、Uは出力画像のi番目の画素値の存在区間の上限値、zは出力画像のi番目の画素値を示している。
再構成部211は、sがLより小さいか否か判定を行い(S701)、sがLより小さい場合には、zをLとする(S702)。また、再構成部211は、sがL以上の場合には、sがUより大きいか否か判定を行う(S703)。再構成部211は、sがUより大きい場合にはzをUとし(S704)、それ以外の場合にはzをsとする(S705)。
つまり、ステップS701〜S705の処理は、キーピクチャの画素値sが存在区間に含まれる場合はsを出力画像の画素値zとして採用し、sが存在区間の外にある場合は、sがある側の境界値をzとして採用するアプローチである。
とUは、再構成前画像のi番目の画素値vを用いて、以下の(1)及び(2)式により求める。
Figure 2019057900
上記(1)及び(2)式において、wは出力画像の存在区間の大きさを表している。なお、w/2は切り捨てを基本とするが、切り上げても四捨五入でも一定の効果は存在する。wは、例えば、以下の(3)式により求める。
Figure 2019057900
上記(3)式において、Wはエンコーダ部406で発生する量子化ステップで、エンコーダ部406がロスレスエンコーダである場合は1.0である。Rは前述のとおりダイナミックレンジの圧縮率Rの逆数R=1/Rで、DRCフィルタ部103で発生する存在区間の大きさとも解釈できるので、この実施形態では符号化全体で発生する存在区間の大きさwを、RにWを乗じることで求めている。なお、Rは、手動設定や伝送によってIDRCフィルタ部109と再構成部211とで共有されているものとする。
なお、Rが偶数の場合、Uを計算する際に1で減算しても良い。つまり、以下の(4)式としても良い。
Figure 2019057900
1を減算する理由は、前述の図4〜図6において、ダイナミックレンジを圧縮する際に四捨五入することを基本として想定しており(前述のとおり、DRCフィルタやIDRCフィルタにおいて、四捨五入する場合のみ本発明の効果が出るわけではない為、四捨五入以外の切り捨てや切り上げをおこなう形態でも一定の効果は存在する)、四捨五入には正のバイアスが発生しうるという性質があるためである。例えば、1の位で四捨五入すると10になる整数は5から14であるが、10より小さい数は5から9の5個あるのに対し、10より大きい数は11から14の4個しかない。この影響を考慮し、存在区間を求める際にvよりも大きい数の候補を、vよりも小さい数の候補より1個減らすことを考えたものが、前述の(4)式である。
エンコーダ部406がAVCで圧縮する場合、Wはビデオエンコーダに与えられるパラメータである量子化パラメータqP(図7中の品質パラメータの一例が量子化パラメータqPである)を用いて、例えば、以下の(5)、(6)式により求められる。
Figure 2019057900
上記(6)式において、関数Lは、例えば、図12に示すルックアップテーブルTである。(6)式は、AVCで定義されているDC成分に対する量子化ステップWの計算式である。Wは、トランスフォームドメインで定義される量子化ステップであるため、Wを4で割ることでトランスフォームドメインの量子化ステップWをピクセルドメインの量子化ステップWに変換している。なお、ビデオエンコーダが周波数ドメインで量子化する以上、ピクセルドメインにおける厳密な存在区間を求めることはできない。そのため、wはあくまで近似された存在区間とみなさなければならない。
なお、ここで挙げたwやWの求め方は、あくまで一例であり、例えば品質パラメータに応じたwやWをルックアップテーブルや任意の関数の形で予め決めておくという方法でも良い。
図10は第2の実施形態に係る再構成部の再構成処理を示すフローチャート(その2)である。
図9の方法が注目する(出力画像の画素値をこれから求める)色成分のみに基づき出力画像の画素値を決めていたのに対し、図10の方法は、他色(本実施形態では注目する色成分も含めて合計3色)の色成分を用いて出力画像の画素値を決める手法である。図10において、Sは注目する色成分のキーピクチャのi番目の画素値であり、s c1,s c2は他色成分のキーピクチャのi番目の画素値である。例えば、色空間が動画像符号化で一般的なYUV(輝度成分(Y)及び色差成分(U,V))の場合、sがY成分のキーピクチャの画素値であるとすると、s c1,s c2はそれぞれU成分およびV成分のキーピクチャの画素値であり、sがU成分のキーピクチャの画素値であるとすると、s c1,s c2はそれぞれY成分およびV成分のキーピクチャの画素値であり、sがV成分のキーピクチャの画素値であるとすると、s c1,s c2はそれぞれY成分およびU成分のキーピクチャの画素値である。
なお、動画像符号化では、色差成分(U成分とV成分)の縦または横またはその両方の解像度が、輝度成分(Y成分)の半分の解像度で圧縮されることも多い。この場合、sがY成分の画素値である場合、s c1,s c2はsを空間的に内包する位置のU成分およびV成分の画素値とし、sがU成分の画素値である場合、s c1,s c2はsが空間的に内包する空間内の何れかの画素値(例えば、それぞれ左上のY成分の画素値と空間的に同じ位置のV成分の画素値)とし、sがV成分の画素値である場合、s c1,s c2はsが空間的に内包する空間内の何れかの画素値(例えば、それぞれ左上のY成分の画素値と空間的に同じ位置のU成分の画素値)とする。
は出力画像のi番目の画素値の存在区間の下限値、Uは出力画像のi番目の画素値の存在区間の上限値で、L c1,L c2,U c1,U c2は下記(7)〜(10)式によって求められる他色の出力画像の画素値の存在区間の下限と上限である。
Figure 2019057900
上記各式において、v c1,v c2は、s c1,s c2に対応する再構成前画像の他色成分で、IDRCフィルタ部109によって生成された画素値である。wの意味は前述の図9で示した方法と同じである。
また、図10において、zは出力画像のi番目の画素値を示している。なお、w/2は切り捨てを基本とするが、切り上げても四捨五入でも一定の効果は存在する。
再構成部211は、sがL以上U以下、s c1がL c1以上U c1以下、s c2がL c2以上U c2以下か否かの判定を行い(S801)、条件に合致する場合には、zをsとする(S802)。条件に合致しない場合の処理(S701〜705)は図9の場合と同様である。
図10では、注目する色成分に加えて、空間的に同位置または近傍位置に位置する注目する色成分以外の色成分でもキーピクチャの画素値が存在区間内に収まっているとき、キーピクチャは正しい可能性が高いと信じてsをzとして採用する。一方、sが存在区間の外にある場合は、sがある側の境界値をzして採用する。sが存在区間内に収まっているにも関わらず、s c1,s c2が存在区間外にある場合、キーピクチャを信じることはできないため、存在区間の中間値にあたる再構成前画像のi番目の画素値にあたるvをzとする。
なお、Rが偶数の場合、U,U c1,U c2を計算する際に1で減算しても良い。つまり、以下の(11)〜(13)式としても良い。
Figure 2019057900
1を減算する理由は、図4〜図6の処理において、ダイナミックレンジを圧縮する際に四捨五入することを基本として想定しており(前述のとおり、DRCフィルタやIDRCフィルタにおいて、四捨五入する場合のみ本発明の効果が出るわけではない為、四捨五入以外の切り捨てや切り上げをおこなう形態でも一定の効果は存在する)、四捨五入には正のバイアスが発生しうるという性質があるためである。例えば、1の位で四捨五入すると10になる整数は5から14であるが、10より小さい数は5から9の5個あるのに対し、10より大きい数は11から14の4個しかない。この影響を考慮し、存在区間を求める際にvよりも大きい数の候補を、vよりも小さい数の候補より1個減らすことを考えたものが前述の(11)〜(13)式である。
図11は第2の実施形態に係る再構成部の再構成処理を示すフローチャート(その3)である。
図11の方法は図10の方法の派生方法である。再構成部211は、前述のステップS801の条件に合致しない場合には、sがL未満、s c1がL c1未満、s c2がL c2未満か否かの判定を行い(S901)、条件に合致する場合には、zをLとする(S902)。一方、再構成部211は、前述のステップS901の条件に合致しない場合には、sがU以上、s c1がU c1以上、s c2がU c2以上か否かの判定を行い(S903)、条件に合致する場合には、zをUとし(S904)、条件に合致しない場合には、zをvとする(S905)。
つまり、図11の方法は、注目する色成分に加えて、空間的に同位置または近傍位置に位置する注目する色成分以外の色成分でもキーピクチャの画素値が存在区間内に収まっているとき、キーピクチャは正しい可能性が高いと信じてsをzとして採用する。sが存在区間の外にある場合で、s c1,s c2もまた同じ側で存在区間の外にある場合、sがある側の境界値をzとして採用する。それ以外の場合では、キーピクチャを信じることはできないため、存在区間の中間値にあたる再構成前画像のi番目の画素値にあたるvをzとする。
なお、前述の図9〜図11の方法は、キーピクチャの画素値のスケール(つまり、ダイナミックレンジを圧縮していない入力画像オリジナルのスケール)で閾値判定する例であるが、逆に復号画像の非キーピクチャの背景領域の画素値のスケール(つまり、ダイナミックレンジが圧縮された状態のスケール)で閾値判定しても良い。復号画像の背景領域の画素値のスケールで閾値判定する場合には、キーピクチャの背景領域の画素値のダイナミックレンジを復号画像の非キーピクチャの背景領域の画素値のダイナミックレンジと同じ圧縮率で圧縮してからキーピクチャの背景領域の画素値が存在区間内にあるかを比較すれば良い。この場合、wはw=Wで求めればよく、つまりR=1.0とみなして存在区間を求めれば良い。どちらのスケールで比較したとしても、違いは比較するスケールにあるだけであり意味的な違いはなく、同様の効果を発揮する。
なお、図9〜図11の方法のいずれの方法も、再構成前画像の画素値とDRCフィルタ部103のパラメータとエンコーダ部406のパラメータとから出力画像の画素値の存在区間を求め、キーピクチャの画素値をサイドインフォメーションとして使って当該存在区間のなかから適切そうな出力画像の画素値を推定しているという意味では共通した方法である。
また、存在区間とサイドインフォメーションに基づき、確率的に画素値を決定する方法として、例えば、非特許文献1〜非特許文献3が提案されているが、これらの文献が示すような出力画像の画素値の決定方法としても良い。図12〜図14の方法は、いずれも、存在区間とサイドインフォメーションに基づき、確率的に画素値を決定する方法のうち、もっとも基本なものである。
また、本実施形態ではサイドインフォメーションsをキーピクチャの画素値としているが、非特許文献1〜非特許文献3に示されている通り、サイドインフォメーションsはキーピクチャの画素値と規定されている訳ではない。そのため、キーピクチャの画素値は、例えば直前に画像復号装置20Aより出力された出力画像の画素値としても良いし、再構成前画像と参照画像(キーピクチャや直前に画像復号装置20Aより出力された出力画像)とを用いて画素ごと又は1個以上の画素の集合であるブロックごとに動きベクトルを推定し、当該動きベクトルを使用して動き補償予測した予測画像の画素値としても良い。この場合、後処理バッファ110には、キーピクチャに限らずサイドインフォメーションを生成するのに必要な画像情報を格納するものとする。
(B−3)第2の実施形態の効果
第2の実施形態によれば、以下のような効果を奏することができる。
画像処理システム1Aは、入力画像をキーピクチャと非キーピクチャに分け、キーピクチャは無加工で符号化し、非キーピクチャはダイナミックレンジを圧縮してから符号化していることで、エンコーダの仕様および実装に手を加えることなしに、映像の伝送コストや蓄積コストを削減することができており、ダイナミックレンジの伸長やキーピクチャを使用した再構成も行っていることで、変化の小さい領域に関しては画質も維持されている。言い換えると、画像処理システム1Aは、ROIの品質は保証しつつ、画像全体の高画質化と符号量削減を両立できている。
また、第1の実施形態と異なり、第2の実施形態の画像符号化装置10Aは、キーピクチャをバッファリングすることなしに(つまり参照することなしに)ダイナミックレンジを圧縮しているため、画像符号化装置のメモリ消費量が削減されている。
さらに、第2の実施形態では、背景領域はダイナミックレンジが圧縮されているのみで、つまり画素値信号の振幅が抑圧されているだけで、映像として人間が認識可能なものとなっている。そのため、後処理部が存在しなくても意味のある映像が視聴できるという効果がある。同様に、IDRCフィルタ部は利用可能で、再構成部が存在しない場合でも意味のある映像を視聴できるという効果がある。この場合は、抑圧されていた振幅が限定的な精度で復元された映像を視聴することが可能になる。したがって、たとえば演算量の問題で後処理部や再構成部が使用できなくても意味のある映像の再生をおこなうことができる。このように第2の実施形態には復号側の演算量にスケーラビリティを持たせられるという効果もある。
(C)第3の実施形態
以下、本発明による符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システムの第3の実施形態を、図面を参照しながら詳述する。以下では、本発明の符号化装置を画像符号化装置に適用し、本発明の復号装置を画像復号装置に適用した例について説明する。
(C−1)第3の実施形態の構成
図13は、第3の実施形態に係る画像処理システム1Bの構成について示すブロック図である。なお、図13おいて、実線の矢印は、この実施形態における必須の処理(及び情報)の流れを示しているが、破線の矢印は必ずしもこの実施形態の効果を奏するために必須の処理(及び情報)では無い。以下、破線の矢印に係る処理(及び情報)については、適宜補足的に説明するものとする。
画像処理システム1Bでは、図1(図7)の画像符号化装置10(10A)と画像復号装置20(20A)が、画像符号化装置10Bと画像復号装置20Bに置き換わっている点で第1及び第2の実施形態と異なっている。以下では、第3の実施形態について第1及び第2の実施形態との差異を中心に説明する。
第3の実施形態の画像符号化装置10Bにおいて、前処理部200Bは、前処理ピクチャタイプ制御部101と、前処理ピクチャタイプを参照し、キーピクチャであることを指し示している場合にはROI付与画像を、非キーピクチャであることを指し示している場合にはROI付与画像に仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、内部画像として出力するDRCフィルタ部103と、前処理ピクチャタイプが非キーピクチャを指している場合には、内部画像にROI情報(ROIの位置や大きさ)に基づき符号化用品質パラメータを付与して、符号化前画像として出力する品質パラメータ制御部305とを有する。
エンコーダ部406は、AVC等の画像符号化方式を用いて、符号化前画像に付与されている符号化用品質パラメータに基づき符号化前画像を圧縮し、ビットストリームを出力する。
画像復号装置20Bにおいて、再構成部211は、後処理ピクチャタイプを参照し、キーピクチャであることを指し示している場合には再構成前画像を、非キーピクチャであることを指し示している場合には再構成前画像に再構成処理を施した画像を、出力画像として出力し、再構成処理の過程で品質パラメータを使用するときには該当する背景領域の品質パラメータを使用する。
(C−2)第3の実施形態の動作
図14は、第3の実施形態に係る画像処理システムの動作を示すフローチャートである。図14と図2(及び図8)の内、同一符号の処理は同様の処理であるので、以下では、第3の実施形態の画像処理システム1Bの特有の処理のみついて述べる。
(C−2−1)画像符号化装置10Bの動作
図14(A)は、第3の実施形態に係る画像符号化装置10Bの動作を示すフローチャートである。
前述のステップS12の後、DRCフィルタ部103は、前処理ピクチャタイプを参照し、ROI付与画像がキーピクチャであれば、ROI付与画像を内部画像として出力し、ROI付与画像が非キーピクチャであれば、ROI付与画像のうち背景領域に分類される画素に仮想的なキーピクチャの画素値を用いたフィルタリングを施し、内部画像として出力する(S51)。
品質パラメータ制御部305は、前処理ピクチャタイプを参照し、内部画像がキーピクチャであれば、内部画像の画像全体に一様な符号化用品質パラメータを付与して符号化前画像として出力し、内部画像が非キーピクチャであれば、内部画像に付与されたROI情報に基づき非一様な符号化用品質パラメータを付与して符号化前画像として出力する(S52)。具体的には、背景領域には粗い量子化(画質が低くなる)を、ROIには細かい量子化(画質が高くなる)をおこなうように誘導する符号化用品質パラメータを付与する。
なお、この実施形態で述べる一様な符号化用品質パラメータとは、必ずしもすべての領域で量子化パラメータが同一であることを指すものでは無い。動画像符号化の分野には、画像の特長に応じて量子化パラメータを画面内で割り振る方式も存在するが、このような方式も一様な符号化用品質パラメータの一種とみなす。一様な符号化用品質パラメータと非一様な符号化用品質パラメータの違いは、ROI情報に基づき領域によって品質パラメータが差別化されているか否かにある。
エンコーダ部406は、AVC等の画像符号化方式を用いて、符号化前画像を圧縮し、ビットストリームを出力する(S53)。符号化する際の品質パラメータには、符号化前画像に付与されたものを使用する。
(C−2−2)画像復号装置20Bの動作
前述のステップS41の後、再構成部211は、後処理ピクチャタイプを参照し、再構成前画像がキーピクチャであれば、再構成前画像を後処理用参照ピクチャおよび出力画像として出カし、再構成前画像が非キーピクチャであれば、後処理バッファ110から後処理用参照ピクチャを取り出し、再構成前画像のうち背景領域に分類される画素に再構成処理を施し、出力画像として出力する(S61)。
第2の実施形態でも説明したの通り、再構成部211は品質パラメータに基づき再構成を行う動作も考えられる。具体的には、品質パラメータを用いて、wを決定するという動作例が存在する。品質パラメータを用いた再構成をおこなうときには、各再構成する背景領域ごとに、割り振られている品質パラメータ(品質パラメータ制御部305によって割り振られた値)に基づき、エンコーダ部406で発生する量子化ステップまたはその近似値を求めて使用する。
なお、この実施形態では、第1の実施形態や第2の実施形態のように前処理部200(200A)において、DRCフィルタ部103を用いてダイナミックレンジの圧縮もおこなっているが、本実施形態では品質パラメータ制御部305によってROIと背景領域の品質に差がつけられるため、R=1.0の場合でも、つまりROI付与画像が内部画像として品質パラメータ制御部305に入力される構成でも一定の効果は得られる。この場合、R=1.0なので、復号画像が再構成前画像として再構成部211に入力される構成でも一定の効果は得られる。
(C−3)第3の実施形態の効果
第3の実施形態によれば、以下のような効果を奏することができる。
画像処理システム1Bは、画像をキーピクチャと非キーピクチャに分け、キーピクチャは無加工かつ画像全体が一様な品質パラメータで符号化し、非キーピクチャはダイナミックレンジを圧縮しつつ非一様な品質パラメータを割り振ってから符号化していることで、映像の伝送コストや蓄積コストを削減することができており、キーピクチャを使用して再構成をおこなっていることで、変化の小さい領域に関しては画質も維持されている。言い換えると、画像処理システム1Bは、ROIの品質は保証しつつ、画像全体の高画質化と符号量削減を両立できている。後処理部や再構成部が使用できなくても意味のある映像を視聴可能であるという効果は第2の実施形態と同様である。
(D)他の実施形態
前述した第1〜第3の実施形態においても種々の変形実施形態を言及したが、本発明は、以下の変形実施形態にも適用できる。
(D−1)前述した第1〜第3の実施形態において、上記では説明を簡単にするために、画像全体がROIと背景領域の2種類に区別される例を示しているが、背景領域にも重要度の段階があっても良い。例えば、ROIの設定に歩行者検出アルゴリズムと顔検出アルゴリズムを使用し、顔検出アルゴリズムによって検出されたROIは顔領域として、歩行者検出アルゴリズムによって検出された歩行者領域は相対的に重要な背景領域とし、顔でも歩行者でもない領域は相対的に重要ではない背景領域としても良い。この場合、背景領域の重要度に応じてダイナミックレンジの圧縮率Rや符号化用品質パラメータに異なる値を割り振って良く、例えば、相対的に重要な背景領域には弱いフィルタリング(相対的に高画質になるフィルタリング)を行い、相対的に重要ではない背景領域には強いフィルタリング(相対的に低画質になるフィルタリング)を行うという構成でも良い。割り振りは、例えば予め設定あるいは作成しておいた背景領域の重要度とフィルタ強度のルックアップテーブルに基づいておこなえば良い。また、上記では説明を簡単にするためにROIにはフィルタリングを適用しない例を示しているが、ROIに背景領域よりも弱いフィルタリングをかける構成であっても良い。
(D−2)前述した第1〜第3の実施形態において、例えば顔領域をROIとしたときの背景領域を劣化させデータ量を削減する例を示しているが、顔領域のようにしばしばROIとして選ばれる領域を劣化させても良い。この場合、本明細書における言葉の定義上は、非顔領域がROIであり、顔領域が背景領域である。非顔領域をROIとすることで、たとえばプライバシーを守ることができるなどの効果も得られる。
(D−3)前述した第1〜第3の実施形態において、機能ブロック間のデータの受け渡しを画像単位でおこなっているように記述しているが、画素値信号のデータの意味を明らかにするためであり、実装等では画素単位にデータを受け渡ししても良い。
(D−4)前述した第1〜第3の実施形態において、ROIとは主に画像空間の一部の限定された領域のように記載しているが、画像全体がROIであったり画像全体が背景領域であったりする画像が存在しても良い。
(D−5)前述した第1〜第3の実施形態において、画像符号化装置10(10A、10B)内の各機能や画像復号装置20(20A、20B)内の各機能は単一の装置のなかに実装されているように記述しているが、これらは実装例の一つであり、各機能が別の装置で実装されていたとしても、各信号が各構成図(図1、図7、図13)のように入出力がなされていれば本発明の効果は得られる。つまり、画像符号化装置10(10A、10B)や画像復号装置20(20A、20B)が1個以上の装置から構成され、それぞれの機能が分散して実装されていたとしても本発明の効果は存在する。
(D−6)特に第2の実施形態や第3の実施形態において、すべての色成分で同じダイナミックレンジの圧縮率Rを使用しているように記述しているが、全ての実施形態において色成分ごとにダイナミックレンジの圧縮率Rは異なる物であっても良い。
(D−7)前述した第2及び第3の実施形態において、画像符号化装置10A、10Bは、ROI設定部402を有する例を示したが、変形例として画像符号化装置10A、10Bは、ROI設定部402を有しなくても良い。この場合、変形例の符号化装置10A、10Bは、ROI設定部402が入力画像には興味領域(ROI)が存在しないと判定された場合と同様の動作となる。つまり、図7及び図13で示されるROI付与画像は、実際にはROIの存在しない入力画像となる(後段のDRCフィルタ部103に入力画像がそのまま入力される)。変形例の符号化の処理、及び画像復号装置20A、20Bの復号処理については前述の第2及び第3の実施形態で述べた処理をそのまま適用することができる。
1、1A、1B…画像処理システム、10、10A、10B…画像符号化装置、20、20A、20B…画像復号装置、101…前処理ピクチャタイプ制御部、103…DRCフィルタ部、104…前処理バッファ、108…後処理ピクチャタイプ制御部、109…IDRCフィルタ部、110…後処理バッファ、200、200A、200B…前処理部、211…再構成部、300、300A、300B…後処理部、305…品質パラメータ制御部、402…ROI設定部、406…エンコーダ部、407…デコーダ部。

Claims (28)

  1. 入力画像を符号化する符号化装置において、
    前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、
    前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、
    所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部とを有し、
    前記前処理部は、
    前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、
    前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対してキーピクチャを参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部と、
    前記DRCフィルタ部用のバッファである前処理バッファとを有し、
    前記DRCフィルタ部は、キーピクチャと判定されている前記注目領域付与画像を前処理用蓄積ピクチャとして出力することで前記前処理バッファに蓄積し、非キーピクチャと判定されている前記注目領域付与画像を、キーピクチャの情報を用いてフィルタリングするために、キーピクチャの情報を前処理用参照ピクチャとして前記前処理バッファから抽出する
    ことを特徴とする符号化装置。
  2. 入力画像に注目領域が付与され、注目領域が付与された入力画像の内、背景領域の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、
    前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、
    前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像にキーピクチャを参照するフィルタリングを施した画像を、出力画像として出力するIDRCフィルタ部と、
    前記IDRCフィルタ部用のバッファである後処理バッファとを有し、
    前記IDRCフィルタ部は、キーピクチャと判定されている前記復号画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記復号画像をキーピクチャの情報を用いてフィルタリングするために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出する
    ことを特徴とする複号装置。
  3. 入力画像を符号化して符号化データを生成する符号化装置と、前記符号化装置が生成した前記符号化データを復号して復号画像を生成する復号装置とを備える画像処理システムにおいて、前記符号化装置として請求項1に記載の符号化装置を適用し、前記復号装置として請求項2に記載の復号装置を適用したことを特徴とする画像処理システム。
  4. 前記DRCフィルタ部は、前記背景領域の画素値のダイナミックレンジを、前記前処理用参照ピクチャの画素値を中心に、情報量の削減量を操作するための係数でダイナミックレンジの圧縮率にあたる0.0〜1.0の実数Rを用いて、圧縮することで、情報量を削減し、
    前記IDRCフィルタ部は、前記背景領域の画素値のダイナミックレンジを、後処理用参照ピクチャの画素値を中心に、前記Rの逆数を用いて、伸長する
    ことを特徴とする請求項3に記載の画像処理システム。
  5. 前記符号化部は、キーピクチャと判定されている前記符号化前画像をイントラピクチャとして符号化し、非キーピクチャと判定されている前記符号化前画像をインターピクチャとして符号化するように制御することを特徴とする請求項3又は4に記載の画像処理システム。
  6. 前記DRCフィルタ部は、前記背景領域の画素値のダイナミックレンジを圧縮した後、その中心値を所定の画素値に移すか、又は前記背景領域の画素値の定義域が0〜Mまでとすると、前記背景領域の画素値のダイナミックレンジを圧縮した後、その中心値をM/2に移し、
    前記IDRCフィルタ部は、前記DRCフィルタ部が前記符号化前画像の中心値として使用した当該中心値を中心に、前記背景領域の画素値のダイナミックレンジを伸長する
    ことを特徴とする請求項4又は5に記載の画像処理システム。
  7. 前記DRCフィルタ部は、前記注目領域付与画像の画素値と前記前処理用参照ピクチャの画素値の差分値に対して、前記背景領域の画素値のダイナミックレンジを半分にする演算を行い、
    前記IDRCフィルタ部は、前記背景領域の画素値のダイナミックレンジを、前記半分にする演算の逆演算を行う
    ことを特徴とする請求項4〜6のいずれかに記載の画像処理システム。
  8. 前記DRCフィルタ部は、前記注目領域付与画像に対してキーピクチャを参照するフィルタリングを施すときに、抽出可能な前処理用参照ピクチャが前記前処理バッファに存在しない場合には、予め定めた固定の中心値を仮想的なキーピクチャの画素値として使用し、
    前記IDRCフィルタ部は、前記復号画像に対してキーピクチャを参照するフィルタリングを施すときに、抽出可能な前記後処理用参照ピクチャが前記後処理バッファに存在しない場合は、前記固定の中心値を仮想的なキーピクチャの画素値として使用する
    ことを特徴とする請求項4〜7のいずれかに記載の画像処理システム。
  9. 入力画像を符号化する符号化装置に搭載されるコンピュータを、
    前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、
    前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、
    所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部として機能させ、
    前記前処理部は、
    前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、
    前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対してキーピクチャを参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部と、
    前記DRCフィルタ部用のバッファである前処理バッファとを有し、
    前記DRCフィルタ部は、キーピクチャと判定されている前記注目領域付与画像を前処理用蓄積ピクチャとして出力することで前記前処理バッファに蓄積し、非キーピクチャと判定されている前記注目領域付与画像を、キーピクチャの情報を用いてフィルタリングするために、キーピクチャの情報を前処理用参照ピクチャとして前記前処理バッファから抽出する
    ことを特徴とする符号化プログラム。
  10. コンピュータを、
    入力画像に注目領域が付与され、注目領域が付与された入力画像の内、背景領域の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、
    前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、
    前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像にキーピクチャを参照するフィルタリングを施した画像を、出力画像として出力するIDRCフィルタ部と、
    前記IDRCフィルタ部用のバッファである後処理バッファとして機能させ、
    前記IDRCフィルタ部は、キーピクチャと判定されている前記復号画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記復号画像をキーピクチャの情報を用いてフィルタリングするために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出する
    ことを特徴とする複号プログラム。
  11. 入力画像を符号化する符号化装置において、
    前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、
    前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、
    所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部とを有し、
    前記前処理部は、
    前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、
    前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対して仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部とを有する
    ことを特徴とする符号化装置。
  12. 入力画像に注目領域が付与され、注目領域が付与された入力画像の内、背景領域の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、
    前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、
    前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像に仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、再構成前画像として出力するIDRCフィルタ部と、
    前記後処理ピクチャタイプが、キーピクチャである場合には前記再構成前画像を、非キーピクチャである場合には前記再構成前画像にキーピクチャを用いた再構成処理を施した画像を、出力画像として出力する再構成部と、
    前記再構成部用のバッファである後処理バッファとを有し、
    前記再構成部は、キーピクチャと判定されている前記再構成前画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記再構成前画像を、キーピクチャの情報を用いて再構成処理するために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出する
    ことを特徴とする復号装置。
  13. 入力画像を符号化して符号化データを生成する符号化装置と、前記符号化装置が生成した前記符号化データを復号して復号画像を生成する復号装置とを備える画像処理システムにおいて、前記符号化装置として請求項11に記載の符号化装置を適用し、前記復号装置として請求項12に記載の復号装置を適用したことを特徴とする画像処理システム。
  14. 前記再構成部は、前記再構成前画像の画素値と任意の存在区間の大きさから前記出力画像の画素値の存在区間を求め、サイドインフォメーションが前記存在区間に含まれる場合には、前記サイドインフォメーションを前記出力画像の画素値として適用し、前記サイドインフォメーションが前記存在区間の外にある場合には、前記サイドインフォメーションが存在する側の境界値を前記出力画像の画素値として適用することを特徴とする請求項13に記載の画像処理システム。
  15. 前記再構成部は、前記再構成前画像の画素値と任意の存在区間の大きさから前記出力画像の画素値の存在区間を求め、注目する色成分に加えて、空間的に同位置、又は近傍位置に位置する注目する色成分以外の色成分でもサイドインフォメーションが存在区間内に収まっているとき、前記サイドインフォメーションを前記出力画像の画素値として適用し、前記サイドインフォメーションの注目する色成分が前記存在区間の外にある場合には、前記サイドインフォメーションが存在する側の境界値を前記出力画像の画素値として適用し、前記サイドインフォメーションの注目する色成分が前記存在区間の内に収まっているにも関わらず、前記注目する色成分以外の色成分が前記存在区間の外にある場合には、前記存在区間の中間値にあたる再構成前画像の画素値を前記出力画像の画素値として適用することを特徴とする請求項13に記載の画像処理システム。
  16. 前記再構成部は、前記再構成前画像の画素値と任意の存在区間の大きさから前記出力画像の画素値の存在区間を求め、注目する色成分に加えて、空間的に同位置又は近傍位置に位置する注目する色成分以外の色成分でもサイドインフォメーションが存在区間の内に収まっているとき、前記サイドインフォメーションを前記出力画像の画素値として適用し、前記サイドインフォメーションの注目する色成分が前記存在区間の外にある場合で、注目する色成分以外の色成分でもサイドインフォメーションが同じ側で存在区間の外にある場合には、前記注目する色成分のサイドインフォメーションがある側の境界値を前記出力画像の画素値として適用し、それ以外の場合、前記存在区間の中間値にあたる再構成前画像の画素値を前記出力画像の画素値として適用することを特徴とする請求項13に記載の画像処理システム。
  17. 前記サイドインフォメーションは、後処理用参照ピクチャ、若しくは直前に前記画像復号装置より出力された前記出力画像、又は前記再構成前画像及び前記出力画像に基づいて生成された予測画像の画素値であることを特徴とする請求項14〜16のいずれかに記載の画像処理システム。
  18. 前記再構成部は、予め設定しておくことや、前記符号化部が使用する品質パラメータからの算出によって求められる前記符号化部で発生する量子化ステップ又はその近似値と前記DRCフィルタ部で使用する前記背景領域の画素値のダイナミックレンジの圧縮率の逆数を乗算したものを前記存在区間の大きさとすることを特徴とする請求項14〜17のいずれかに記載の画像処理システム。
  19. 前記再構成部は、前記サイドインフォメーションのダイナミックレンジを前記復号画像の背景領域の画素値のダイナミックレンジと同じ圧縮率で圧縮してから圧縮後の前記サイドインフォメーションが前記存在区間の内に存在するかを比較することを特徴とする請求項14〜18のいずれかに記載の画像処理システム。
  20. 入力画像を符号化する符号化装置に搭載されるコンピュータを、
    前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、
    前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、
    所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部として機能させ、
    前記前処理部は、
    前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、
    前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対して仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部とを有する
    ことを特徴とする符号化プログラム。
  21. コンピュータを、
    入力画像に注目領域が付与され、注目領域が付与された入力画像の内、背景領域の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、
    前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、
    前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像に仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、再構成前画像として出力するIDRCフィルタ部と、
    前記後処理ピクチャタイプが、キーピクチャである場合には前記再構成前画像を、非キーピクチャである場合には前記再構成前画像にキーピクチャを用いた再構成処理を施した画像を、出力画像として出力する再構成部と、
    前記再構成部用のバッファである後処理バッファとして機能させ、
    前記再構成部は、キーピクチャと判定されている前記再構成前画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記再構成前画像を、キーピクチャの情報を用いて再構成処理するために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出する
    ことを特徴とする復号プログラム。
  22. 入力画像を符号化する符号化装置において、
    前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、
    前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、
    所定の画像符号化方式を用いて、前記背景領域には粗い量子化を、注目領域には細かい量子化をおこなうように誘導する符号化用品質パラメータに基づき前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部とを有し、
    前記前処理部は、
    前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、
    前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対して仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、内部画像として出力するDRCフィルタ部と
    前記前処理ピクチャタイプが非キーピクチャである場合には、前記内部画像に注目領域の位置や大きさを表す注目領域情報に基づき前記符号化用品質パラメータを付与した上で、前記符号化前画像として出力する品質パラメータ制御部とを有する
    ことを特徴とする符号化装置。
  23. 入力画像を符号化して符号化データを生成する符号化装置と、前記符号化装置が生成した前記符号化データを復号して復号画像を生成する復号装置とを備える画像処理システムにおいて、前記符号化装置として請求項22に記載の符号化装置を適用し、前記復号装置として請求項12に記載の復号装置を適用したことを特徴とする画像処理システム。
  24. 前記再構成部は、前記再構成前画像の背景領域ごとに、割り振られている前記品質パラメータに基づき前記符号化部で発生する量子化ステップ又はその近似値を求めて使用することを特徴とする請求項23に記載の画像処理システム。
  25. 入力画像を符号化する符号化装置に搭載されるコンピュータを、
    前記入力画像に注目領域を付与し、注目領域付与画像として出力する注目領域設定部と、
    前記注目領域付与画像の内、背景領域の情報量を削減するための前処理を前記注目領域付与画像に対して施し、符号化前画像として出力する前処理部と、
    所定の画像符号化方式を用いて、前記背景領域には粗い量子化を、注目領域には細かい量子化をおこなうように誘導する符号化用品質パラメータに基づき前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部として機能させ、
    前記前処理部は、
    前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、
    前記前処理ピクチャタイプがキーピクチャである場合には前記注目領域付与画像を、非キーピクチャである場合には前記注目領域付与画像に対して仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、内部画像として出力するDRCフィルタ部と
    前記前処理ピクチャタイプが非キーピクチャである場合には、前記内部画像に注目領域の位置や大きさを表す注目領域情報に基づき前記符号化用品質パラメータを付与した上で、前記符号化前画像として出力する品質パラメータ制御部とを有する
    ことを特徴とする符号化プログラム。
  26. 入力画像を符号化する符号化装置において、
    前記入力画像の情報量を削減するための前処理を施し、符号化前画像として出力する前処理部と、
    所定の画像符号化方式を用いて、前記符号化前画像を圧縮し、圧縮した符号化データを出力する符号化部とを有し、
    前記前処理部は、
    前記入力画像がキーピクチャ又は非キーピクチャかを示す前処理ピクチャタイプを決定し、決定した前記前処理ピクチャタイプを出力する前処理ピクチャタイプ制御部と、
    前記前処理ピクチャタイプがキーピクチャである場合には前記入力画像を、非キーピクチャである場合には前記入力画像に対して仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、前記符号化前画像として出力するDRCフィルタ部とを有する
    ことを特徴とする符号化装置。
  27. 入力画像の情報量を削減するための前処理が行われた符号化前画像に対して、符号化処理が施された符号化データを復号して復号画像を出力する復号部と、
    前記復号画像がキーピクチャ又は非キーピクチャかを示す後処理ピクチャタイプを決定し、決定した前記後処理ピクチャタイプを出力する後処理ピクチャタイプ制御部と、
    前記後処理ピクチャタイプが、キーピクチャである場合には前記復号画像を、非キーピクチャである場合には当該復号画像に仮想的なキーピクチャの画素値を参照するフィルタリングを施した画像を、再構成前画像として出力するIDRCフィルタ部と、
    前記後処理ピクチャタイプが、キーピクチャである場合には前記再構成前画像を、非キーピクチャである場合には前記再構成前画像にキーピクチャを用いた再構成処理を施した画像を、出力画像として出力する再構成部と、
    前記再構成部用のバッファである後処理バッファとを有し、
    前記再構成部は、キーピクチャと判定されている前記再構成前画像を後処理用蓄積ピクチャとして出力することで当該後処理バッファに蓄積し、非キーピクチャと判定されている前記再構成前画像を、キーピクチャの情報を用いて再構成処理するために、キーピクチャの情報を後処理用参照ピクチャとして前記後処理バッファから抽出する
    ことを特徴とする復号装置。
  28. 入力画像を符号化して符号化データを生成する符号化装置と、前記符号化装置が生成した前記符号化データを復号して復号画像を生成する復号装置とを備える画像処理システムにおいて、
    前記符号化装置として請求項26に記載の符号化装置を適用し、前記復号装置として請求項27に記載の復号装置を適用したことを特徴とする画像処理システム。
JP2017182859A 2017-09-22 2017-09-22 符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システム Active JP6915473B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017182859A JP6915473B2 (ja) 2017-09-22 2017-09-22 符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017182859A JP6915473B2 (ja) 2017-09-22 2017-09-22 符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システム

Publications (2)

Publication Number Publication Date
JP2019057900A true JP2019057900A (ja) 2019-04-11
JP6915473B2 JP6915473B2 (ja) 2021-08-04

Family

ID=66107637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017182859A Active JP6915473B2 (ja) 2017-09-22 2017-09-22 符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システム

Country Status (1)

Country Link
JP (1) JP6915473B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114943639A (zh) * 2022-05-24 2022-08-26 北京瑞莱智慧科技有限公司 图像获取方法、相关装置及存储介质
WO2023182776A1 (ko) * 2022-03-22 2023-09-28 엘지전자 주식회사 중요 영역 기반 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2023238772A1 (ja) * 2022-06-08 2023-12-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003092745A (ja) * 2001-09-18 2003-03-28 Mega Chips Corp 画像配信方法、画像記録方法、およびそれらのプログラム
JP2003289310A (ja) * 2002-03-27 2003-10-10 N Ii C Tele Netsutowaakusu Kk ループバック試験装置、ループバック試験方法、およびそのプログラム
JP2009253767A (ja) * 2008-04-08 2009-10-29 Fujifilm Corp 画像処理装置、画像処理方法、およびプログラム
JP2017092886A (ja) * 2015-11-17 2017-05-25 日本電信電話株式会社 映像符号化方法、映像符号化装置及び映像符号化プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003092745A (ja) * 2001-09-18 2003-03-28 Mega Chips Corp 画像配信方法、画像記録方法、およびそれらのプログラム
JP2003289310A (ja) * 2002-03-27 2003-10-10 N Ii C Tele Netsutowaakusu Kk ループバック試験装置、ループバック試験方法、およびそのプログラム
JP2009253767A (ja) * 2008-04-08 2009-10-29 Fujifilm Corp 画像処理装置、画像処理方法、およびプログラム
JP2017092886A (ja) * 2015-11-17 2017-05-25 日本電信電話株式会社 映像符号化方法、映像符号化装置及び映像符号化プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023182776A1 (ko) * 2022-03-22 2023-09-28 엘지전자 주식회사 중요 영역 기반 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN114943639A (zh) * 2022-05-24 2022-08-26 北京瑞莱智慧科技有限公司 图像获取方法、相关装置及存储介质
WO2023238772A1 (ja) * 2022-06-08 2023-12-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法

Also Published As

Publication number Publication date
JP6915473B2 (ja) 2021-08-04

Similar Documents

Publication Publication Date Title
RU2685981C1 (ru) Устройство кодирования изображений, устройство декодирования изображений, способ кодирования изображений и способ декодирования изображений
KR102531052B1 (ko) 샘플 적응성 오프셋 제어
JP5039777B2 (ja) Dcシフトアーチファクトに対する量子化調整
JP5391290B2 (ja) テクスチャレベルに基づく量子化調整
JP5312468B2 (ja) ビデオ圧縮のためのループ内忠実度の向上
JP2022036084A (ja) 符号化装置、復号装置、符号化方法、及び復号方法
KR101337344B1 (ko) 영상 부호화/복호화 장치 및 영상을 부호화/복호화하는 방법
WO2014010583A1 (ja) 映像符号化/復号方法、装置、プログラム、記録媒体
AU2019298855B2 (en) Apparatus and method for filtering in video coding
JP2007184800A (ja) 画像符号化装置、画像復号化装置、画像符号化方法及び画像復号化方法
TW201349877A (zh) 影像編碼裝置、影像編碼方法、影像編碼程式、送訊裝置、送訊方法、送訊程式、以及影像解碼裝置、影像解碼方法、影像解碼程式、收訊裝置、收訊方法及收訊程式
CN110495178B (zh) 3d视频编码的装置和方法
WO2011039931A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
US10812832B2 (en) Efficient still image coding with video compression techniques
JP6915473B2 (ja) 符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システム
US20200296358A1 (en) Method and device for encoding image according to low-quality coding mode, and method and device for decoding mage
WO2013001729A1 (ja) 映像符号化装置及び映像復号装置
WO2014084674A2 (ko) 잔차 변환을 이용한 인트라 예측 방법 및 장치
KR20130078569A (ko) 관심영역 기반의 화질 향상을 위한 스크린 콘텐츠 비디오 부호화/복호화 방법 및 그 장치
KR101070173B1 (ko) 동영상 압축 효율을 높이기 위한 변환블록의 부호화 장치와 방법
JP2015080115A (ja) 画像符号化装置、画像符号化方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210628

R150 Certificate of patent or registration of utility model

Ref document number: 6915473

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150