JP6775339B2 - Image coding device and its control method - Google Patents
Image coding device and its control method Download PDFInfo
- Publication number
- JP6775339B2 JP6775339B2 JP2016131034A JP2016131034A JP6775339B2 JP 6775339 B2 JP6775339 B2 JP 6775339B2 JP 2016131034 A JP2016131034 A JP 2016131034A JP 2016131034 A JP2016131034 A JP 2016131034A JP 6775339 B2 JP6775339 B2 JP 6775339B2
- Authority
- JP
- Japan
- Prior art keywords
- plane
- coding
- luminance
- line
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
本発明は、撮像装置で撮像した画像の符号化技術に関するものである。 The present invention relates to a coding technique for an image captured by an imaging device.
デジタルカメラやデジタルカムコーダー等の撮像装置は、撮像素子にCCDセンサーまたはCMOSセンサーを採用している。それらのセンサーは主に単板式で構成されており、センサー表面のカラーフィルターアレイ(以下、CFAと呼称する)によって1つの画素で1つの色成分(例えばR、G、Bの内の1つ)の画素値を取得する。CFAを用いることで、例えば図2に示すようなR(赤)、G1(緑)、B(青)、G2(緑)の周期的なパターンで配置されたベイヤ配列の画像データ(以下、RAWデータと呼称する)が得られる。人間の視覚が輝度成分に対し高い感度を持っている。それ故、ベイヤ配列の2×2画素に着目しとき、赤(R)成分や青(B)成分がそれぞれ1画素であるのに対し、輝度成分を多く含む緑の画素は、図2のようにG1,G2の2画素(2倍)となっている。RAWデータは前述した通り、1画素に1つの色成分の情報しか持たない。一方、通常のカラー画像の1画素は、R,G,B等の複数成分を持つ。それ故、デモザイクと呼ばれる処理をRAWデータに施されることで、1画素につき赤、青、緑の3成分値を持つ画像データが生成される。一般に、デモザイクによって得られたRGB信号、あるいはRGB信号から変換して得られたYUV信号の画像データを符号化して記録する。しかし、デモザイク処理で得られる画像データは、1画素が3つの色成分で構成されるので、1画素1成分のRAWデータの3倍のデータ量となる。そこで、デモザイク前のRAWデータを符号化して記録する方法が提案されている(例えば特許文献1を参照)。 An image pickup device such as a digital camera or a digital camcorder employs a CCD sensor or a CMOS sensor as an image pickup element. These sensors are mainly composed of a single plate type, and one color component (for example, one of R, G, and B) is used for one pixel by a color filter array (hereinafter referred to as CFA) on the surface of the sensor. Get the pixel value of. By using CFA, for example, image data of a Bayer array arranged in a periodic pattern of R (red), G1 (green), B (blue), and G2 (green) as shown in FIG. 2 (hereinafter, RAW). (Called data) is obtained. Human vision has high sensitivity to luminance components. Therefore, when focusing on the 2 × 2 pixels of the Bayer array, the red (R) component and the blue (B) component are each one pixel, while the green pixel containing a large amount of the luminance component is as shown in FIG. It has 2 pixels (double) of G1 and G2. As described above, the RAW data has only one color component information per pixel. On the other hand, one pixel of a normal color image has a plurality of components such as R, G, and B. Therefore, by applying a process called demosaic to the RAW data, image data having three component values of red, blue, and green per pixel is generated. Generally, the image data of the RGB signal obtained by demosaic or the YUV signal obtained by converting from the RGB signal is encoded and recorded. However, since one pixel of the image data obtained by the demosaic process is composed of three color components, the amount of data is three times that of the RAW data of one pixel and one component. Therefore, a method of encoding and recording RAW data before demosaicing has been proposed (see, for example, Patent Document 1).
例えば、特許文献1には、RAWデータを信号成分毎(R、G1、B、G2)に分類して4つのコンポーネント(プレーン)に整理した後に符号化をする方法が示されている。
For example,
しかしながら、特許文献1のようにRAWデータを信号成分毎に分離してプレーンを形成する時に1画素間引きのサブサンプリングを用いてRAWデータから画素値を取り出している。サブサンプリングにより各プレーンで周波数の折り返りが生じてしまうことで、符号化処理の工程の内の周波数変換で低域成分と高域成分の切り分けが上手くできなくなる。そのため、画質への影響が小さい高周波数帯の成分の量子化ステップを大きくした場合、画質に大きな影響を持つ低周波数帯の成分も強く量子化されてしまう。従って、RAWデータを高い圧縮率で符号化するときの画質劣化が大きくなってしまい、圧縮効率が悪いことが問題となる。
However, as in
本発明は、上記問題点に鑑みなされたものであり、ベイヤ配列の画像データを画質劣化を抑えながらも、これまでよりも高い圧縮率で符号化する技術を提供しようとするものである。 The present invention has been made in view of the above problems, and an object of the present invention is to provide a technique for encoding image data of a Bayer array with a higher compression rate than before while suppressing deterioration in image quality.
この課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。すなわち、
ベイヤ配列の画像データを符号化する画像符号化装置であって、
ベイヤ配列の画像データから、R成分を示すRプレーン、B成分を示すBプレーン、G1成分を示すG1プレーン、G2成分を示すG2プレーンの4つの色プレーンに分離する分離手段と、
該分離手段で得られた4つの色プレーンから、輝度Yを示すYプレーン、及び、色差C1,C2,C3を示すC1プレーン、C2プレーン、C3プレーンで構成される輝度色差プレーンに変換する変換手段と、
前記輝度色差プレーンを符号化する符号化手段と
を有し、
前記変換手段は、次式に従って色プレーンを輝度色差プレーンに変換する
ことを特徴とする。
In order to solve this problem, for example, the image coding apparatus of the present invention has the following configuration. That is,
An image coding device that encodes image data in a Bayer array.
A separation means for separating the image data of the Bayer array into four color planes: an R plane showing the R component, a B plane showing the B component, a G1 plane showing the G1 component, and a G2 plane showing the G2 component.
A conversion means for converting the four color planes obtained by the separation means into a Y plane indicating the luminance Y and a luminance color difference plane composed of the C1 plane, the C2 plane, and the C3 plane showing the luminance C1, C2, and C3. When,
Have a coding means for coding the luminance and chrominance planes,
The conversion means converts the color plane into a luminance color difference plane according to the following equation.
It is characterized by that .
本発明によれば、ベイヤ配列の画像データを画質劣化を抑えながらも、これまでよりも高い圧縮率で符号化することが可能になる。 According to the present invention, it is possible to encode the image data of the Bayer array with a higher compression rate than before while suppressing deterioration of image quality.
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。なお、以下の説明では、画像符号化装置を撮像装置(デジタルビデオカメラ等)に搭載する例を説明する。しかし、符号化対象の画像データがベイヤ配列となっていれば良いので、符号化対象の画像データの発生源の種類は問わない。例えば、メモリカード等の記憶媒体、或いはネットワークから符号化対象画像データを取得して符号化する場合にも適用可能である。撮像装置を例にするのは、あくまで理解を容易にするためであると理解されたい。 Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. In the following description, an example in which an image coding device is mounted on an image pickup device (digital video camera or the like) will be described. However, as long as the image data to be encoded has a Bayer array, the source of the image data to be encoded does not matter. For example, it can be applied to a case where image data to be encoded is acquired from a storage medium such as a memory card or a network and encoded. It should be understood that the image pickup device is used as an example for the sake of easy understanding.
[第1の実施形態]
図1は第1の実施形態が適用する撮像装置(デジタルビデオカメラ)のブロック構成図である。以下、同図を参照して、各構成要素を説明する。
[First Embodiment]
FIG. 1 is a block configuration diagram of an imaging device (digital video camera) to which the first embodiment is applied. Hereinafter, each component will be described with reference to the figure.
撮像装置100は、操作部101、主制御部102、撮像部104、信号処理部105、画像符号化装置114、符号化ストーム生成部110、一次記憶部111、メモリI/O部112、記憶媒体113、及び、上記構成を接続するためのバス150を有する。
The
画像符号化装置114は、符号化制御部103、色分離部106、プレーン変換部107、プレーン選択部108、並列符号化部109で構成されている。
The
尚、第1の実施形態における撮像装置は図2に示すベイヤ配列の画像データ(以下、RAW画像データという)に対して、現像処理をすることなく圧縮する。第1の実施形態における撮像装置100は、操作部101により圧縮モードが設定された後に、被写体の撮影の開始指示入力があって撮像、符号化、記録を行う。圧縮モードには、例えばポストプロダクション向けの低圧縮モード、常用想定の中圧縮モード、画質を多少犠牲にしても長い時間の記録を求める高圧縮モードなどの複数のモードが設けられている。これらのモードの選択は、ユーザが操作部101を介して設定することになる。尚、圧縮モードは、主制御部102が撮影時の圧縮率を設定する際に使用される。操作部101はシャッタースイッチ(記録スイッチ)や操作キーなどの押しボタン、タッチパネルのいずれでも良いし、それらの組み合わせでも構わない。
The image pickup apparatus in the first embodiment compresses the image data of the Bayer array shown in FIG. 2 (hereinafter referred to as RAW image data) without performing development processing. After the compression mode is set by the operation unit 101, the
主制御部102は、CPUと、当該CPUが実行する制御プログラムを格納するメモリで構成され、操作部101からの命令を受けてCPUがメモリから制御プログラムを読みだし撮像装置100を制御する。また、主制御部102は撮影情報を符号化制御部103に供給する。本実施形態における撮影情報は、例えば画像データの画素数や1画素あたりのビット深度、圧縮率で構成されるが、他にもシャッタースピードやISO感度などを用いても良い。尚、圧縮率は操作部101によって設定され、主制御部102に送られた圧縮モードに応じて所定の値が設定される。例えば、低圧縮モードでは1/2、中圧縮モードでは1/5、高圧縮モードでは1/8、と設定することができる。
The main control unit 102 includes a CPU and a memory for storing a control program executed by the CPU, and the CPU reads a control program from the memory and controls the
符号化制御部103は主制御部102によって送られた撮影情報を基に、符号化条件を設定する。本実施形態における符号化条件は、符号化対象となるプレーンの属性、及びプレーン毎の目標符号量である。ここでプレーンの属性とは後述する色プレーンや輝度色差プレーンのことを指す。
The
またプレーン毎の目標符号量は、全体の目標符号量から各プレーンの符号量の重み付けを加味して設定される。全体の目標符号量は、例えば『画像データの画素数×1画素あたりのビット深度×圧縮率』の計算などによって求められる。プレーン毎の目標符号量は、例えば全体の目標符号量を45MB、及びP1〜P4からなる各プレーンの重み付けをP1:P2:P3:P4=2:1:1:1とすると、P1プレーンが18MB、P2〜P4プレーンがそれぞれ9MB、として求まる。 Further, the target code amount for each plane is set by adding the weighting of the code amount of each plane from the total target code amount. The total target code amount can be obtained by, for example, calculating "the number of pixels of image data x the bit depth per pixel x the compression rate". The target code amount for each plane is, for example, if the total target code amount is 45 MB and the weighting of each plane consisting of P1 to P4 is P1: P2: P3: P4 = 2: 1: 1: 1, the P1 plane is 18 MB. , P2 to P4 planes are obtained as 9 MB each.
プレーンの属性、及びプレーン毎の符号量の重み付けは、図3に示すようなテーブルから圧縮率に従ってテーブル引きすることで設定される。図3の例は圧縮率1/3を区切りに、ポストプロダクションで編集・加工する用途を想定した低圧縮率の場合と、従来の民生デジタルビデオカメラと同様に記録した動画を視聴する用途を想定した高圧縮率の場合の2パターンを定義している。 The attributes of the planes and the weighting of the code amount for each plane are set by subtracting the table from the table as shown in FIG. 3 according to the compression ratio. The example in Fig. 3 assumes a low compression rate for post-production editing and processing with a compression rate of 1/3 as a delimiter, and an application for viewing recorded moving images in the same way as a conventional consumer digital video camera. Two patterns are defined in the case of a high compression ratio.
圧縮したRAW画像データをポストプロダクションで編集・加工する場合は、シャープネスやノイズ除去等の画像処理を強く掛けたり、カラーコレクションを行うことが想定される。そこで、輝度色差プレーン変換を行わず、色プレーン間の符号量の重みを同じにし、低圧縮で符号化することでRAW画像データが本来持つ各色のバランスを損なわないようにする。 When editing and processing compressed RAW image data in post-production, it is expected that image processing such as sharpness and noise removal will be strongly applied or color correction will be performed. Therefore, the luminance color difference plane conversion is not performed, the weights of the code amounts between the color planes are made the same, and the coding is performed with low compression so that the balance of each color originally possessed by the RAW image data is not impaired.
視聴を目的とする場合は、圧縮率を高くして動画の記録時間を延ばしつつも、画質を維持することが重要となる。そのため高圧縮率の場合は、輝度色差プレーンを符号化対象プレーンとして、視覚的に影響が大きい輝度成分に相当するYプレーンの符号量を、視覚的に影響が小さい色差成分に相当するC1〜C3プレーンの符号量よりも多くするように符号量に重み付けをする。色差成分を強く圧縮することによって圧縮率を高くするとともに、輝度成分の劣化を抑えることで画質の維持が可能となる。尚、図3で示すテーブルとは異なったパターンでテーブルを用意しても良い
符号化制御部103は、テーブルから取得したプレーンの属性をプレーン選択部108に供給し、同様にテーブルから取得したプレーン毎の符号量の重み付けに従って計算されたプレーン毎の目標符号量を並列符号化部109に供給する。
For viewing purposes, it is important to maintain image quality while increasing the compression rate to extend the recording time of moving images. Therefore, in the case of a high compression ratio, the luminance color difference plane is used as the coding target plane, and the code amount of the Y plane corresponding to the luminance component having a large visual influence is used as C1 to C3 corresponding to the luminance component having a small visual influence. The code amount is weighted so that it is larger than the code amount of the plane. The compression rate is increased by strongly compressing the color difference component, and the image quality can be maintained by suppressing the deterioration of the luminance component. A table may be prepared in a pattern different from that shown in FIG. 3. The
符号化制御部103が符号化条件を設定した後、主制御部102が撮像部104を駆動させ、被写体の撮像画像データを取得する。撮像部104は撮像レンズと、図2で示すベイヤ配列のカラーフィルターを有する撮像センサ、並びにA/D変換器から構成されている。そして、被写体の光学像が撮像レンズによってセンサーに結像された後、結像された光学像がA/D変換器でデジタルのRAW画像データに変換されることになる。尚、撮像センサはCMOSやCCDで構成される。また、実施形態における撮像装置は、例えば30フレーム/秒の動画像を撮像するものとする。
After the
撮像部104から送られた1フレーム分のRAW画像データは信号処理部105に供給される。信号処理部105は、入力したRAW画像データ内の、撮像部104の撮像センサにおける欠落画素や信頼性の低い画素の値に対し、周辺画素値を用いて修復処理したり、所定のオフセット値を減算したりする処理を行い、処理結果を画像符号化装置114に供給する。
One frame of RAW image data sent from the
画像符号化装置114内の色分離部106は、信号処理部105で修復処理されたRAW画像データを以下に示す4つのプレーンに分離し、プレーン変換部107、プレーン選択部108に供給する。
・Rプレーン:R成分のみの画素で構成されるプレーン
・Bプレーン:B成分のみの画素で構成されるプレーン
・G1プレーン:G1成分のみの画素で構成されるプレーン
・G2プレーン:G2成分のみの画素で構成されるプレーン
The
-R plane: A plane composed of pixels containing only the R component-B plane: A plane composed of pixels containing only the B component-G1 plane: A plane composed of pixels containing only the G1 component-G2 plane: Only the G2 component Plane composed of pixels
プレーン変換部107は、上記の4つのプレーンを、次式(1)に基づき、輝度Yを示すYプレーン、色差C1,C2,C3を示すC1プレーン、C2プレーン、及びC3プレーンに変換する。以下の式における+,−は、各プレーンの同一位置の画素の値の演算を示し、演算結果が整数であるものとする(小数点以下は切り捨てとする)。
The
なお、RAW画像データの水平方向画素数をW,垂直方向の画素数をHと表現したとき、上記のR,B,G1,G2、Y,C1,C2,C3の各プレーンのサイズは同じであって、W/2×H/2である。つまり、RAW画像データを4プレーンに分離したとき、分離後の4プレーンの画素数の合計は、RAW画像データの画素数と同じとなる。 When the number of pixels in the horizontal direction of the RAW image data is expressed as W and the number of pixels in the vertical direction is expressed as H, the sizes of the above R, B, G1, G2, Y, C1, C2, and C3 planes are the same. There is, W / 2 × H / 2. That is, when the RAW image data is separated into 4 planes, the total number of pixels of the 4 planes after the separation is the same as the number of pixels of the RAW image data.
プレーン選択部108は、{Rプレーン、Bプレーン、G1プレーン、G2プレーン}の色プレーン群、又は、{Yプレーン、C1プレーン、C2プレーン、C3プレーン}の輝度色差プレーン群のいずれか一方を選択し、並列符号化部109に供給する。この符号化対象のプレーン群の選択は、操作者が操作部101に対して選択したモードから主制御部101が決定し、符号化制御部103に設定されるものである。具体的には、図3に示すように、操作者が圧縮率として符号量が1/1〜1/3(オリジナルの情報量に対して100%から33%の範囲)の場合には色プレーンを符号化対象とし、1/3を超える圧縮率の場合には輝度色差プレーンを符号化対象となる。なお、ここで示したプレーンの切り替わりの圧縮率は一例である点に注意されたい。
The
並列符号化部109は、図4に示すように4つの符号化部109a乃至109dで構成されており、それぞれが、供給されたプレーン群を構成する1つのプレーンについて圧縮符号化する。実施形態における符号化部109a乃至109dは、互いに独立して圧縮符号化を実行する。
As shown in FIG. 4, the
並列符号化部109内の符号化部109a乃至109dは同じ構成である。それ故、以下では、符号化部109aについて説明する。図4は、符号化部109aのブロック構成図である。他の符号化部109b乃至dも同じである点に注意されたい。
The
符号化部109aは、離散ウェーブレット変換部401、量子化制御部402.量子化部403、エントロピー符号化部404を有する。
The
離散ウェーブレット部401は入力した符号化対象プレーンに対し周波数分離処理が行い、複数のサブバンドを生成する。離散ウェーブレット部401による周波数分離処理で生成されるサブバンドの例を図5に示す。同図は、ウェーブレット変換を2回実行した場合のサブバンドを示している。
The
ウェーブレット変換を1回行うと、LL、HL,LH,HHの4つのサブバンドが生成される。ここで、Lが低域、Hが高域を表す。L、Hの前の数字が分解レベルを表す。例えば、1HLは、水平方向が高域成分で、垂直方向が低域成分である分解レベル=1のサブバンド画像を表す。なお、ウェーブレット変換の回数に制限はない。また、2回目以降のウェーブレット変換は、直前のウェーブレット変換で得られたサブバンドLLに対して再帰的に行うことになる。それ故、予定した回数のウェーブレット変換を行った際のサブバンドLLは1つしか存在しない。図示は、ウェーブレット変換を2回行った例でるので、7つのサブバンドが生成されることになる。 When the wavelet transform is performed once, four subbands of LL, HL, LH, and HH are generated. Here, L represents a low frequency band and H represents a high frequency band. The numbers before L and H represent the decomposition level. For example, 1HL represents a subband image having a decomposition level = 1 in which the horizontal direction is a high frequency component and the vertical direction is a low frequency component. There is no limit to the number of wavelet transforms. Further, the second and subsequent wavelet transforms are recursively performed with respect to the subband LL obtained by the immediately preceding wavelet transform. Therefore, there is only one subband LL when the wavelet transform is performed a predetermined number of times. The illustration shows an example in which the wavelet transform is performed twice, so that seven subbands are generated.
量子化制御部402は、サブバンド毎の符号量、及び各サブバンドを構成するライン毎の量子化ステップサイズの設定を行う。量子化制御部402は、符号化制御部101より送られたプレーン毎の目標符号量に基づき、図11に示す例の様にサブバンド毎に符号量の割り当てを行う。図11はプレーンに設定された目標符号量18MBを、ウェーブレット変換を1回実行して生成されたサブバンドに対して割り当てる例を示す。図11の例ではサブバンド間の符号量比率が『LL:1HL:1LH:1HH=4:2:2:1』の関係である。これに基づいて、サブバンドLLに8MB、サブバンド1HL、1LHそれぞれに4MB、サブバンド1HHバンドに2MBを割り当てている。尚、図11においてサブバンドLLは画質への影響が大きい低域成分に該当することから、サブバンドLLを優遇して符号量を多く割り当てている。続いて、水平、あるいは垂直の1方向の低域成分を含む1HL、1LHバンドに対し、画質への影響が軽微な1HHバンドよりも多く符号量を割り当てるように設定する。また、図11は、ウェーブレット変換を1回行う場合の符号量を示しているが、ウェーブレット変換を2回以上行った場合にも各サブバンド毎の目標符号量が設定される。簡単には、ウェーブレット変換の回数と、各サブバンドの目標符号量をテーブル化しておけば良い。
The
また、量子化制御部402は、後述するエントロピー符号化部404から送られた符号化結果を参照し、係数のライン単位で量子化ステップサイズを設定する。量子化ステップサイズの設定の詳細については並列符号化部109の処理フローの説明で後述する。
Further, the
量子化部403は、離散ウェーブレット部401から送られた着目サブバンド内の係数データで構成される1ラインを量子化対象とし、量子化制御部402によって設定された量子化ステップサイズを用いて量子化を行う。
The
エントロピー符号化部404は、量子化部403によって量子化された係数のラインを圧縮符号化し、ライン単位の符号化データを出力すると共に、ライン単位の発生符号量の情報を量子化制御部402に送る。ここで、エントロピー符号化部404で用いる圧縮符号化としては、DPCMやハフマン符号等を用いることが出来る。
The
符号化ストリーム生成部110は、並列符号化部109で生成された1フレーム分の付符号化データ(全プレーン、全サブバンドの符号化データ)をまとめ、符号化条件などを示すヘッダを付加し、復号可能なストリームを生成する。また、符号化ストリーム生成部110は全サブバンド、全プレーン分の符号が揃うまでは一時記憶部111に並列符号化部109から送られた符号を退避する。一時記憶部111は例えばDRAMといった記憶素子で構成することが出来る。符号化ストリーム生成部110は全サブバンド、全プレーン分の符号が揃った時点で一時記憶部111に退避した符号を読み出してストリームを生成する。
The coded
符号化ストリーム生成部110は、生成されたストリームをメモリI/O部112を介して記録媒体113に書き込む。記録媒体113は磁気ディスク及び半導体メモリなどで構成することが出来きるが、その種類は問わない。
The coded
以上、本第1の実施形態における撮像装置100の構成を処理該当を説明した。続いて、本第1の実施形態における画像符号化装置を搭載したデジタルビデオカメラにおける符号化処理の詳細を図6に示すフローチャートに基づき説明する。
The processing of the configuration of the
まず始めに操作部101から主制御部102に撮影記録開始命令が発行されたことを受け、主制御部102は符号化制御部103に撮影情報を送る(S601)。符号化制御部103は、この撮影情報に従って符号化条件を設定する(S602)。この符号化条件には、プレーン選択部108が色プレーン、輝度色差プレーンのいずれを選択するかの情報も含まれる。その後、撮像部104によりRAW画像データが取得され、信号処理部105がRAW画像データの修復処理を行う(S603)。色分離部106は、この修復処理後のRAW画像データを入力し、RAW画像データを4つの色プレーン{Rプレーン、Bプレーン,G1プレーン,G2プレーン}に分離する(S604)。プレーン変換部107は、4つの色プレーンを輝度色差プレーン{Yプレーン、C1プレーン、C2プレーン、C3プレーン}に変換する(S605)。プレーン選択部108は、符号化条件に従って色プレーンと輝度色差プレーンのいずれか一方を符号化対象プレーンとして選択し(S606)、並列符号化部109に供給する(S607)。並列符号化部109の内部の符号化部109a乃至109dそれぞれは、符号化対象プレーンそれぞれの符号化処理を並列的に行い、生成された符号化データを符号化ストリーム生成部110に出力する。符号化ストリーム生成部110は、並列符号化部109から出力されてきた符号化データを、一時記憶部111に保存し、全サブバンドの符号化データが終了したか否かを判定する(S608)。終了していない場合は処理の状態をS608のまま維持する。全プレーン、全サブバンドの符号化が終了している場合は、符号化ストリーム生成部110は、一時記憶部111から全ての符号化データを読み出し、所定のデータフォーマットの符号化ストリームを生成する(S609)。そして、符号化ストリーム生成部110は、生成した符号化ストリームをメモリI/O部112を介して記憶媒体113に書き出す(S610)。主制御部102は、操作部101を介して操作者より、撮影終了を指示されたか否かを判定する(S611)。否の場合には、主制御部102は、動画像の撮影記録が継続するものとし、処理をステップS603に戻す。また、終了指示の入力があったと判断された場合、主制御部102は本処理を終了する。
First, in response to the issuance of a shooting recording start command from the operation unit 101 to the main control unit 102, the main control unit 102 sends shooting information to the coding control unit 103 (S601). The
次に、実施形態における並列符号化部109を構成する符号化部109a乃至109dの処理の詳細を図7に示すフローチャートに基づき説明する。先に説明したように符号化部109a乃至109dは、その構成が同じであり、ここでは代表して符号化部109a(図4参照)を説明する。
Next, the details of the processing of the
離散ウェーブレット部401は、入力した着目プレーンに対してウェーブレット変換を実行し、複数のサブバンドを生成し(S701)、符号化するサブバンドとそのサブバンドの目標符号量を設定する(S702)。各サブバンドは、複数の係数データで構成される。量子化制御部402は、量子化部403に入力される1ライン分の係数データが、着目サブバンドの1ライン目で有るか否かを判定する(S703)。1ライン目の場合、量子化制御部402は初期の所定の量子化ステップサイズを設定し(S704)、1ライン目ではない場合については量子化制御部402は1つ前のラインの符号化結果を参照して量子化ステップサイズを算出し設定する(S705)。1ライン目の符号化で設定される所定の量子化ステップサイズは、例えば統計値などで予め定義した値を使うことが出来る。ここで、S705の量子化ステップサイズの算出方法は、例えば後述する図8に示す方法がある。
The
その後、量子化部403は、量子化制御部402によって設定された量子化ステップサイズに従い、1ライン分の係数データを量子化し(S706)、量子化後のライン分の係数データをエントロピー符号化部404に供給する。エントロピー符号化部404は、入力した1ライン分の量子化係数データをエントロピー符号化し、符号化データを生成しては出力する(S707)。このとき、エントロピー符号化部404は、着目ラインの符号化データ量を示す情報を量子化制御部402に供給する。
After that, the
その後、符号化部109は、着目サブバンドの最終ラインを処理したか否かを判定し(S708)、最終ラインで無い場合はS703に戻る。最終ラインを処理した場合は続いて全サブバンドの処理を終了したかを判定し(S709)、終了していない場合はS702に戻り、終了している場合は符号化を終了する。
After that, the
続いて、S705の量子化制御部402による量子化ステップサイズの算出処理について、図8に示すフローチャートに基づき説明する。
Subsequently, the calculation process of the quantization step size by the
1つのサブバンド内における上下に隣り合ったラインは相関が高い。それ故、符号化対象のラインの量子化ステップサイズを求める際には、直前(1つ上)のラインの符号化結果を利用すると符号化効率が高くなると推定できる。そこで、本実施形態では、量子化制御部402は、着目サブバンドの符号化を行うに先立って、着目サブバンドの目標符号量をライン数分だけ等分して1ライン当たりの目標符号量Tを求める(S801)。そして、量子化制御部402は、符号化対象となる着目ラインを符号化する際に、直前のラインの実際の発生符号量(R)をTと比較して、R>T+αであるか否かを判定する(S802)。ここで、αは、RとTを比較する時に用いる所定の正の許容誤差値であり、例えばT×0.01等の計算で求めたり、50KBなどの数値で設定したりすることが出来る。R>T+αである場合は、直前のラインで設定した量子化ステップサイズを用いると符号化対象ラインの符号量も目標符号量より多く出てしまうと予測される。そこで、量子化制御部402は、符号化対象の着目ラインの量子化ステップサイズを、直前のラインの量子化ステップサイズに所定値(正の値)だけ加算した値とする(S803)。一方、R>T+αに当てはまらない場合は、量子化制御部402に、R<T―αを満たすか否か判定する(S804)。R<T―αである場合は、直前のラインで設定した量子化ステップサイズを用いると符号化対象ラインの符号量が目標符号量より少なくなると予測されることを意味する。そこで、量子化制御部402は、着目ラインの量子化ステップサイズを直前のラインの量子化ステップサイズから所定値だけ減じた値とする(S805)。いずれにも当てはまらない場合、つまり、T−α≦R≦T+αであった場合、直前のラインで設定した量子化ステップサイズを用いれば符号化対象ラインの符号量が目標通り発生すると予測されるため、直前のラインの量子化ステップサイズをそのまま設定する(S806)。
Lines adjacent to each other in one subband are highly correlated. Therefore, when determining the quantization step size of the line to be encoded, it can be estimated that the coding efficiency will be high if the coding result of the immediately preceding (upper) line is used. Therefore, in the present embodiment, the
以上の様に本実施例のデジタルビデオカメラに搭載される画像符号化装置は、ベイヤ配列の画像データに対して、色成分毎に分離して各色のプレーン画像を生成し、その後に各色プレーンから輝度プレーンと色差プレーンに分離、輝度色差プレーンを符号化する。輝度プレーンはR、G1、G2、Bの相関を抽出した平均成分であり、視覚的に大きな影響を持っている。逆に色差プレーンはR、G1、G2、Bの相関を除去した差分成分であり、輝度プレーンと比べて視覚的な影響が小さい。そのため、量子化を行うにあたり輝度プレーンの符号量を優遇し、色差プレーンの符号量を少なくすることで、画質を保ったままベイヤ配列の画像データを圧縮することが可能となる。 As described above, the image coding device mounted on the digital video camera of this embodiment generates a plane image of each color by separating each color component from the image data of the Bayer array, and then from each color plane. Separate into a luminance plane and a color difference plane, and encode the luminance color difference plane. The luminance plane is an average component obtained by extracting the correlation of R, G1, G2, and B, and has a great visual influence. On the contrary, the color difference plane is a difference component from which the correlation of R, G1, G2, and B is removed, and has a smaller visual influence than the luminance plane. Therefore, by giving preferential treatment to the code amount of the luminance plane and reducing the code amount of the color difference plane in performing the quantization, it is possible to compress the image data of the Bayer array while maintaining the image quality.
尚、本実施例ではベイヤ配列の画像データを圧縮するデジタルビデオカメラを例として取り上げたが、本発明はそれに限定されるものでは無く、例えばデジタルスチルカメラやスマートフォンに用いても良い。 In this embodiment, a digital video camera that compresses image data in a Bayer array is taken as an example, but the present invention is not limited thereto, and may be used for, for example, a digital still camera or a smartphone.
[第2の実施形態]
図9は、第2の実施形態における撮像装置のブロック構成図である。第1の実施形態との違いは、第1の実施形態のプレーン変換部107に代わって近似プレーン変換部901とした点である。以下、図9を参照して、本第2の実施形態における動作を説明する。
[Second Embodiment]
FIG. 9 is a block configuration diagram of the imaging device according to the second embodiment. The difference from the first embodiment is that the approximate
先に説明した第1の実施形態における画像符号化装置114で用いられる計算式1において、各プレーンの計算結果は整数値となることを前提にしたため、除算の計算結果が整数値とならない場合には丸め誤差が発生する。除算の丸め処理で情報損失が発生し、輝度色差プレーンから元の色プレーンに可逆の変換をすることが出来ない。そこで丸め処理による情報損失を除外するために、プレーン変換部107の計算式を近似した計算式を近似プレーン変換部901に適用する。
In the
第2の実施形態における近似プレーン変換部901は、次式(2)に基づいて、色プレーンをYプレーン、C1プレーン、C2プレーン、及びC3プレーンからなる輝度色差プレーンに変換する。
The approximate
尚、式(3)は式(2)の各式に対して、移項のみを用いて変形した逆変換式である。 It should be noted that the equation (3) is an inverse conversion equation obtained by modifying each equation of the equation (2) by using only the transposition.
続いて、本第2の実施形態の画像符号化装置902を搭載した撮像装置900の動作の詳細を図10に示すフローチャートに基づき説明する。尚、第1の実施形態と同様の処理には同じ符号を付して示し、ここでの説明を簡略にする。
Subsequently, the details of the operation of the
まず、第1の実施形態と同様に、撮影命令を受けてから符号化条件を設定する。色分離部106は、RAW画像データを取得し、色プレーンに分離する(S601−S604)。その後に、近似プレーン変換部901によって色プレーンに基づいて、式(2)に従って輝度色差プレーンを生成する(S1001)。次に符号化対象プレーンを選択して符号化を行い、符号化ストリームを生成する(S606−S611)。
First, as in the first embodiment, the coding conditions are set after receiving the photographing command. The
以上の様に本第2の実施形態の撮像装置に搭載される画像符号化装置は、各色プレーンから輝度色差プレーンに変換するにあたり、第1の実施形態で用いられる計算式を近似した計算式を用いる。この結果、符号化処理による量子化処理による量子化誤差は発生するものの、色変換による演算誤差は無くなり、第1の実施形態と比較してロスの少ない符号化データを生成することが可能となる。 As described above, the image coding apparatus mounted on the image pickup apparatus of the second embodiment uses a calculation formula that approximates the calculation formula used in the first embodiment when converting from each color plane to the luminance color difference plane. Use. As a result, although the quantization error due to the quantization process by the coding process occurs, the calculation error due to the color conversion is eliminated, and it is possible to generate the coded data with less loss as compared with the first embodiment. ..
以上説明したように本第1、第2の実施形態によれば、RAWデータを画質への影響が大きい輝度と、逆に画質への影響が小さい色差に分離することが出来る。特許文献1に記載のサブサンプリングのみを用いる手法と異なり、画質への影響が大きい成分と、影響が小さい成分に分離することが可能であるため、高圧縮率を達成するために色差の量子化をより大きくする、といったことが可能となる。そのため、RAWデータを高い圧縮率で符号化するときの画質劣化を抑えることで、圧縮効率を向上させることができる。
As described above, according to the first and second embodiments, the RAW data can be separated into a luminance having a large influence on the image quality and a color difference having a small influence on the image quality. Unlike the method using only subsampling described in
なお、上記実施形態では、符号化部109a乃至109dは並列して実行するものとして説明したが、1つの符号化部で複数のプレーンを順に符号化するようにしても構わない。
In the above embodiment, the
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
(Other Examples)
The present invention supplies a program that realizes one or more functions of the above-described embodiment to a system or device via a network or storage medium, and one or more processors in the computer of the system or device reads and executes the program. It can also be realized by the processing to be performed. It can also be realized by a circuit (for example, ASIC) that realizes one or more functions.
101…操作部、102…主制御部、103…符号化制御部、104…撮像部、105…信号処理部、106…色分離部、107…プレーン変換部、108…プレーン選択部、109…並列符号化部、110…符号化ストリーム生成部、111…一時記憶部、112…メモリI/O部、113…記憶媒体 101 ... operation unit, 102 ... main control unit, 103 ... coding control unit, 104 ... imaging unit, 105 ... signal processing unit, 106 ... color separation unit, 107 ... plane conversion unit, 108 ... plane selection unit, 109 ... parallel Coding unit, 110 ... Coded stream generation unit, 111 ... Temporary storage unit, 112 ... Memory I / O unit, 113 ... Storage medium
Claims (8)
ベイヤ配列の画像データから、R成分を示すRプレーン、B成分を示すBプレーン、G1成分を示すG1プレーン、G2成分を示すG2プレーンの4つの色プレーンに分離する分離手段と、
該分離手段で得られた4つの色プレーンから、輝度Yを示すYプレーン、及び、色差C1,C2,C3を示すC1プレーン、C2プレーン、C3プレーンで構成される輝度色差プレーンに変換する変換手段と、
前記輝度色差プレーンを符号化する符号化手段と
を有し、
前記変換手段は、次式に従って色プレーンを輝度色差プレーンに変換する
ことを特徴とする画像符号化装置。 An image coding device that encodes image data in a Bayer array.
A separation means for separating the image data of the Bayer array into four color planes: an R plane showing the R component, a B plane showing the B component, a G1 plane showing the G1 component, and a G2 plane showing the G2 component.
A conversion means for converting the four color planes obtained by the separation means into a Y plane indicating the luminance Y and a luminance color difference plane composed of the C1 plane, the C2 plane, and the C3 plane showing the luminance C1, C2, and C3. When,
Have a coding means for coding the luminance and chrominance planes,
The conversion means converts the color plane into a luminance color difference plane according to the following equation.
An image coding device characterized in that.
着目プレーンをウェーブレット変換して、複数のサブバンドを生成するウェーブレット変換手段と、
該ウェーブレット変換手段で得られたサブバンドそれぞれの係数データを、ライン単位に設定された量子化ステップを用いて量子化する量子化手段と、
該量子化手段で量子化された係数データをライン単位にエントロピー符号化するエントロピー符号化手段と、
該エントロピー符号化手段で生成された符号化データの符号量に基づき、次のラインのための量子化ステップを決定する符号化制御手段と
を有することを特徴とする請求項1に記載の画像符号化装置。 The coding means is
A wavelet transform means that generates multiple subbands by wavelet transforming the plane of interest,
A quantization means that quantizes the coefficient data of each subband obtained by the wavelet transform means using a quantization step set for each line, and a quantization means.
An entropy coding means that entropy encodes the coefficient data quantized by the quantization means in line units, and
The image code according to claim 1 , further comprising a coding control means for determining a quantization step for the next line based on the code amount of the coded data generated by the entropy coding means. Device.
着目サブバンドの目標とする符号量を、当該着目サブバンドに含まれるライン数で除算することで1ライン当たりの目標符号量Tを求め、
着目サブバンド内の量子化対象の着目ラインの直前のラインの符号化した際に得られた符号量をRとし、正の許容誤差をαとしたき、
R>T+αである場合には、前記直前のラインで用いた量子化ステップサイズに所定値を加算した値を前記着目ラインの量子化ステップサイズとして決定し、
R<T−αである場合には、前記直前のラインで用いた量子化ステップサイズから所定値を減算した値を前記着目ラインの量子化ステップサイズとして決定し、
T−α≦R≦T+αである場合には、前記直前のラインで用いた量子化ステップサイズを前記着目ラインの量子化ステップサイズとして決定する
ことを特徴とする請求項2に記載の画像符号化装置。 The coding control means is
The target code amount T per line is obtained by dividing the target code amount of the focus subband by the number of lines included in the focus subband.
Let R be the amount of code obtained when coding the line immediately before the line of interest in the quantization target in the subband of interest, and let α be the positive tolerance.
When R> T + α, a value obtained by adding a predetermined value to the quantization step size used in the immediately preceding line is determined as the quantization step size of the line of interest.
In the case of R <T-alpha determines the value obtained by subtracting a predetermined value from the quantization step size used in the immediately preceding line as the quantization step size of the intended line,
The image coding according to claim 2 , wherein when T−α ≦ R ≦ T + α, the quantization step size used in the immediately preceding line is determined as the quantization step size of the line of interest. apparatus.
前記輝度色差プレーンを符号化する場合の輝度プレーンの目標符号量は、他の3つの色差プレーンのいずれよりも大きい
ことを特徴とする請求項5に記載の画像符号化装置。 When the color plane is used as a coding target, the target code amount of each plane is the same.
The image coding apparatus according to claim 5 , wherein the target code amount of the luminance plane when encoding the luminance color difference plane is larger than that of any of the other three luminance planes.
分離手段が、ベイヤ配列の画像データから、R成分を示すRプレーン、B成分を示すBプレーン、G1成分を示すG1プレーン、G2成分を示すG2プレーンの4つの色プレーンに分離する分離工程と、
変換手段が、前記分離工程で得られた4つの色プレーンから、輝度Yを示すYプレーン、及び、色差C1,C2,C3を示すC1プレーン、C2プレーン、C3プレーンで構成される輝度色差プレーンに変換する変換工程と、
符号化手段が、前記輝度色差プレーンを符号化する符号化工程と
を有し、
前記変換工程では、次式に従って色プレーンを輝度色差プレーンに変換する
ことを特徴とする画像符号化装置の制御方法。 A control method for an image coding device that encodes image data in a Bayer array.
The separation step separates the image data of the Bayer array into four color planes: an R plane showing the R component, a B plane showing the B component, a G1 plane showing the G1 component, and a G2 plane showing the G2 component.
The conversion means changes from the four color planes obtained in the separation step to a luminance color difference plane composed of a Y plane showing the luminance Y and a C1 plane, a C2 plane, and a C3 plane showing the luminance C1, C2, and C3. The conversion process to convert and
Encoding means, it possesses an encoding step of encoding the luminance and chrominance planes,
In the conversion step, the color plane is converted into a luminance color difference plane according to the following equation.
A control method for an image coding device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016131034A JP6775339B2 (en) | 2016-06-30 | 2016-06-30 | Image coding device and its control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016131034A JP6775339B2 (en) | 2016-06-30 | 2016-06-30 | Image coding device and its control method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018006999A JP2018006999A (en) | 2018-01-11 |
JP6775339B2 true JP6775339B2 (en) | 2020-10-28 |
Family
ID=60948055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016131034A Active JP6775339B2 (en) | 2016-06-30 | 2016-06-30 | Image coding device and its control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6775339B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110971913B (en) * | 2019-11-04 | 2021-09-24 | 电子科技大学 | Bayer image compression method based on filling Y channel |
KR20230004678A (en) | 2020-04-16 | 2023-01-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | Coding concept for color filter array (CFA) pattern images |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4436733B2 (en) * | 2004-08-27 | 2010-03-24 | オリンパス株式会社 | Imaging apparatus and reproducing apparatus |
US7480417B2 (en) * | 2004-10-19 | 2009-01-20 | Microsoft Corp. | System and method for encoding mosaiced image data employing a reversible color transform |
JP6077811B2 (en) * | 2012-10-04 | 2017-02-08 | キヤノン株式会社 | Image coding apparatus, image coding method, and program |
JP2016082395A (en) * | 2014-10-16 | 2016-05-16 | キヤノン株式会社 | Encoder, coding method and program |
JP2016092589A (en) * | 2014-11-04 | 2016-05-23 | キヤノン株式会社 | Encoder and control method therefor |
-
2016
- 2016-06-30 JP JP2016131034A patent/JP6775339B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018006999A (en) | 2018-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3085465B2 (en) | Image data encoding apparatus and encoding method | |
US7359549B2 (en) | Imaging device, image processing method, and recording medium | |
US20170118491A1 (en) | Coding method and decoding processing method | |
US20050213812A1 (en) | Image compressing method and image compression apparatus | |
JP6986868B2 (en) | Image coding device, image decoding device, image coding method, image decoding method, program | |
US10032252B2 (en) | Image processing apparatus, image capturing apparatus, image processing method, and non-transitory computer readable storage medium | |
US20210203949A1 (en) | Image encoding apparatus and image decoding apparatus, methods of controlling the same, and non-transitory computer-readable storage medium | |
US20170118477A1 (en) | Image encoding apparatus and method of controlling the same | |
JP2017216630A (en) | Image encoding device and its control method | |
JP6775339B2 (en) | Image coding device and its control method | |
US20190387228A1 (en) | Image encoding apparatus, image decoding apparatus, control methods thereof, and non-transitory computer-readable storage medium | |
US12069306B2 (en) | Image encoding apparatus and method for controlling the same and non-transitory computer-readable storage medium | |
TWI390959B (en) | Video signal processing device, video signal processing method and video signal processing program | |
JP2001359117A (en) | Image processing unit and image processing method or the unit | |
JP4375662B2 (en) | Image processing apparatus, image processing method, program, information recording medium, and imaging apparatus | |
JP2002252759A (en) | Image quantization method and device, and image coder utilizing them | |
JP7016660B2 (en) | Coding device, its control method, and control program, and image pickup device. | |
JP7465073B2 (en) | Image encoding device, control method and program thereof | |
US11785352B2 (en) | Image encoding apparatus, method for controlling the same, and non-transitory computer-readable storage medium | |
JP6875817B2 (en) | Image processing equipment, imaging equipment, image processing methods and programs | |
JP6907004B2 (en) | Image processing equipment, image processing methods, and programs | |
JP2001231009A (en) | Image data storage device ad method | |
JP2008124530A (en) | Raw data compressing method | |
JP2023070055A (en) | Image encoding device, control method thereof, and program | |
JP2020123864A (en) | Image encoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200710 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200907 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201006 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6775339 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |