[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2005142986A - 動画像符号化方法、動画像符号化装置および動画像符号化プログラム - Google Patents

動画像符号化方法、動画像符号化装置および動画像符号化プログラム Download PDF

Info

Publication number
JP2005142986A
JP2005142986A JP2003379448A JP2003379448A JP2005142986A JP 2005142986 A JP2005142986 A JP 2005142986A JP 2003379448 A JP2003379448 A JP 2003379448A JP 2003379448 A JP2003379448 A JP 2003379448A JP 2005142986 A JP2005142986 A JP 2005142986A
Authority
JP
Japan
Prior art keywords
evaluation value
prediction mode
prediction
frame prediction
inter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003379448A
Other languages
English (en)
Inventor
Makoto Hagai
誠 羽飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003379448A priority Critical patent/JP2005142986A/ja
Publication of JP2005142986A publication Critical patent/JP2005142986A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 動画像符号化のフレーム間予測に使用される動き検出処理は多数の動きベクトル候補から動きベクトルを検出しなければならないため、動き検出に膨大な処理量が必要であった。
【解決手段】フレーム間予測評価値InterCostを計算する動き検出部MEと、フレーム内予測評価値計算部IntraCostCalcと、フレーム間予測とフレーム内予測の何れかを予測モードとして選択するモード判定部ModeSelと、符号化信号BitStrmとして出力する可変長符号化部VLCとを備えた画像符号化装置において、InterCostの計算終了前にフレーム間予測評価値推定値を計算するフレーム間予測評価値推定部と、フレーム内予測評価値とフレーム間予測評価値推定値とが所定の条件を満たす場合には、フレーム内予測を予測モードとして選択し、動き検出部MEのフレーム間予測評価値の計算の終了を指示するフレーム内予測判定部IntraDetとを有す。
【選択図】 図1

Description

本発明は動画像符号化に用いられるフレーム間予測処理の高速化方法、並びにそれをソフトウェアで実施するためのプログラムに係るものである。
近年、マルチメディアアプリケーションの発展に伴い、画像・音声・テキストなど、あらゆるメディアの情報を統一的に扱うことが一般的になってきた。この時、全てのメディアをディジタル化することにより統一的にメディアを扱うことが可能になる。しかしながら、ディジタル化された画像は膨大なデータ量を持つため、蓄積・伝送のためには、画像の情報圧縮技術が不可欠である。一方で、圧縮した画像データを相互運用するためには、圧縮技術の標準化も重要である。画像圧縮技術の標準規格としては、ITU(国際電気通信連合 電気通信標準化部門)のH.261、H.263、ISO(国際標準化機構)のMPEG(Moving Picture Experts Group)−1、MPEG−2、MPEG−4などがある。
これらの動画像符号化方式に共通の技術として動き補償を伴うフレーム間予測がある。フレーム間予測はフレーム間の相関を利用した予測方法で、符号化済み画像の画素値から入力画素の予測をする方法である。このとき、画面内の物体の動きに対応するため、参照する符号化済み画像(以降、参照画像と呼ぶ)のどの位置の画素を予測画素としたかを示す動きベクトル情報を符号化信号に付加しておく。動きベクトルは、MPEG等では入力画像を所定サイズに分割した矩形領域(以降、ブロックと呼ぶ)毎に付加される。
ところが、新たな物体がフレームインする場合や、物体が移動した際に後ろに隠れていた背景が現れる場合など、参照画像中に対応する部分が存在しない場合がある。このような場合には、フレーム間予測よりもフレーム内予測の予測効率が高い場合がある。
これに対応するため、MPEG等ではブロック毎にフレーム間予測とフレーム内予測が切り替え可能になっている。選択した予測モードを示す信号(予測モード情報)が符号化信号中に格納されるので、画像復号装置はこの情報から画像符号化装置と同じ予測モードを選択することができる。画像符号化装置では各モードでの予測誤差を計算・比較し、予測モードを選択する。動きベクトルMVに対するフレーム間予測の評価値としては、例えば、式1で示した2乗誤差が使用される場合や式2で示した絶対値誤差が使用される。
Figure 2005142986
Figure 2005142986
一方、フレーム内予測の評価値としては、例えば、式3で示した分散値や式4で示した値が使用される。
Figure 2005142986
Figure 2005142986
これらの評価値は予測誤差を表すため、値が小さい程、予測は正確になり符号化効率が高くなる。従って、例えば、式5で示すようにフレーム間予測とフレーム内予測の評価値を比較し、評価値がより小さいモードを選択すれば、より符号化効率が高くなる。
Figure 2005142986
なお、式1〜4は評価値の一例であり、他の計算式で定義される評価値を用いてもよい。
なお、式5はモード判定式の一例であり、フレーム間予測評価値とフレーム内予測評価値を変数とし、符号化効率が高い予測モードを選択するのに適した他の判定式を用いてもよい。
図10は従来の画像符号化装置である。図10の従来の画像符号化装置は、画像信号Imgをブロックに分割し、そのブロック毎に処理を行う。減算器Subは、画像符号化装置に入力した画像信号Imgから予測画像信号Predを減算し、残差信号Resとして出力する。残差符号化部ResEncは、残差信号Resを入力し、DCT変換・量子化などの符号化処理を行い、量子化済DCT係数などを含む残差符号化信号EResを出力する。残差復号部ResDecは、残差符号化信号EResを入力し、逆量子化・逆DCT変換などの画像復号処理を行い、残差復号信号DResを出力する。加算器Addは、残差復号信号DResと予測画像信号Predを加算し、復号画像信号DecImgとして出力する。復号画像信号DecImgで、以降のフレーム間予測で参照される可能性がある信号は、フレームメモリFMに格納される。画素予測部PredictorはフレームメモリFMに蓄積された符号化済画像を参照画像信号Refとして入力し予測画像信号Predを出力する。画素予測部Predictorは、画素予測を行い、予測モードを示す予測モード情報Modeとフレーム間予測時の動きベクトルMVを出力する。可変長符号化部VLCは、残差信号Resと予測モード情報Modeと動きベクトルMVを可変長符号化し、符号化信号BitStrmとして出力する。
次に画素予測部Predictorの詳細説明を行う。図11は画素予測部Predictorのブロック図である。動き検出部MEは参照画像信号Refと画像信号Imgから動きベクトルMVを検出・出力し、動きベクトルMVでフレーム間予測を行った場合の評価値であるフレーム間予測評価値InterCostも出力する。フレーム内予測評価値計算部IntraCostCalcは、画像信号Imgを入力しフレーム内予測を行った場合の評価値であるフレーム内予測評価値IntraCostを出力する。モード判定部ModeSelは、フレーム間予測評価値InterCostとフレーム内予測評価値IntraCostを入力比較し、予測モードを選択し、選択した予測モードを予測モード情報Modeとして出力する。動き補償部MCは、動きベクトルMVを使用してフレーム間予測を行い、予測結果をフレーム間予測画像信号MCPredとして出力する。フレーム内予測部IntraPredictorは、フレーム内予測を行い、予測結果をフレーム内予測画像信号IPredとして出力する。予測モード情報Modeがフレーム間予測を示す場合にはスイッチSW1は”1”側に切り替わり、フレーム間予測画像信号MCPredを予測画像信号Predとして出力し、予測モード情報Modeがフレーム内予測を示す場合にはスイッチSW1は”0”側に切り替わり、フレーム内予測画像信号IPredを予測画像信号Predとして出力する。
フレーム間予測では多数の動きベクトル候補から1つの動きベクトルを選択することになる。そのため、動き検出部MEは複数の動きベクトル候補から評価値が最小となる1つの動きベクトルを選択する。各動きベクトル候補に対し、例えば、式1、式2で示した評価値を計算し、評価値を最小とする動きベクトル候補を選択することで動きベクトルを検出する。選択した動きベクトルに対応した評価値がフレーム間予測評価値InterCostとなる。
図12は画素予測部Predictorの処理フローを示した図である。S11では動き検出部MEにより動きベクトル検出を行い、動きベクトルMVとフレーム間予測評価値InterCostを得る。S12ではフレーム内予測評価値計算部IntraCostCalcによりフレーム内予測評価値IntraCostを計算する。S13ではモード判定部ModeSelにより、フレーム間予測評価値InterCostとフレーム内予測評価値IntraCostの比較を行い、予測モードを判定する。
図13は、図11の従来の画像符号化装置に対応する画像復号装置の構成を示したブロック図である。可変長復号部VLDは、符号化信号BitStrmを入力し可変長復号を行い、残差符号化信号EResと動きベクトルMVと予測モード情報Modeを出力する。残差復号部ResDecは、残差符号化信号EResを入力し、逆量子化・逆DCT変換などの復号処理を行い、残差復号信号DResを出力する。動き補償部MCは、フレームメモリFMから復号済み画像を参照画像信号Refとして入力し、動きベクトルMVを使用して動き補償を伴うフレーム間予測した結果をフレーム間予測画像信号MCPredとして出力する。フレーム内予測部IntraPredictorはフレーム内予測画像信号IPredを出力する。予測モード情報Modeがフレーム内予測を示す場合には、スイッチSW1は“0”側に切り替わりフレーム内予測画像信号IPredを予測画像信号Predとして出力する。予測モード情報Modeがフレーム間予測を示す場合には、スイッチSW1は“1”側に切り替わりフレーム間予測画像信号MCPredを予測画像信号Predとして出力する。加算器Addは、残差復号信号DResと予測画像信号Predを加算し、復号画像信号DecImgとして画像復号装置外に出力する。フレームメモリFMは、フレーム間予測のために復号画像信号DecImgを格納する。以上、説明した処理により画像復号装置は符号化信号BitStrmを復号し復号画像信号DecImgとして出力する。
ところで、フレーム間予測では、各動きベクトル候補に対し式1、式2で示したような評価値を計算しなければならないため、動きベクトル候補が多数あると計算時間が膨大になる。例えば、動きベクトルの各成分が−16〜16の範囲内の全画素位置を動きベクトル候補とすると、候補数は33×33=1089個となる。処理能力が低い演算器でリアルタイムの符号化処理を行う場合には全候補の評価を行うのは処理量の観点から不可能な場合がある。そのため、これまでも、評価を行う動きベクトル候補数を減らすことで、動き検出の処理量を減らす方法が検討されてきた。その場合、全候補を評価するわけではないので評価値を最小とする動きベクトルを選択できるとは限らず、予測誤差は大きくなり符号化効率が落ちる。そのため、評価する動きベクトルの数を減らしても符号化効率が殆ど劣化しない動き検出方法が望ましい。その方法の1つとして局所探索による動き検出がある。以下、局所探索による動き検出について説明する。
局所探索は、予測誤差が真の動きベクトル(予測誤差が最小となる動きベクトル)を中心に、距離に応じて予測誤差が大きくなる傾向を利用し、予測誤差が小さくなる方向に順に動きベクトル候補を評価していく方法である。ここで局所探索の一例を示す。図14は局所探索の概念図である。局所探索ではまず探索開始点(探索中心の初期値)を選択し評価する。ここでは番号0(動きベクトルPMVが指す点)の点を探索開始点とする。次に探索中心の周辺の画素位置を指す動きベクトルを評価する。図では探索中心の4近傍を評価する場合を示す。探索中心とその4近傍の点の中で、探索中心以外の点での評価値が最小となる場合にはその点に探索中心を移動する。探索中心の評価値が最小であれば、その時点で動きベクトル検出を終了し、探索中心を指す動きベクトル候補を動きベクトルMVとする。図の例では、0,2,5,9の順で探索中心が移動している。局所探索において評価すべき動きベクトル候補数を減らすためには、できるだけ真の動きベクトルに近い探索開始点を選択することが重要である。そのような探索開始点の一例として、予測ベクトル(周辺ブロックの動きベクトルから予測した動きベクトル)等が使用される。また、探索開始点を選択する際に、予測ベクトルやゼロベクトル等の複数の候補を評価して、その中で評価値を最小とする点を探索開始点とする方法もある。
図15は局所探索を行う画素予測部Predictorを示したブロック図である。図11と同じ動作をするユニットおよび同じ動作の信号は同じ記号を付し、説明を省略する。探索開始点選択部ME1は、探索開始点を選択し、選択した探索開始点を指す動きベクトルを初期動きベクトルMV1として出力する。局所探索部ME2は、初期動きベクトルMV1を入力し、局所探索を行い、動きベクトルMVと動きベクトルMVに対する評価値をフレーム間予測評価値InterCostとして出力する。図16は図15の画素予測部Predictorの処理フローを示した図である。図12と同じ処理ステップは同じ記号を付し、説明を省略する。S14で探索開始点選択部ME1により探索開始点を選択する。S15では局所探索部ME2により局所探索を行う。
また、複数の予測モードを切り替える画像符号化装置において、モード判定を高速化する方法についての従来技術が知られている(例えば、特許文献1参照。)。この従来技術では、第1符号化モードの符号化効率の推定値と設定値とを比較し、比較結果が第1符号化モードで十分符号量を小さくできることが保証される条件を満たす時には、第1符号化モードを選択し第2符号化モードの符号化効率の推定を行わないことで処理量を削減する方法を示している。
特開平8−186722(実施例7)
従来の画像符号化装置のフレーム間予測処理の処理量軽減では、動きベクトル検出処理のみに注目して高速化していたが、本発明では、フレーム内予測の評価値を使用して動きベクトル検出を打ち切ることで、フレーム間予測の処理量を軽減する方法を提供する。
前記従来の課題を解決するために、本発明では、フレーム間予測評価値を計算する動き検出手段と、フレーム内予測評価値を計算するフレーム内予測評価値計算手段と、フレーム間予測評価値とフレーム内予測評価値からフレーム間予測とフレーム内予測の何れかを予測モードとして選択するモード判定手段と、モード判定手段が選択した予測モードを示す予測モード情報を多重化し符号化信号として出力する可変長符号化手段とを備えたことを特徴とする画像符号化装置において、フレーム間予測評価値の計算終了前にフレーム間予測評価値の推定値を計算するフレーム間予測評価値推定手段と、フレーム内予測評価値とフレーム間予測評価値の推定値とが所定の条件を満たす場合には、フレーム内予測を予測モードとして選択し、動き検出手段のフレーム間予測評価値の計算の終了を指示するフレーム内予測判定手段とを有す。
本構成によって、最終的にブロックがフレーム内予測とモード判定される可能性が高い場合には、その時点で動き検出処理を打ち切ることができ、従来の画像符号化装置から符号化効率を殆ど劣化させずに動き検出の処理量を削減できる。
本発明の画像符号化装置によれば、フレーム間予測の処理量を軽減でき、結果として画像符号化装置の処理量を軽減できる。
以下本発明の実施の形態について、図面を参照しながら説明する。本発明のポイントはフレーム間予測の評価値を推定し使用することで、最終的にブロックがフレーム内予測とモード判定される可能性が高い場合には、その時点で動き検出処理を打ち切ることである。これにより従来の画像符号化装置から符号化効率を殆ど劣化させずに動き検出の処理量を削減できる。本発明は、フレーム内予測と判定されるブロックが多数ある場合に特に効果が高くなる。例えば、カメラを大きく動かした場合や大きな物体がフレームインする場合では、フレーム間相関が低くなり、フレーム内予測となるブロックが多くなる。このような場合に本発明の効果が高くなる。
(実施の形態1)
本発明の画像符号化装置は図10で示す従来の画像符号化装置に対して、画素予測部Predictorのみ異なる。そこで、ここでは画素予測部Predictorについて説明し、その他の部分は従来の画像符号化装置と同じとし、説明を省略する。
図1は実施の形態1の画素予測部Predictorを示したブロック図である。図11と同じ動作をするユニットおよび同じ動作の信号は同じ記号を付し、説明を省略する。図11の従来の画像符号化装置の画素予測部Predictorとの相違点は、フレーム間予測評価値推定部InterCostEstとフレーム内予測判定部IntraDetとスイッチSW2が追加されていることである。フレーム間予測評価値推定部InterCostEstはフレーム間予測評価値を推定し、フレーム間予測評価値推定値EInterCostを出力する。フレーム内予測判定部IntraDetは、フレーム内予測評価値IntraCostとフレーム間予測評価値推定値EInterCostを入力し、所定の条件を満たす場合には動き検出を行わないように動き検出部MEに指示し、スイッチSW2を“0”に切り替える。所定の条件を満たさない場合には、スイッチSW2を“1”に切り替え、従来の画像符号化装置と同じ処理を行う。
図2は図1の画素予測部Predictorの処理フローを示した図である。図12と同じ処理ステップは同じ記号を付し、説明を省略する。本発明ではS12のフレーム内予測評価値計算とS16のフレーム間予測評価値推定をS11の動きベクトル探索前に行い、S17のフレーム内予測判定で所定の条件を満たす場合には、そこで予測モードをフレーム内予測と判定し終了する。ここでは、S12、S16の順で処理を行っているが、この順番は逆でもよい。
フレーム内予想判定で使用する条件には、例えば、式6で示す条件が考えられる。
Figure 2005142986
ここでフレーム間予測評価値推定値Eは、フレーム間予測評価値の推定値である。式6は、モード判定部ModeSelで使用される判定式(式5)でフレーム内予測と判定される条件式のフレーム間予測評価値を推定値Eで置き換えたものに相当する。従って、当該ブロックのフレーム間予測評価値に近い値を推定値Eとして選択できれば、選択される予測モードは従来の画像符号化装置と殆ど同じ結果となるはずである。フレーム間予測評価値推定値Eの計算処理量が、動き検出部MEによるフレーム間予測評価値の計算処理量より小さければ、画素予測部Predictorの処理量は減少することになる。このような、フレーム間予測評価値の推定値Eの例として、直前のブロックのフレーム間予測評価値等、過去に符号化したブロックの符号化で得られた値を使用することが考えられる。
以上のように本実施の形態によれば、従来の画像符号化装置から符号化効率を殆ど劣化させずに動き検出の処理量を削減できる。
背景技術で示した特許文献1の方法ではフレーム内予測評価値を予め設定された値と比較するのに対して、本発明では過去に符号化したブロックの情報等からフレーム間予測評価値を推定し使用するため、より高い精度でフレーム内予測を予め判定できる。
なお、式6はフレーム内予測判定式の一例であり、フレーム間予測評価値推定値とフレーム内予測評価値を変数とした他の判定式を用いてもよい。
なお、本実施の形態は、2種類の予測モードのみの場合を説明したが、3種類以上の予測モードの場合にも、1種類以上の予測モードに対し評価値を推定し、各予測モードの評価値もしくは評価値の推定値を比較することで、本実施の形態と同様の処理を行うことができる。
なお、本実施の形態では、予測モードとしてフレーム間予測とフレーム内予測を例に説明したが、他の予測方法を使用してもよい。
(実施の形態2)
実施の形態1の式6で説明したフレーム間予測の推定値について、動き検出の処理の一部を行い、その結果からフレーム間予測評価値の推定することで、よりフレーム間予測評価値の推定精度を上げる方法も考えられる。以下、説明する。
本発明の画像符号化装置は図10で示す従来の画像符号化装置に対して、画素予測部Predictorのみ異なる。そこで、ここでは画素予測部Predictorについて説明し、その他の部分は従来の画像符号化装置と同じとし、説明を省略する。
図3は実施の形態2の画素予測部Predictorを示したブロック図である。図1、図15と同じ動作をするユニットおよび同じ動作の信号は同じ記号を付し、説明を省略する。フレーム内予測判定部IntraDetは、初期動きベクトルMV1によるフレーム間予測評価値InterCost1とフレーム内予測評価値IntraCostを入力し、所定の条件を満たす場合には動き検出を行わないように動き検出部MEに指示し、スイッチSW2を“0”に切り替える。所定の条件を満たさない場合には、スイッチSW2を“1”に切り替え、従来の画像符号化装置と同じ処理を行う。初期動きベクトルMV1によるフレーム間予測評価値InterCost1は、実施の形態1におけるフレーム間予測評価値推定値EInterCostに相当する。
図4は図3の画素予測部Predictorの処理フローを示した図である。図16と同じ処理ステップは同じ記号を付し、説明を省略する。S12のフレーム内予測評価値計算とS16のフレーム間予測評価値推定をS15での局所探索の前に行い、S17のフレーム内予測判定で所定の条件を満たす場合には、そこで予測モードをフレーム内予測と判定し終了する。ここでは、S14、S12、S16の順で処理を行っているが、これらの処理の順序は変えても構わない。
本発明の所定の条件は、実施の形態1と同様に式6で判定できる。最終的にフレーム内予測と判定される場合には、探索開始点の位置に関わらず常に式6はフレーム内予測となるはずである。従って、問題は、最終的にフレーム間予測と判定されるのに関わらず、式6でフレーム内予測と判定される場合である。ただし、最終的にフレーム間予測と判定される場合には、初期動きベクトル時点でフレーム間予測評価値interCost1はフレーム内予測評価値IntraCostに対して十分に小さな値をとることが期待できる。そのため、前記のような問題は殆ど発生せず、従って、従来の画像符号化装置に対する符号化効率劣化は殆どない。
以上のように本実施の形態によれば、従来の画像符号化装置から符号化効率を殆ど劣化させずに動き検出の処理量を削減できる。
なお、式6はフレーム内予測判定式の一例であり、フレーム間予測評価値推定値とフレーム内予測評価値を変数とした他の判定式を用いてもよい。
なお、実施の形態1の判定と実施の形態2の判定を組み合わせてもよい。例えば、両方の判定式がフレーム内予測を示す場合のみフレーム内予測としてもよい。
なお、本実施の形態は、2種類の予測モードのみの場合を説明したが、3種類以上の予測モードの場合にも、1種類以上の予測モードに対し評価値を推定し、各予測モードの評価値もしくは評価値の推定値を比較することで、本実施の形態と同様の処理を行うことができる。
なお、本実施の形態では、予測モードとしてフレーム間予測とフレーム内予測を例に説明したが、他の予測方法を使用してもよい。
(実施の形態3)
さらに、上記各実施の形態で示した画像符号化方法の構成を実現するためのプログラムを、フレキシブルディスク等の記憶媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図5は実施の形態1、2の画像符号化方法をコンピュータシステムにより実現するためのプログラムを格納するための記憶媒体についての説明図である。
図5(b)は、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図5(a)は、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムとしての画像符号化方法が記録されている。
また、図5(c)は、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムとしての画像符号化方法をフレキシブルディスクドライブFDDを介して書き込む。また、フレキシブルディスク内のプログラムにより上記画像符号化方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
(実施の形態4)
本発明の実施の形態4として、上記で説明した動画像符号化方法、動画像符号化装置および動画像符号化プログラムの応用例とそれを用いたシステムを図6〜図9を用いて説明する。
図6は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex107〜ex110が設置されている。
このコンテンツ供給システムex100は、例えば、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex107〜ex110を介して、コンピュータex111、PDA(personal digital assistant)ex112、カメラex113、携帯電話ex114、カメラ付きの携帯電話ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図6のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex107〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器である。また、携帯電話は、PDC(Personal Digital Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband-Code Division Multiple Access)方式、若しくはGSM(Global System for Mobile Communications)方式の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
また、ストリーミングサーバex103は、カメラex113から基地局ex109、電話網ex104を通じて接続されており、カメラex113を用いてユーザが送信する符号化処理されたデータに基づいたライブ配信等が可能になる。撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラex116で撮影した動画データはコンピュータex111を介してストリーミングサーバex103に送信されてもよい。カメラex116はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラex116で行ってもコンピュータex111で行ってもどちらでもよい。また、符号化処理はコンピュータex111やカメラex116が有するLSIex117において処理することになる。なお、画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な記録媒体である何らかの蓄積メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込んでもよい。さらに、カメラ付きの携帯電話ex115で動画データを送信してもよい。このときの動画データは携帯電話ex115が有するLSIで符号化処理されたデータである。
このコンテンツ供給システムex100では、ユーザがカメラex113、カメラex116等で撮影しているコンテンツ(例えば、音楽ライブを撮影した映像等)を符号化処理してストリーミングサーバex103に送信する一方で、ストリーミングサーバex103は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等がある。このようにすることでコンテンツ供給システムex100は、符号化されたデータをクライアントにおいて受信して再生することができ、さらにクライアントにおいてリアルタイムで受信して復号化し、再生することにより、個人放送をも実現可能になるシステムである。
コンテンツの符号化処理あるいは復号化処理に際して、上記実施形態で説明した動画像符号化方法、動画像符号化装置および動画像符号化プログラムを用いてもよい。例えば、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等は、上記実施形態で示した動画像符号化装置を備え、動画像符号化方法、動画像符号化プログラムを実現できるものであってよい。
一例として携帯電話について説明する。
図7は、上記実施形態の動画像符号化方法、動画像符号化装置および動画像符号化プログラムを用いた携帯電話ex115を示す図である。携帯電話ex115は、基地局ex110との間で電波を送受信するためのアンテナex201、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex203、カメラ部ex203で撮影した映像、アンテナex201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex202、操作キーex204群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex208、音声入力をするためのマイク等の音声入力部ex205、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号化されたデータを保存するための記録メディアex207、携帯電話ex115に記録メディアex207を装着可能とするためのスロット部ex206を有している。記録メディアex207はSDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリであるEEPROM(Electrically Erasable and Programmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである。
さらに、携帯電話ex115について図8を用いて説明する。携帯電話ex115は表示部ex202および操作キーex204を備えた本体部の各部を統括的に制御するようになされた主制御部ex311に対して、電源回路部ex310、操作入力制御部ex304、画像符号化部ex312、カメラインターフェース部ex303、LCD(Liquid Crystal Display)制御部ex302、画像復号化部ex309、多重分離部ex308、記録再生部ex307、変復調回路部ex306および音声処理部ex305が同期バスex313を介して互いに接続されている。
電源回路部ex310は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話ex115を動作可能な状態に起動する。
携帯電話ex115は、CPU、ROMおよびRAM等でなる主制御部ex311の制御に基づいて、音声通話モード時に音声入力部ex205で集音した音声信号を音声処理部ex305によってディジタル音声データに変換し、これを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理および周波数変換処理を施した後にアンテナex201を介して送信する。また携帯電話ex115は、音声通話モード時にアンテナex201で受信した受信信号を増幅して周波数変換処理およびアナログディジタル変換処理を施し、変復調回路部ex306でスペクトラム逆拡散処理し、音声処理部ex305によってアナログ音声信号に変換した後、これを音声出力部ex208を介して出力する。
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex204の操作によって入力された電子メールのテキストデータは操作入力制御部ex304を介して主制御部ex311に送出される。主制御部ex311は、テキストデータを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理および周波数変換処理を施した後にアンテナex201を介して基地局ex110へ送信する。
データ通信モード時に画像データを送信する場合、カメラ部ex203で撮像された画像データをカメラインターフェース部ex303を介して画像符号化部ex312に供給する。また、画像データを送信しない場合には、カメラ部ex203で撮像した画像データをカメラインターフェース部ex303およびLCD制御部ex302を介して表示部ex202に直接表示することも可能である。
画像符号化部ex312は、カメラ部ex203から供給された画像データを圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex308に送出する。また、このとき同時に携帯電話ex115は、カメラ部ex203で撮像中に音声入力部ex205で集音した音声を音声処理部ex305を介してディジタルの音声データとして多重分離部ex308に送出する。
多重分離部ex308は、画像符号化部ex312から供給された符号化画像データと音声処理部ex305から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理および周波数変換処理を施した後にアンテナex201を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex201を介して基地局ex110から受信した受信信号を変復調回路部ex306でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex308に送出する。
また、アンテナex201を介して受信された多重化データを復号化するには、多重分離部ex308は、多重化データを分離することにより画像データの符号化ビットストリームと音声データの符号化ビットストリームとに分け、同期バスex313を介して当該符号化画像データを画像復号化部ex309に供給すると共に当該音声データを音声処理部ex305に供給する。
次に、画像復号化部ex309は、画像データの符号化ビットストリームを復号することにより再生動画像データを生成し、これをLCD制御部ex302を介して表示部ex202に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex305は、音声データをアナログ音声信号に変換した後、これを音声出力部ex208に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。
以上の構成において、画像符号化部ex312は、上記実施形態の動画像符号化装置を備えている。
なお、上記システムの例に限られず、最近は衛星、地上波によるディジタル放送が話題となっており、図9に示すようにディジタル放送用システムにも上記実施形態で説明した動画像符号化方法、動画像符号化装置および動画像符号化プログラムを組み込むことができる。具体的には、放送局ex409では映像情報の符号化ビットストリームが電波を介して通信または放送衛星ex410に伝送される。これを受けた放送衛星ex410は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナex406で受信し、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置により符号化ビットストリームを復号化してこれを再生する。ここで、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置が上記実施形態で説明した動画像符号化装置を備えていてもよい。また、上記実施形態の動画像符号化方法を用いるものであってもよい。さらに、動画像符号化プログラムを備えていてもよい。また、記録媒体であるCDやDVD等の蓄積メディアex402に記録した符号化ビットストリームを読み取り、復号化する再生装置ex403にも上記実施形態で説明した動画像符号化方法、動画像符号化装置および動画像符号化プログラムを実装することが可能である。この場合、再生された映像信号はモニタex404に表示される。また、ケーブルテレビ用のケーブルex405または衛星/地上波放送のアンテナex406に接続されたセットトップボックスex407内に上記実施形態で説明した動画像符号化方法、動画像符号化装置および動画像符号化プログラムを実装し、これをテレビのモニタex408で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に上記実施形態で説明した動画像符号化装置を組み込んでも良い。また、アンテナex411を有する車ex412で衛星ex410からまたは基地局ex107等から信号を受信し、車ex412が有するカーナビゲーションex413等の表示装置に動画を再生することも可能である。
更に、画像信号を符号化し、記録媒体に記録することもできる。具体例としては、DVDディスクex421に画像信号を記録するDVDレコーダや、ハードディスクに記録するディスクレコーダなどのレコーダex420がある。更にSDカードex422に記録することもできる。レコーダex420が上記実施形態の復号化装置を備えていれば、DVDディスクex421やSDカードex422に記録した画像信号を補間して再生し、モニタex408に表示することができる。
なお、カーナビゲーションex413の構成は例えば図8に示す構成のうち、カメラ部ex203とカメラインターフェース部ex303、画像符号化部ex312を除いた構成が考えられ、同様なことがコンピュータex111やテレビ(受信機)ex401等でも考えられる。
また、上記携帯電話ex114等の端末は、符号化器・復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の3通りの実装形式が考えられる。
このように、上記実施形態で説明した動画像符号化方法、動画像符号化装置および動画像符号化プログラムを上述したいずれの機器・システムに用いることは可能であり、上記実施形態で説明した効果を得ることができる。
本発明にかかる装置は、フレーム間予測の処理量を軽減でき、結果として画像符号化装置の処理量を軽減できる効果を有し、例えば、動画像符号化装置等に有用である。
実施の形態1の画素予測部のブロック図 実施の形態1の画素予測部の処理フロー 実施の形態2の画素予測部のブロック図 実施の形態2の画素予測部の処理フロー 実施の形態1〜実施の形態2の画像符号化方法をコンピュータシステムにより実現するためのプログラムを格納するための記憶媒体についての説明図 コンテンツ供給システムの全体構成について説明するブロック図 本発明の動画像符号化装置を搭載する携帯電話の例 携帯電話の構成について説明するブロック図 ディジタル放送用システムの例 従来の画像符号化装置のブロック図 従来の画素予測部のブロック図 従来の画素予測部の処理フロー 画像復号装置のブロック図 局所探索の概念図 局所探索を行う従来の画像符号化装置内の画素予測部のブロック図 局所探索を行う従来の画素予測部の処理フロー
符号の説明
Img 画像信号
BitStrm 符号化信号
Res 残差信号
ERes 残差符号化信号
DRes 残差復号信号
DecImg 復号画像信号
Ref 参照画像信号
Pred 予測画像信号
MV 動きベクトル
Mode 予測モード情報
InterCost フレーム間予測評価値
IntraCost フレーム内予測評価値
MCPred フレーム間予測画像信号
IPred フレーム内予測画像信号
MV1 初期動きベクトル
InterCost1 初期動きベクトルのフレーム間予測評価値
EInterCost フレーム間予測評価値推定値
Sub 減算器
Add 加算器
ResEnc 残差符号化部
ResDec 残差復号部
FM フレームメモリ
Predictor 画素予測部
VLC 可変長符号化部
SW1,SW2 スイッチ
ME 動き検出部
IntraCostCalc フレーム内予測評価値計算部
ModeSel モード判定部
MC 動き補償部
IntraPredictor フレーム内予測部
VLD 可変長復号部
ME1 探索開始点選択部
ME2 局所探索部
IntraDet フレーム内予測判定部
InterCostEst フレーム間予測評価値推定部
Cs コンピュータ・システム
FD フレキシブルディスク
FDD フレキシブルディスクドライブ

Claims (6)

  1. 2種類以上の予測モードから1つの予測モードを選択し、選択された前記1つの予測モードを示す種別情報を符号化する動画像符号化方法において、
    前記2種類以上の予測モードのうち1種類以上を第1予測モードとし、前記第1予測モード以外を第2予測モードとすると、前記第1予測モードの評価値計算終了前に前記第1予測モードの評価値の推定値と前記第2予測モードの評価値とを計算し、前記第1予測モードの評価値の推定値と前記第2予測モードの評価値とが所定の条件を満たす場合には、前記第1予測モードの評価値計算を終了し、前記第2予測モードを前記1つの予測モードとして選択することを特徴とした動画像符号化方法。
  2. 請求項1の動画像符号化方法において、前記第1予測モードの評価値計算開始前に、前記第1予測モードの評価値の推定値と前記第2予測モードの評価値とを計算し、前記第1予測モードの評価値の推定値と前記第2予測モードの評価値とが所定の条件を満たす場合には、前記第1予測モードの評価値計算を終了し、前記第2予測モードを前記1つの予測モードとして選択することを特徴とした動画像符号化方法。
  3. 請求項1の動画像符号化方法において、前記第1予測モードの評価値計算を途中で中断し、計算途中結果から前記第1予測モードの評価値を推定し、前記第1予測モードの評価値の推定値と前記第2予測モードの評価値が所定の条件を満たす場合には、前記第1予測モードの評価値計算を終了し、前記第2予測モードを前記1つの予測モードとして選択することを特徴とした動画像符号化方法。
  4. 請求項1〜3の動画像符号化方法において、フレーム間予測を示す予測モードを前記第1予測モードとし、フレーム内予測を示す予測モードを前記第2予測モードとすることを特徴とした動画像符号化方法。
  5. フレーム間予測評価値を計算する動き検出手段と、フレーム内予測評価値を計算するフレーム内予測評価値計算手段と、前記フレーム間予測評価値と前記フレーム内予測評価値からフレーム間予測とフレーム内予測の何れかを予測モードとして選択するモード判定手段と、前記モード判定手段が選択した予測モードを示す予測モード情報を多重化し符号化信号として出力する可変長符号化手段とを備えたことを特徴とする画像符号化装置において、
    前記フレーム間予測評価値の計算終了前に前記フレーム間予測評価値の推定値を計算するフレーム間予測評価値推定手段と、前記フレーム内予測評価値と前記フレーム間予測評価値の推定値とが所定の条件を満たす場合には、フレーム内予測を予測モードとして選択し、前記動き検出手段の前記フレーム間予測評価値の計算の終了を指示するフレーム内予測判定手段とを備えたことを特徴とする動画像符号化装置。
  6. コンピュータにより、2種類以上の予測モードから1つの予測モードを選択し、選択された前記1つの予測モードを示す種別情報を符号化する動画像符号化方法を行うためのプログラムであって、
    前記2種類以上の予測モードのうち1種類以上を第1予測モードとし、前記第1予測モード以外を第2予測モードとすると、前記第1予測モードの評価値計算終了前に前記第1予測モードの評価値の推定値と前記第2予測モードの評価値とを計算し、前記第1予測モードの評価値の推定値と前記第2予測モードの評価値とが所定の条件を満たす場合には、前記第1予測モードの評価値計算を終了し、前記第2予測モードを前記1つの予測モードとして選択することを特徴とした動画像符号化方法をコンピュータに行わせることを特徴とする動画像符号化プログラム。
JP2003379448A 2003-11-10 2003-11-10 動画像符号化方法、動画像符号化装置および動画像符号化プログラム Pending JP2005142986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003379448A JP2005142986A (ja) 2003-11-10 2003-11-10 動画像符号化方法、動画像符号化装置および動画像符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003379448A JP2005142986A (ja) 2003-11-10 2003-11-10 動画像符号化方法、動画像符号化装置および動画像符号化プログラム

Publications (1)

Publication Number Publication Date
JP2005142986A true JP2005142986A (ja) 2005-06-02

Family

ID=34689499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003379448A Pending JP2005142986A (ja) 2003-11-10 2003-11-10 動画像符号化方法、動画像符号化装置および動画像符号化プログラム

Country Status (1)

Country Link
JP (1) JP2005142986A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007063900A1 (ja) * 2005-11-30 2007-06-07 Japan As Represented By The President Of National Cardiovascular Center 身体表面刺激治療装置ならびに身体表面刺激治療プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP2007243337A (ja) * 2006-03-06 2007-09-20 Nec Corp 動画像符号化方法及び動画像符号化装置とプログラムならびに媒体
CN107371019A (zh) * 2011-12-28 2017-11-21 Jvc 建伍株式会社 动图像编码装置、动图像编码方法以及存储介质
US11570467B2 (en) 2011-11-04 2023-01-31 Nokia Technologies Oy Method for coding and an apparatus
CN116600134A (zh) * 2023-05-04 2023-08-15 光线云(杭州)科技有限公司 一种适配图形引擎的并行视频压缩方法和装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007063900A1 (ja) * 2005-11-30 2007-06-07 Japan As Represented By The President Of National Cardiovascular Center 身体表面刺激治療装置ならびに身体表面刺激治療プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JPWO2007063900A1 (ja) * 2005-11-30 2009-05-07 国立循環器病センター総長 身体表面刺激治療装置ならびに身体表面刺激治療プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP2007243337A (ja) * 2006-03-06 2007-09-20 Nec Corp 動画像符号化方法及び動画像符号化装置とプログラムならびに媒体
JP4677932B2 (ja) * 2006-03-06 2011-04-27 日本電気株式会社 動画像符号化方法及び動画像符号化装置とプログラムならびに媒体
US11570467B2 (en) 2011-11-04 2023-01-31 Nokia Technologies Oy Method for coding and an apparatus
CN107371019A (zh) * 2011-12-28 2017-11-21 Jvc 建伍株式会社 动图像编码装置、动图像编码方法以及存储介质
CN107371019B (zh) * 2011-12-28 2019-12-06 Jvc 建伍株式会社 动图像编码装置、动图像编码方法以及存储介质
CN116600134A (zh) * 2023-05-04 2023-08-15 光线云(杭州)科技有限公司 一种适配图形引擎的并行视频压缩方法和装置

Similar Documents

Publication Publication Date Title
JP4722153B2 (ja) 画像復号化方法および画像復号化装置
KR100985236B1 (ko) 움직임 보상 방법, 화상 부호화 방법 및 화상 복호화 방법
KR100956910B1 (ko) 움직임 벡터 도출 방법, 동화상 부호화 방법, 및 동화상복호화 방법
JP4440572B2 (ja) 動画像符号化装置及び動画像符号化方法
JP2004096705A (ja) 動きベクトル符号化方法および動きベクトル復号化方法
JP2008187734A (ja) フィルタリング強度決定方法
JP4313710B2 (ja) 画像符号化方法および画像復号化方法
JP2004048711A (ja) 動画像の符号化方法および復号化方法およびデータ記録媒体
JP2005142986A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP3824268B2 (ja) 動きベクトル導出方法、および動きベクトル導出装置
JP4495013B2 (ja) 動画符号化装置
JP2004215215A (ja) 動きベクトル検出方法
JP2004040512A (ja) 画像符号化方法および画像復号方法
JP4406239B2 (ja) 動き補償方法および動き補償装置
JP4519676B2 (ja) 動き検出方法および動画像符号化方法
JP4503959B2 (ja) 画像符号化方法
JP2005341545A (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラムおよび動画像復号プログラム
JP2004364064A (ja) 動き推定方法および動画像符号化方法
KR20050018729A (ko) 화상 부호화 방법 및 화상 복호화 방법