[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4514666B2 - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP4514666B2
JP4514666B2 JP2005214582A JP2005214582A JP4514666B2 JP 4514666 B2 JP4514666 B2 JP 4514666B2 JP 2005214582 A JP2005214582 A JP 2005214582A JP 2005214582 A JP2005214582 A JP 2005214582A JP 4514666 B2 JP4514666 B2 JP 4514666B2
Authority
JP
Japan
Prior art keywords
image
unit
synthesis
input
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005214582A
Other languages
English (en)
Other versions
JP2007036468A (ja
Inventor
友子 青野
真毅 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2005214582A priority Critical patent/JP4514666B2/ja
Publication of JP2007036468A publication Critical patent/JP2007036468A/ja
Application granted granted Critical
Publication of JP4514666B2 publication Critical patent/JP4514666B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像符号化装置に関し、特に、合成画像を生成する動画像符号化装置に関する。
動画像データに予測符号化、直交変換、量子化、可変長符号化を施すことで、データを圧縮する方式として、動画像符号化の国際標準であるMPEG等がある。しかしながら、カメラ等からの入力画像に、文字や記号を合成した画像を符号化した場合、文字や記号に存在するエッジのために、合成された領域では発生符号量が大きくなる問題がある。また、発生符号量を小さくするために、量子化幅を大きくすると、画質が劣化するという問題もある。
以上の問題を解決するために、特開平8−102895号公報(特許文献1)には、画面内の位置情報から文字が合成される領域を判断し、文字が合成される位置の背景画像は、ローパスフィルタあるいはマスクを施してから文字と合成する技術が開示されている。これにより、文字の背景画像の画質は劣化するものの、画像全体としては良好な画質が得られる。
特開2003−101794号公報(特許文献2)には、エッジ検出や頻度分布を用いた領域判定法によって、文字領域とそれ以外の領域に分け、領域毎に量子化幅を変更する技術が開示されている。これにより、発生符号量の増加を抑えつつ、画質の劣化が軽減される。
特開平8−102895号公報 特開2003−101794号公報
しかしながら、特開平8−102895号公報(特許文献1)に開示されている技術では、歌詞や字幕等の文字領域が予め定められた位置に合成される。そのため、画面内の位置情報に従って文字領域とそれ以外の領域とを判別するため、領域判定に必要な処理量は少ない。しかしながら、領域判定を位置情報のみから行っているので、文字が合成されなかった場合にもローパスフィルタやマスクが施されてしまい、画質が劣化するという問題点がある。
また、特開2003−101794号公報(特許文献2)に開示されている技術では、文字画像とそれ以外の領域を判別するために領域判定処理を行わなければならないが、領域判定のためのエッジ検出や頻度分布は処理量が大きく、特に携帯端末のように処理量を小さく抑えなければならないアプリケーションには適さないという問題点がある。
本発明は、上述の問題点を解決するためになされたものであって、その目的は、高品質な合成画像の符号化が可能な動画像符号化装置を提供することである。
上述の課題を解決するために、この発明のある局面に従う動画像符号化装置は、画像を、順次入力するための入力手段と、入力手段により入力された入力画像内の合成用領域に、合成用画像を合成させた合成画像を生成するための合成手段と、合成画像を量子化するための量子化手段と、量子化手段へ、合成用領域の情報を送信するための制御手段とを備え、量子化手段は、合成用領域の情報の受信後、合成用領域の情報に基づいて、合成画像内の合成用領域および合成用領域以外の領域で、それぞれ、異なる量子化幅で量子化する。
この発明の他の局面に従うと動画像符号化装置は、画像を、順次入力するための入力手段と、入力手段により入力された入力画像内の合成用領域に、合成用画像を合成させた合成画像を生成するための合成手段と、符号化データを復号した復号画像を記憶する第1記憶手段と、符号化データを復号した復号画像を、第1記憶手段が記憶する期間よりも長く記憶する第2記憶手段と、合成用画像の動き検出を行なうための動き検出手段とを備え、動き検出手段は、合成画像内の合成用領域に対しては、合成画像と、第2記憶手段に記憶された復号画像とに基づいて動き検出を行ない、合成画像内の合成用領域以外の領域に対しては、第1記憶手段に記憶されている復号画像に基づいて動き検出を行なう。
好ましくは、第2記憶手段には、入力画像が処理される前に、復号画像として、複数種類の合成用画像から構成された合成用画像抽出画像が記憶される。
好ましくは、合成画像内の合成用領域は、入力画像内の合成用領域と同じ大きさであり、合成画像内の合成用領域の位置は、入力画像内の合成用領域の位置と同じである。
本発明に係る動画像符号化装置は、合成用領域に、合成用画像を合成させた合成画像を生成し、量子化手段は、合成の通知および合成用領域に関する情報の受信後、合成用領域の情報に基づいて、合成画像内の合成用領域および合成用領域以外の領域で、それぞれ、異なる量子化幅で量子化する。
したがって、高品質な合成画像を生成することができるという効果を奏する。
本発明に係る動画像符号化装置は、複数の復号画像を格納可能な記憶手段をもち、動画像符号化装置内で復号された再生画像を記憶するための第1記憶手段と、過去に復号された再生画像を長期間記憶するための第2記憶手段とを備える。動き検出を行なう際は、合成画像内の領域に応じて、第1記憶手段または第2記憶手段に記憶された関連する画像に基づいて、動き検出を行なう。
したがって、動き検出を効率よく行なうことができ、効率よく予測符号化を行なうことができる。その結果、画像処理時間を短縮し、かつ符号化効率を向上させることができるという効果を奏する。
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
<第1の実施の形態>
図1は、第1の実施の形態における動画像符号化装置1000の構成を示すブロック図である。図1を参照して、動画像符号化装置1000は、画像入力部101と、合成用データ格納部102と、合成部103と、減算部104と、直交変換部105と、量子化部106と、可変長符号化部107とを備える。
画像入力部101は、画像を入力する機能を有する。以下においては、画像入力部101が入力した画像を入力画像ともいう。画像入力部101は、一例として、カメラである。画像入力部101は、入力画像のデータを合成部103へ送信する。合成用データ格納部102は、画像入力部101から送信された入力画像に合成する文字、記号、図形等の画像(以下、合成用画像ともいう)のデータ(後述の合成用画像抽出画像と合成用画像管理テーブル)を格納する。なお、合成用データ格納部102は、データを記憶するメモリとしての機能を有する。また、合成用データ格納部102は、外部からの指示に基づいて、指定されたデータまたは指定された情報を出力する機能を有する。
図2は、合成用画像抽出画像400および合成用画像管理テーブルT100を示す図である。図2(A)に示す合成用画像抽出画像400は、複数種類の合成用画像から構成される画像である。複数種類の合成用画像の各々は、文字、記号、図形等を示す画像である。
図2(B)は、合成用画像管理テーブルT100を示す図である。合成用画像管理テーブルT100は、合成用画像に関する情報を管理するテーブルである。また、合成用画像管理テーブルT100は、指定された合成用画像が合成用画像抽出画像400のどの位置にあるかを示すテーブルである。
図2(B)を参照して、「管理番号」は、合成用画像を特定するための番号である。「位置」は、合成用画像抽出画像400における、対応する合成用画像の位置(座標)(xn、yn)を示す。「大きさ」は、合成用画像の横および縦のサイズ(xsize、ysize)を示す。
再び、図1を参照して、合成部103は、画像入力部101から受信した入力画像と、合成用データ格納部102に格納されている合成用画像抽出画像400内の任意の合成用画像とに基づいて、合成画像を生成する。合成部103は、生成した合成画像を減算部104および後述する動き検出部113へ送信する。
減算部104は、受信した合成画像を、直交変換部105へ送信する。減算部104は、後述する予測画像を受信した場合、受信した合成画像と、予測画像とに基づいて、差分画像を算出し、算出した差分画像を直交変換部105へ送信する。
直交変換部105は、受信した合成画像または差分画像を直交変換し、直交変換係数を算出する。直交変換部105は、算出した直交変換係数を量子化部106へ送信する。量子化部106は、受信した直交変換係数を量子化し、量子化係数を算出する。量子化部106は、算出した量子化係数を可変長符号化部107および後述する逆量子化部108へ送信する。
可変長符号化部107は、受信した量子化係数を可変長符号化した符号化データを生成する。符号化データは、通信路に伝送するためのデータまたは記録媒体に記憶させるためのデータである。
動画像符号化装置1000は、さらに、逆量子化部108と、逆直交変換部109と、加算部110と、フレームメモリ111と、動き補償部112と、動き検出部113と、指示入力部115と、制御部114とを備える。
逆量子化部108は、受信した量子化係数を逆量子化して直交変換係数を算出する。逆量子化部108は、算出した直交変換係数を逆直交変換部109へ送信する。
逆直交変換部109は、受信した直交変換係数を逆直交変換して画像の画素値または差分値を算出する。逆直交変換部109は、算出した画像の画素値または差分値を加算部110へ送信する。
フレームメモリ111は、画像を格納するメモリである。
加算部110は、後述する予測画像を受信した場合、予測画像に差分値を加算し、画像を復号させる。以下においては、加算部110から出力された画像を復号画像ともいう。加算部110からの復号画像は、順次フレームメモリ111に記憶される。なお、既にフレームメモリ111に復号画像が記憶されている場合は、新たに復号した復号画像を、既に記憶されている復号画像に上書きする。すなわち、フレームメモリ111に記憶される復号画像は、順次、更新される。
動き補償部112は、フレームメモリ111に格納された復号画像と、後述する動きベクトルとから、合成画像の予測画像を生成する。動き補償部112は、生成した予測画像を、減算部104および加算部110へ送信する。
動き検出部113は、前述の合成部103から受信した合成画像と、フレームメモリ111に格納された復号画像とから、動画像の動きを検出し動きベクトルを算出する。動き検出部113は、算出した動きベクトルを動き補償部112へ送信する。
指示入力部115は、ユーザからの指示を受付ける機能を有する。以下においては、指示入力部115が受付けたユーザの指示を、ユーザ指示ともいう。指示入力部115は、ユーザ指示に応じて、制御部114へユーザ指示を送る。
制御部114は、合成部103に対し、入力画像と、合成用画像とを合成させるための制御指示を送信する。また、制御部114は、量子化部106に対して、合成画像か否かによって量子化を切替る制御指示を送信する。制御部114から合成部103および量子化部106へ送信される制御指示は、指示入力部115からのユーザ指示または図示されないプログラムからの指示に基づいて送信される。
制御部114は、マイクロプロセッサ(Microprocessor)、プログラミングすることができるLSI(Large Scale Integration)であるFPGA(Field Programmable Gate Array)、特定の用途のために設計、製造される集積回路であるASIC(Application Specific Integrated Circuit)、その他の演算機能を有する回路のいずれであってもよい。
図3は、動画像符号化装置1000において処理される画像の一例を示す図である。図3(A)は、画像入力部101が入力した入力画像500の一例を示す図である。図3(B)は、入力画像500に前述の合成用画像を合成した合成画像500Aの一例を示す図である。図3(B)を参照して、合成用画像は、一例として、「一時停止中」という文字を表示する画像である。合成画像500Aの生成は、たとえば、ユーザ指示に応じて行なわれる。
動画像符号化装置1000は、図3(B)の合成画像500Aを圧縮して記録媒体に記録したり、通信路を介して伝送したりするための符号化データを生成する。
図4は、合成画像の生成を説明するための図である。図4を参照して、合成用領域510は、合成用画像が配置される領域である。合成用画像の水平方向のサイズは、xsizeである。合成用画像の垂直方向のサイズは、ysizeである。(xc、yc)は、合成用画像を合成する合成位置の座標である。以下においては、合成位置の座標を合成位置座標とも称する。合成位置座標(xc、yc)は、合成用画像の左上の位置に対応する。
前述したように、入力画像に合成される文字、記号、図形等の複数種類の合成用画像から構成される合成用画像抽出画像400は、予め合成用データ格納部102に格納されている。
制御部114は、ユーザ指示を受信すると、ユーザ指示に基づく合成用画像を特定する情報(たとえば、管理番号“10”(図2(B)参照))を合成用データ格納部102へ送信する。
合成用データ格納部102は、制御部114から受信した情報(管理番号“10”)に基づいて、対応する合成用画像を、合成部103へ送信する。
また、制御部114は、合成用データ格納部102に格納されている合成用画像管理テーブルT100にアクセスし、合成用画像に対応する情報を読み出す。当該読み出した情報は、合成用画像のサイズ情報(xsize、ysize)である。
たとえば、合成用画像が、管理番号“10”に対応する画像である場合、合成用画像のサイズ情報は、(xsize10、ysize10)である(図2(B)参照)。この場合、合成用画像は、合成用画像抽出画像400内における、座標(x10、y10)と、座標(x10+xsize10、y10)と、座標(x10、y10+ysize10)と、座標(x10+xsize10、y10+ysize10)とに囲まれる領域R10内の画像(図2(B)参照)となる。以下においては、合成用画像抽出画像400内における、合成用画像の座標を、合成用画像座標ともいう。
また、制御部114は、合成部103に対し、合成用画像を、合成位置座標(xc、yc)に配置させるための制御指示(以下、合成画像生成指示ともいう)を送信する。
合成部103は、受信した合成用画像および制御部114から受信した合成画像生成指示に基づいて、図4の合成画像500Aを生成する。
また、制御部114は、合成用画像を合成する合成位置座標(xc、yc)を、量子化部106へ送信する。合成位置座標(xc、yc)は、合成用画像の左上の位置に対応する。
また、制御部114は、合成用データに基づく合成用画像のサイズ情報(xsize、ysize)を、量子化部106へ送信する。すなわち、制御部114は、合成用領域510の位置およびサイズの情報を量子化部106へ送信する。
また、制御部114は、合成用領域510内の量子化幅QP’を、合成画像の合成用領域510以外の領域の量子化幅QPより小さくさせるための量子化制御指示を、量子化部106へ送信する。すなわち、量子化部106に、合成用領域510内のみ、量子化幅を小さくさせて量子化させる。なお、QP’<QPが成立する。
量子化部106は、制御部114から受信した合成用領域510の位置およびサイズの情報および量子化制御指示に基づいて、直交変換部105から、受信した直交変換係数に対し、合成用領域510内に対応する部分のみ、量子化幅を小さくして量子化する。
以上の処理により、合成用画像を合成させる合成用領域に対してのみ、量子化幅を小さくして、量子化することで、文字や記号のエッジ部分に対して多くの符号量を割当てることができる。その結果、本実施の形態における動画像符号化装置1000は、文字や記号のエッジ部分がぼけない良好な合成画像を生成できるという効果を奏する。
次に、本実施の形態における処理を説明する。
図5は、本実施の形態における合成画像の符号化過程を時系列で示した図である。
図6は、合成画像の符号化を説明するための図である。図6を参照して、合成用画像は、合成用領域GRに配置される。
再び、図5を参照して、時刻t=Tに、制御部114が、ユーザ指示Aを受信したとする。ユーザ指示Aは、入力画像の合成用領域GR(図6参照)に、「一時停止中」を示す合成用画像を合成させるための指示である。
制御部114は、ユーザ指示Aを受信すると、「一時停止中」を示す合成用画像の管理番号“10”(図2(B)参照)を合成用データ格納部102へ送信する。合成用データ格納部102は、制御部114から受信した管理番号“10”に基づいて、対応する合成用画像(たとえば、図2(A)の領域R10内の画像)を、合成部103へ送信する。
また、制御部114は、合成用データ格納部102に格納されている合成用画像管理テーブルT100にアクセスし、合成用画像の管理番号“10”に対応する情報を読み出す。当該読み出した情報は、合成用画像のサイズ情報(xsize、ysize)である。
また、制御部114は、合成用画像を、合成位置座標(xc、yc)に配置させるための合成画像生成指示を、合成部103へ送信する。
合成部103は、受信した合成用画像および制御部114から受信した合成画像生成指示に基づいて、合成画像を生成する。この合成画像に対し、以下に説明する動き補償、変換符号化が施される。
また、制御部114は、ユーザ指示Aに基づいて、合成用画像を合成する合成位置座標(xc、yc)を、量子化部106へ送信する。
また、制御部114は、合成用データに基づく合成用画像のサイズ情報(xsize、ysize)を、量子化部106へ送信する。すなわち、制御部114は、合成用領域GRの位置およびサイズの情報を量子化部106へ送信する。
また、制御部114は、合成用領域GR内の量子化幅QP’を、合成画像の合成用領域GR以外の領域の量子化幅QPより小さくさせるための量子化制御指示を量子化部106へ送信する。なお、QP’<QPが成立する。
次に、時刻t=T+nに、制御部114が、ユーザ指示Bを受信したとする。ユーザ指示Bは、「一時停止中」を示す合成用画像の合成を解除させるための指示である。
この場合、制御部114は、時刻T+nに、合成用画像の合成を解除させるための制御指示を合成部103へ送信する。
また、制御部114は、時刻T+nに、合成用領域GR内の量子化幅QP’を、合成画像の合成用領域GR以外の領域の量子化幅QPと等しくさせるための量子化制御指示を量子化部106へ送信する。
なお、予測符号化時には、時刻t=T+nと、時刻t=T+n+1との間で文字が消えることにより予測誤差が大きくなる。そのため、制御部114は、時刻T+nの代わりに時刻T+n+1に、合成用領域GR内の量子化幅QP’を、合成画像の合成用領域GR以外の領域の量子化幅QPと等しくさせるための量子化制御指示を量子化部106へ送信してもよい。この場合、時刻T〜時刻T+n+1の間、量子化部106は、直交変換部105から、受信した直交変換係数に対し、合成用領域GR内に対応する部分のみ、量子化幅を小さくして量子化する。
なお、制御部114は、動き検出部113に対し、時刻t=Tおよび時刻t=T+n+1に、合成用領域GRの位置およびサイズの情報を送信してもよい。
この場合、動き検出部113は、受信した合成用領域GRの情報に基づいて、合成用領域GRを、フレーム内符号化を行なうIブロックと判定する。そして、動き検出部113の判定に基づいて、時刻t=Tおよび時刻t=T+n+1の各々における画像内の合成用領域GRをIブロックとして符号化する。
本実施の形態では、合成用画像は予め合成用データ格納部102に格納されていた。しかしながら、ユーザが端末(図示せず)等から入力した文字や記号を合成用画像として、入力画像に合成する場合も、本発明は適用可能である。以下においては、ユーザが文字や記号を入力する端末を合成用データ入力部ともいう。合成用データ入力部は、合成用画像を合成部103へ送信する。
この場合、動画像符号化装置1000における合成用データ格納部102を、合成用データ入力部に置換える。合成用データ入力部はユーザの入力を画像に変換した合成用画像を合成部103へ送信する。合成部103は、画像入力部101から受信する入力画像に、合成用データ入力部から受信する合成用画像を合成した合成画像を生成する。
以上説明したように、本実施の形態では文字、記号、図形等のような合成用画像を入力画像に合成した画像を符号化する場合に以下の処理が行なわれる。当該処理では、制御部114が、合成画像生成指示を、量子化部106へ送信する。量子化部106は、合成画像生成指示の受信に応じて、入力画像に合成用画像を合成する合成用領域の量子化幅を、合成用領域以外の領域の量子化幅より小さくして量子化する。
したがって、本実施の形態における動画像符号化装置1000は、文字、記号、図形等のエッジ部分がぼけない高品質な合成画像を生成できるという効果を奏する。
また、本実施の形態で生成された符号化データは、量子化の際の量子化幅の変更という処理に基づいて生成されたものである。したがって、本実施の形態により生成された符号化データを復号する際、新たな処理を必要としない。すなわち、既存の復号装置において、本実施の形態で生成された符号化データを復号することができる。
また、本実施の形態では、合成画像でない画像を、量子化部106が量子化する時は、量子化幅を変更前の状態に戻す。したがって、合成画像でない画像を量子化する際、量子化幅を不必要に変更して視覚的に影響のない余分な符号化データの発生を防ぐことができる。
<第2の実施の形態>
図7は、第2の実施の形態における動画像符号化装置1000Aの構成を示すブロック図である。図7を参照して、動画像符号化装置1000Aは、図1の動画像符号化装置1000と比較して、フレームメモリ111の代わりに、第1メモリ111Aおよび第2メモリ111Bを備える点が異なる。また、動き検出部113、制御部114の動作が一部異なる。それ以外の構成は、画像符号化装置1000と同様なので詳細な説明は繰り返さない。
第1メモリ111Aは、復号画像を格納する機能を有する。第1メモリ111Aは、前述のフレームメモリ111と同様、加算部110により、順次、復号画像が上書き記憶される。すなわち、第1メモリ111Aに記憶される復号画像は、順次、更新される。
また、第1メモリ111Aは、外部からの制御指示に応じて、格納している画像データを、第2メモリ111Bに記憶させる機能を有する。
第2メモリ111Bは、第1メモリ111Aに順次記憶される復号画像のうち、長期的に格納する必要のある復号画像を、第1メモリ111Aとは別に格納するためのフレームメモリである。
たとえば、第1メモリ111Aおよび第2メモリ111Bの各々は、1枚の復号画像分のデータしか格納する容量がないとする。この場合、第1メモリ111Aにおいて、前に格納されていた復号画像は、上書き記憶により削除される。
しかしながら、第2メモリ111Bは、第1メモリ111Aに制御指示があるまでは、格納している復号画像を保存しておくことができる。
図8は、第2の実施の形態における合成画像の符号化過程を時系列で示した図である。図8を参照して、画像入力部101が、入力画像を入力する時刻をt=0とする。制御部114は、入力画像の符号化処理が行われる前の時刻t=−1に、合成用画像抽出画像400を、合成部103へ送信させるための制御指示を合成用データ格納部102へ送信する。なお、本実施の形態では、入力画像のサイズと、合成用画像抽出画像400のサイズは同じであるとする。
合成用データ格納部102は、制御部114から受信した制御指示に基づいて、合成用画像抽出画像400を、合成部103へ送信する。
合成部103は、合成用画像抽出画像400を減算部104へ送信する。その後、前述した減算部104、直交変換部105、量子化部106、逆量子化部108、逆直交変換部109、加算部110の処理により、Iフレーム(フレーム内符号化フレーム)として符号化および復号された合成用画像抽出画像400が、第1メモリ111Aに記憶される。
制御部114は、時刻t=−1において、さらに、第1メモリ111Aに記憶されている合成用画像抽出画像400を第2メモリ111Bに記憶させるための画像複製指示を、第1メモリ111Aへ送信する。
第1メモリ111Aは、画像複製指示に応じて、第1メモリ111Aに合成用画像抽出画像400が記憶されると、合成用画像抽出画像400を第2メモリ111Bに記憶させる。
次に、時刻t=0において、画像入力部101に画像が入力されたとする。画像入力部101は、入力画像を合成部103へ送信する。そして、合成部103、減算部104、直交変換部105、量子化部106、逆量子化部108、逆直交変換部109、加算部110の処理により、入力画像は、Iフレームとして符号化および復号され、第1メモリ111Aに記憶される。なお、この時点で、第1メモリ111Aに記憶される画像は、入力画像に合成用画像が合成されていない画像(入力画像そのもの)である。
時刻t=k(k<T)において、画像入力部101に画像が順次入力されたとする。この場合、画像入力部101は、入力画像を、順次、合成部103へ送信する。そして、入力画像を、Iフレームとして第1メモリ111Aに記憶させる場合は、合成部103、減算部104、直交変換部105、量子化部106、逆量子化部108、逆直交変換部109、加算部110の処理により、入力画像は、Iフレームとして符号化および復号され、第1メモリ111Aに記憶される。
また、入力画像を、Pフレームとして符号化および復号し、第1メモリ111Aに記憶させる場合、以下の処理が行なわれる。まず、動き検出部113が、前述の合成部103から受信した画像と、時刻t=k−1に第1メモリ111Aに格納された復号画像とから、動画像の動きを検出し動きベクトルを算出する。動き検出部113は、算出した動きベクトルを動き補償部112へ送信する。
動き補償部112は、時刻t=k−1に第1メモリ111Aに格納された復号画像と、受信した動きベクトルとから、入力画像の予測画像を生成する。動き補償部112は、生成した予測画像を、減算部104および加算部110へ送信する。
そして、減算部104、直交変換部105、量子化部106、逆量子化部108、逆直交変換部109の処理により、算出された画像の差分値が、加算部110へ送信される。
加算部110は、受信した予測画像に、受信した差分値を加算し、Pフレームとしての画像を作成する。そして、加算部110は、復号画像を第1メモリ111Aに上書き記憶させる。
次に、時刻t=Tに、制御部114が、ユーザ指示Bを受信したとする。ユーザ指示Bは、入力画像の合成用領域GR1(図8参照)に、「一時停止中」を示す合成用画像を合成させるための指示である。合成用領域GR1の左上の座標は、(xc、yc)である。
制御部114は、「一時停止中」を示す合成用画像の管理番号“10”(図2(B)参照)を合成用データ格納部102へ送信する。合成用データ格納部102は、制御部114から受信した管理番号“10”に基づいて、対応する合成用画像(図2(A)の領域R10内の画像)を、合成用画像抽出画像400から抽出して、合成部103へ送信する。また、制御部114は、合成用画像を、合成用領域GR1に配置させるための合成画像生成指示を、合成部103へ送信する。
また、制御部114は、合成用データ格納部102に格納されている合成用画像管理テーブルT100にアクセスし、合成用画像の管理番号“10”に対応する情報を読み出す。当該読み出した情報は、合成用画像のサイズ情報(xsize10、ysize10)および合成用画像座標(x10、y10)の情報である。
合成部103は、受信した合成用画像および制御部114から受信した合成画像生成指示に基づいて、入力画像と、合成用画像との合成画像を生成する。合成部103は、生成した合成画像を減算部104および動き検出部113へ送信する。
図9は、時刻t=Tに、合成部103が生成した合成画像700を示す図である。図9を参照して、合成画像700には、合成用領域GR1と、非合成用領域R0とが含まれる。合成用領域GR1は、合成用画像が配置される領域である。非合成用領域R0は、合成画像700内の合成用領域GR1以外の領域である。非合成用領域R0には、入力画像が配置される。
再び、図8を参照して、制御部114は、動き検出部113に対し、合成部103から受信した合成画像内の合成位置座標(xc、yc)および合成用画像のサイズ情報(xsize10、ysize10)を送信する。
また、合成用データ格納部102は、ユーザ指示Bに対応する合成用画像の合成用画像座標(x10、y10)を、動き検出部113へ送信する。
動き検出部113は、合成部103から受信した合成画像と、時刻t=T−1に第1メモリ111Aに格納された復号画像または時刻t=−1に第2メモリ111Bに格納された復号画像とから、動画像の動きを検出し動きベクトルを算出する。
具体的には、非合成用領域R0内の画像に対しては、動き検出部113は、合成部103から受信した合成画像と、時刻t=T−1に第1メモリ111Aに格納された復号画像とから、動画像の動きを検出し動きベクトルを算出する。
合成用領域GR1内の画像に対しては、動き検出部113は、合成部103から受信した合成画像と、時刻t=−1に第2メモリ111Bに格納された合成用画像抽出画像400とから、動画像の動きを検出し動きベクトルを算出する。動きベクトルは、合成位置座標(xc、yc)と、合成用画像座標(x10、y10)との差分により算出され、(xc−x10、yc−y10)となる。
動き検出部113は、算出した動きベクトルを動き補償部112へ送信する。
動き補償部112は、時刻t=−1に第2メモリ111Bに格納された合成用画像抽出画像400と、受信した動きベクトルとから、合成画像の予測画像を生成する。動き補償部112は、生成した予測画像を、減算部104および加算部110へ送信する。
そして、減算部104、直交変換部105、量子化部106、逆量子化部108、逆直交変換部109の処理により、算出された画像の差分値が、加算部110へ送信される。
加算部110は、受信した予測画像に、受信した差分値を加算し、復号画像を作成する。そして、加算部110は、復号画像を第1メモリ111Aに上書き記憶させる。
次に、時刻t=T+1以降は、前述した時刻t=k(k<T)において行なわれる処理と同様、符号化対象となる画像の全ての領域を前フレームから予測する予測符号化処理が行われる。ここで合成用領域GR1についても前フレームから予測するのは、動きベクトルが、第2メモリ111Bからの予測では(xc−xn、yc−yn)であるのに対し、前フレームからの予測では(0、0)となるため、動きベクトルに必要な符号量を削減できるためである。
以上説明したように、第2の実施の形態では、入力画像の符号化処理が行われる前に、合成用画像抽出画像400を符号化し、復号画像を、第1メモリ111Aおよび第2メモリ111Bに記憶させる。そして、入力画像に対しては、予測符号化の時は前フレームを格納した第1メモリ111Aを参照して符号化する。
合成画像を生成する場合は、入力画像に合成用画像を合成するタイミングに合わせて、以下の処理が行なわれる。当該処理では、非合成用領域R0に対しては前フレームを格納した第1メモリ111Aを参照し、合成用領域GR1に対しては、合成用画像抽出画像400が格納された第2メモリ111Bを参照して予測符号化が行なわれる。
この場合、時刻t=Tの非合成用領域R0に対しては、動きベクトルは、ユーザが指示した合成位置座標(xc、yc)と、合成用画像抽出画像400内の指定された合成用画像の合成用画像座標(xn、yn)との差分から計算される。合成画像が生成された後(t=T+1以降)は、画像の全領域を、第1メモリ111Aを参照して予測符号化する。
以上説明したように、第2の実施の形態では、カメラ等からの入力画像を符号化処理する前に、文字、記号、図形等の複数種類の合成用画像から構成される合成用画像抽出画像400を、長期間保存できる第2メモリ111Bに予め別途記憶させる。
そして、合成画像生成指示の受信に応じて、合成画像を最初に生成する際、合成画像内の非合成用領域R0および合成用領域GR1の各々で、関連する画像が記憶されたメモリを参照して、動き検出をし、予測符号化を行なう。
したがって、動き検出を効率よく行なうことができ、効率よく予測符号化を行なうことができる。また、合成用領域GR1では動き検出の処理が不要であるため、画像処理時間を短縮することができるという効果を奏する。
また、合成用領域GR1に多くの符号化データを割当てることなく、少ないデータ量で、高品質な合成画像の符号化データを作成することができるという効果を奏する。
また、本実施の形態においては、文字、記号、図形等を合成した合成画像に対し、処理量を増加させることなく画質を維持して符号化することができるという効果を奏する。
また、本実施の形態では、画像内の領域に応じて、異なる画像が記憶されたメモリを参照するだけで、合成画像の画質向上を実現している。そのため、本実施の形態により生成された符号化データを復号する際、新たな処理を必要としない。すなわち、既存の復号装置において、本実施の形態で生成された符号化データを復号することができる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
第1の実施の形態における動画像符号化装置の構成を示すブロック図である。 合成用画像抽出画像および合成用画像管理テーブルを示す図である。 動画像符号化装置において処理される画像の一例を示す図である。 合成画像の生成を説明するための図である。 本実施の形態における合成画像の符号化過程を時系列で示した図である。 合成画像の符号化を説明するための図である。 第2の実施の形態における動画像符号化装置の構成を示すブロック図である。 第2の実施の形態における合成画像の符号化過程を時系列で示した図である。 時刻t=Tに、合成部が生成した合成画像を示す図である。
符号の説明
101 画像入力部、102 合成用データ格納部、103 合成部、104 減算部、105 直交変換部、106 量子化部、107 可変長符号化部、108 逆量子化部、109 逆直交変換部、110 加算部、111 フレームメモリ、111A 第1メモリ、111B 第2メモリ、112 動き補償部、113 動き検出部、115 指示入力部、114 制御部、1000,1000A 動画像符号化装置。

Claims (4)

  1. 画像を、順次入力するための入力手段と、
    外部からの要求に応答して、前記入力手段により入力された入力画像内の合成用領域に、複数の合成用画像の候補のうち要求された合成用画像を合成た合成画像を生成するための合成手段と、
    符号化データを復号した1フレーム分の復号画像を記憶する第1記憶手段と、
    符号化データを復号した復号画像を、前記第1記憶手段が記憶する期間よりも長く記憶する第2記憶手段と、
    前記入力画像または前記合成画像の動き検出を行なうための動き検出手段とを備え、
    前記第2記憶手段には、前記入力画像が処理される前に、前記復号画像として、複数種類の合成用画像の候補から構成された合成用画像抽出画像が記憶され、
    前記動き検出手段は、
    前記合成画像の生成が要求されていない期間において、フレーム全体に対して、第1記憶手段に記憶されている復号画像に基づいて動き検出を行ない、
    前記合成画像の生成が要求されている期間において、
    前記合成画像内の前記合成用領域に対しては、前記合成画像と、前記第2記憶手段に記憶された前記復号画像である前記合成用画像抽出画像とに基づいて動き検出を行ない、
    前記合成画像内の前記合成用領域以外の領域に対しては、第1記憶手段に記憶されている復号画像に基づいて動き検出を行なう、動画像符号化装置。
  2. 前記動き検出手段は、前記合成画像の生成が要求されている期間において、前記合成用領域以外の領域に対しては、前記第1記憶手段に記憶されている復号画像に基づいて動きベクトルを算出し、前記合成用領域に対しては、前記第2記憶手段に記憶されている復号画像に基づいて動きベクトルを算出し、
    前記動画像符号化装置は、
    前記動きベクトルと前記第1記憶手段および前記第2記憶手段に記憶されている前記復号画像とに基づいて、前記合成画像の予測画像を生成する動き補償手段と、
    前記合成画像と前記予測画像とを比較して差分画像を生成する差分画像生成手段とをさらに備える、請求項1に記載の動画像符号化装置。
  3. 前記差分画像を量子化するための量子化手段と、
    前記量子化手段へ、前記合成用領域の情報を送信するための制御手段とをさらに備え、
    前記量子化手段は、前記合成用領域の情報の受信後、前記合成用領域の情報に基づいて、前記合成画像内の前記合成用領域および前記合成用領域以外の領域で、それぞれ、異なる量子化幅で量子化する、請求項2に記載の動画像符号化装置。
  4. 前記合成画像内の前記合成用領域は、前記入力画像内の合成用領域と同じ大きさであり、
    前記合成画像内の前記合成用領域の位置は、前記入力画像内の合成用領域の位置と同じである、請求項1〜のいずれか1項に記載の動画像符号化装置。
JP2005214582A 2005-07-25 2005-07-25 動画像符号化装置 Expired - Fee Related JP4514666B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005214582A JP4514666B2 (ja) 2005-07-25 2005-07-25 動画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005214582A JP4514666B2 (ja) 2005-07-25 2005-07-25 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2007036468A JP2007036468A (ja) 2007-02-08
JP4514666B2 true JP4514666B2 (ja) 2010-07-28

Family

ID=37795206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005214582A Expired - Fee Related JP4514666B2 (ja) 2005-07-25 2005-07-25 動画像符号化装置

Country Status (1)

Country Link
JP (1) JP4514666B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009165002A (ja) * 2008-01-09 2009-07-23 Panasonic Corp 画像符号化装置及び画像符号化方法
JP5332329B2 (ja) * 2008-06-11 2013-11-06 富士通株式会社 特定領域を等倍出力する機能を持ったダウンデコード装置
JP5399277B2 (ja) * 2010-01-20 2014-01-29 株式会社メガチップス 画像圧縮装置、オーサリングシステムおよび画像圧縮方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0389791A (ja) * 1989-09-01 1991-04-15 Matsushita Electric Ind Co Ltd 偽動き信号検出回路
JPH06292018A (ja) * 1993-03-31 1994-10-18 Toshiba Corp 高能率符号化装置及び高能率復号化装置
JP2000244426A (ja) * 1999-02-24 2000-09-08 Sony Computer Entertainment Inc 放送システムおよび受信再生端末
JP2002112269A (ja) * 2000-09-26 2002-04-12 Yamaha Corp 画像合成方法および画像合成装置
JP2002204459A (ja) * 2000-12-28 2002-07-19 Toshiba Corp 動画像符号化方法及び装置
JP2004088801A (ja) * 1997-02-13 2004-03-18 Mitsubishi Electric Corp 動画像復号装置及び動画像復号方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0389791A (ja) * 1989-09-01 1991-04-15 Matsushita Electric Ind Co Ltd 偽動き信号検出回路
JPH06292018A (ja) * 1993-03-31 1994-10-18 Toshiba Corp 高能率符号化装置及び高能率復号化装置
JP2004088801A (ja) * 1997-02-13 2004-03-18 Mitsubishi Electric Corp 動画像復号装置及び動画像復号方法
JP2000244426A (ja) * 1999-02-24 2000-09-08 Sony Computer Entertainment Inc 放送システムおよび受信再生端末
JP2002112269A (ja) * 2000-09-26 2002-04-12 Yamaha Corp 画像合成方法および画像合成装置
JP2002204459A (ja) * 2000-12-28 2002-07-19 Toshiba Corp 動画像符号化方法及び装置

Also Published As

Publication number Publication date
JP2007036468A (ja) 2007-02-08

Similar Documents

Publication Publication Date Title
US11089324B2 (en) Method and apparatus for encoding and decoding an image with inter layer motion information prediction according to motion information compression scheme
Kim et al. Hierarchical prediction and context adaptive coding for lossless color image compression
JP4682102B2 (ja) 画像符号化装置及び画像符号化方法
CN101164336B (zh) 影像信息记录装置以及影像信息记录方法
JP2010514325A (ja) テクスチャ合成を利用した映像の符号化、復号化の方法及び装置
JP2010041354A (ja) 動画像符号化方法、符号化装置及び符号化プログラム
WO2009087783A1 (ja) 符号化用データ生成装置、符号化用データ生成方法、復号装置および復号方法
TW201143443A (en) Method and system for 3D video decoding using a tier system framework
JP6209026B2 (ja) 画像符号化装置及びその制御方法
CN111034198B (zh) 图像编码和解码方法、编码和解码设备及对应计算机程序
CN107431807A (zh) 内容自适应b‑图像模式视频编码
JP4514666B2 (ja) 動画像符号化装置
JP4415186B2 (ja) 動画像符号化装置、動画像復号化装置、コーデック装置、および、プログラム
JP4133581B2 (ja) テロップ合成装置、テロップ合成方法及びテロップ合成プログラム
JP4621629B2 (ja) 画像復号装置
KR20060069227A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
JP2009021786A (ja) 画像符号化装置及び画像符号化方法
JP4136403B2 (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体
JP2007195080A (ja) 動画像復号化装置及び動画像復号化プログラム
JP4390009B2 (ja) 符号化装置及び方法、画像処理システム
JP2004336247A (ja) 画像符号化方法、画像符号化装置及びコンピュータプログラム
JP2005123737A (ja) 画像符号化方法、画像符号化装置
JP2004193897A (ja) 動画像符号化方法、動画像復号化方法、動画像符号化装置、動画像復号化装置、及びこれらを実行するためのプログラム
JP2005086384A (ja) 変換符号化方法および変換復号化方法
JP2008205864A (ja) スケーラブル動画像符号化方法,装置,そのプログラムおよびその記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090526

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100511

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees