[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5172945B2 - ビットストリーム復号化装置及び方法 - Google Patents

ビットストリーム復号化装置及び方法 Download PDF

Info

Publication number
JP5172945B2
JP5172945B2 JP2010503975A JP2010503975A JP5172945B2 JP 5172945 B2 JP5172945 B2 JP 5172945B2 JP 2010503975 A JP2010503975 A JP 2010503975A JP 2010503975 A JP2010503975 A JP 2010503975A JP 5172945 B2 JP5172945 B2 JP 5172945B2
Authority
JP
Japan
Prior art keywords
unit
information
decoder
decoding
description
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010503975A
Other languages
English (en)
Other versions
JP2010525654A (ja
Inventor
ウィソン ジャン
シンウク リ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Humax Co Ltd
Original Assignee
Humax Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Humax Co Ltd filed Critical Humax Co Ltd
Publication of JP2010525654A publication Critical patent/JP2010525654A/ja
Application granted granted Critical
Publication of JP5172945B2 publication Critical patent/JP5172945B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234318Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into objects, e.g. MPEG-4 objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • H04N21/42607Internal components of the client ; Characteristics thereof for processing the incoming bitstream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、ビットストリーム復号化方法及び装置に関するもので、より詳細には、復号化ソリューションを備えたビットストリーム復号化方法及び装置に関する。
一般的に動画は符号化器(encoder)でビットストリーム(Bit-stream)の形態に変換される。このとき、ビットストリームは符号化器の制約条件を満たす符号化の類型に応じて格納される。
MPEGはビットストリームの制約条件として、シンタックス(syntax)及びセマンティックス(semantics)を要求する。
シンタックスは、データの構造や形式及び長さを示し、データがどんな順序で表現されるかを示す。すなわち、シンタックスは符号化(encoding)/復号化(decoding)作業のために文法を合わせるためのものであって、ビットストリームに含まれている各要素(elements)の順序及び長さ、データ形式などを定義する。
セマンティックスはデータを構成する各ビットの意味を示す。すなわち、セマンティックスはビットストリーム内の各要素の意味を示す。
したがって、符号化器の符号化条件または適用された規格(またはコーデック)に応じて、多様な形態のビットストリームが生成できる。一般的に各規格(例えば、MPEG−1、MPEG−2、MPEG−4、MPEG−4AVCなど)は、各々異なるビットストリームシンタックスを有する。
したがって、各規格や符号化条件に応じて、符号化されたビットストリームは、それぞれ異なる形式(すなわち、シンタックス及びセマンティックス)を有するといえ、当該ビットストリームを復号化するためには符号化器に対応する復号化器を使用しなくてはならない。
上述したように、従来のビットストリーム復号化器は符号化器の制約条件を満たさなくてはならなく、このような制限は複数の規格に対応する統合復号化器の実現を難しくする原因となる。
本発明は上述した問題点を解決するためになされたものであって、各規格(例えば、MPEG−1、MPEG−2、MPEG−4、MPEG−4AVCなど)に応じて多様な形式(シンタックス、セマンティックス)で符号化されたビットストリームを同一情報認識方式により復号化できるビットストリーム復号化装置及び方法を提供することを目的とする。
本発明の他の目的は、多様な符号化方式で圧縮されたビットストリームを同一の情報分析方法によりパーシング(parsing)し、パーシングされたデータを用いて復号化するための各機能部(FU、Functional Unit)を有機的に制御できるビットストリーム復号化装置及び方法を提供することにある。
本発明のまた他の目的は、ツールボックス(Tool-box)内の各機能部を独立したIDまたは/及び名前(Name)で区分及び管理できるビットストリーム復号化装置及び方法を提供することにある。
本発明のまた他の目的は、多様な形態のビットストリームを復号化するためのシンタックス解析方法を共通に適用できるビットストリーム復号化装置及び方法を提供することにある。
本発明のまた他の目的は、シンタックス要素の変更や追加、削除時にも、復号化器が容易にビットストリームを復号化できるビットストリーム復号化装置及び方法を提供することにある。
本発明のまた他の目的は、解析されたシンタックスの要素情報(element information、すなわち、シンタックスパーシングによる結果物)を、ビットストリーム復号化に用いられる構成要素にも共有できるようにするビットストリーム復号化装置及び方法を提供することにある。
本発明のまた他の目的は、解析されたシンタックスの要素情報を後続のビットストリームシンタックス要素の解析にも利用できるビットストリーム復号化装置及び方法を提供することにある。
本発明のまた他の目的は、多様な規格(コーデック)の様々な復号化方法を構成する機能を、それぞれ機能部(FU
)単位で実現してツールボックスに備えたビットストリーム復号化装置及び方法を提供することにある。
本発明のまた他の目的は、多様な形態で符号化されたビットストリームを復号化するためにツールボックスから必要とされる機能部だけを選別してロード(load)することにより、予め指定されたプロセスが行われるようにするビットストリーム復号化装置及び方法を提供することにある。
本発明のまた他の目的は、ツールボックスに備えられた機能部の変更や追加、削除が可能であるビットストリーム復号化装置及び方法を提供することにある。
本発明のまた他の目的は、ビットストリーム復号化のためのコーデック統合に関する概念及び構造に関する国際標準化にあり、本発明のその他の目的は以下に記載された実施例によりさらに明確になるだろう。
上述した目的を達成するために、本発明の一実施形態によれば、多様な規格に汎用的に利用できる符号化器/復号化器、及び/または統合コーデック装置が提供される。
本発明の一実施例に係る復号化装置は、予め設定されたプロセスが独立的に行われるように実現され、それぞれの固有の(unique)識別情報で区分される複数の機能部を含むツールボックスと、上記識別情報を用いて1つ以上の機能部を選択的にロードしてビットストリームを動画データに復号化するように制御する連結制御部とを含むことができる。
各機能部の識別情報は、適用規格項目(STANDARD)、複数の適用規格を特定するリスト項目(LIST)、機能の区分による役割項目(ROLE)、機能部の実行アルゴリズムに対応付けられた名称項目(NAME)、機能部の特性またはプロセスに関する情報を表示する特性項目(PROPERTY)、機能部が処理するブロックのサイズを表示するサイズ項目(SIZE)、機能部の実行に関する付加情報を表示する実行項目(IMPLEMENTATION)のうちの2つ以上を組み合わせることにより付与できる。
上記ツールボックスは、上記適用規格の項目を基準として構成された機能部の集合であるサブツールボックスで構成されることができる。
上記ツールボックスは、上記ビットストリームのシンタックスパーシングを行う少なくとも1つのパーシング機能部と、上記ビットストリームの復号化処理のための複数の復号化機能部とを備えることができる。
上記復号化装置は、ディスクリプション格納部に格納された部分復号化器ディスクリプション(partial decoder descriptions)を用いて、CSCI制御情報及び連結制御情報を生成して出力する復号化器形成部をさらに含むことができる。上記連結制御部は、上記CSCI制御情報及び上記連結制御情報のうちの少なくとも1つを用いて上記ツールボックスに備えられた複数の機能部が選択的にロードされるように制御することができる。
上記復号化器形成部は、任意の部分復号化器ディスクリプションに記述されている複数の機能部が上記ツールボックスに備えられているか否かを判断するFU確認部と、上記部分復号化器ディスクリプションを用いて上記CSCI制御情報及び連結情報を生成する情報加工部と、を含むことができる。
上記復号化装置は、復号化ソリューションをさらに含むことができる。上記復号化ソリューションは、上記複数の機能部のうちの少なくとも1つの機能部がプロセスを行い、上記ビットストリームのシンタックスパーシング(syntax parsing)により生成された複数の要素情報が格納されるCSCI(Control Signal/Context Information)格納部と、上記連結制御部と、を含むことができる。
上記復号化ソリューションは、上記CSCI制御情報により上記ビットストリームのシンタックスパーシングを行う少なくとも1つのパーシング機能部をさらに含むことができる。上記ツールボックスは上記ビットストリームを復号化するための複数の復号化機能部を備えることができる。
上記復号化ソリューションは、少なくとも1つの機能部がロードされ動作するようにする作業メモリを含むことができる。
上記復号化装置は、上記機能部のうちの一部またはすべての動作制御のための部分復号化器ディスクリプションが格納されているディスクリプション格納部と、上記ビットストリームに対応するように入力された符号化された復号化器ディスクリプションを用いて少なくとも1つの部分復号化器ディスクリプションを生成して上記ディスクリプション格納部に格納するか、上記ディスクリプション格納部に予め格納されている複数の部分復号化器ディスクリプションのうちの少なくとも1つを指定するディスクリプション復号化器と、をさらに含むことができる。
上記復号化装置は復号化器形成部をさらに含み、上記復号化器形成部は、少なくとも1つの機能部がプロセスを行なうことにより生成されたCSCI情報、復号化処理のためのデータのうちの少なくとも1つを格納する格納部と、上記連結制御部と、を含むことができる。
上記復号化器形成部の制御によりロードされた任意の機能部のプロセスを行うための作業メモリは、上記復号化器形成部に含まれるか、上記復号化器形成部に結合されて含まれることができる。
上記復号化装置は、上記符号化された復号化器ディスクリプションと上記ビットストリームとが統合された統合ビットストリームで入力される場合、
上記符号化された復号化器ディスクリプションと上記ビットストリームとを分離して出力する分離部をさらに含むことができる。
上記連結制御部によりロードされた機能部は、予め指定された要素情報、直前にロードされた機能部による出力データのうちの少なくとも1つを入力データとする予め指定されたプロセスを行うことができる。
上記パーシング機能部は、上記CSCI制御情報を用いて要素情報を生成することができる。
上述した目的を達成するために本発明の他の実施形態によれば、多様な規格に汎用的に利用できる復号化方法/符号化方法、及び/またはその方法を実行するためのプログラムが記録された記録媒体が提供される。
本発明の一実施例に係る復号化方法は、(a)入力された復号化器ディスクリプションに対応する複数の部分復号化器ディスクリプションを生成して格納するステップと、(b)上記部分復号化器ディスクリプションを用いてCSCI制御情報及び連結制御情報を生成するステップと、(c)上記CSCI制御情報を用いてビットストリームのシンタックスパーシングにより生成された複数の要素情報を格納部に格納するステップと、(d)上記連結制御情報及び上記要素情報を用いて上記ビットストリームの符号化されたビデオデータを動画データに復号化して出力するステップと、を含むことができる。
上記ステップ(c)及び(d)は、上記CSCI制御情報または上記連結制御情報を参照して、連結制御部がツールボックスに備えられている複数の機能部の中から選択的にロードした機能部によりそれぞれ行われることができる。ここで、上記機能部のそれぞれは、固有の識別情報で区分できる。
各機能部の識別情報は適用規格項目(STANDARD)、複数の適用規格を特定するリスト項目(LIST)、機能の区分による役割項目(ROLE)、機能部の実行アルゴリズムに対応付けられた名称項目(NAME)、機能部の特性またはプロセスに関する情報を表示する特性項目(PROPERTY)、機能部が処理するブロックサイズを表示するサイズ項目(SIZE)、機能部の実行に関する付加情報を表示する実行項目(IMPLEMENTATION)のうちの2つ以上の組み合わせにより付与できる。
上記ステップ(d)は、上記連結制御部の選択的ロードにより動作の開始された複数の機能部のプロセス実行による結果が上記動画データになるまで繰り返し行われることができる。
順次ロードされる複数の機能部のうち、先行の機能部の結果データが後行する機能部のアクセスできるバッファメモリに記録されることができる。
上記連結制御部は順次ロードされる複数の機能部のうち、先行の機能部の結果データを後行する機能部の入力データとして提供することができる。
上記復号化器ディスクリプションは上記ビットストリームと統合された統合ビットストリームの形態で入力されることができる。
本発明の他の実施例によれば、復号化方法を行うために復号化装置で実行可能な命令語のプログラムが類型的に実現されており、上記復号化装置により読み取り可能なプログラムが記録された記録媒体において、入力された復号化器ディスクリプションに対応する複数の部分復号化器ディスクリプションを生成して格納するステップと、上記部分復号化器ディスクリプションを用いてCSCI制御情報及び連結制御情報を生成するステップと、上記CSCI制御情報を用いてビットストリームのシンタックスパーシングにより生成された複数の要素情報を格納部に格納するステップと、上記連結制御情報及び上記要素情報を用いて上記ビットストリームの符号化されたビデオデータを動画データに復号化して出力するステップとを実行することを特徴とするプログラムを記録した記録媒体が提供される。
上述したように、本発明に係る統合コーデック装置及び方法は、各規格(例えば、MPEG−1、MPEG−2、MPEG−4、MPEG−4AVCなど)に従う多様な形式(シンタックス、セマンティックス)により符号化されたビットストリームを同じ情報認識方式で復号化できる効果がある。
また、本発明によれば、ツールボックス内の各機能部を独立したIDまたは/及び名前で区分及び管理できる効果がある。
また、本発明によれば、多様な符号化方式により圧縮されたビットストリームを同じ情報分析方法でパーシングし、パーシングされたデータを用いて復号化のための各機能部を有機的に制御できる効果がある。
また、本発明によれば、多様な形式のビットストリームを復号化するためのシンタックス解析方法を共通に適用できる効果がある。
また、本発明によれば、シンタックス要素の変更や追加時にも、復号化器がビットストリームを容易に復号化できる効果がある。
また、本発明によれば、解析されたシンタックスの要素情報、すなわちシンタックスパーシングによる結果物を、ビットストリーム復号化に用いられる構成要素にも共有できるようにする効果がある。
また、本発明によれば、解析されたシンタックスの要素情報を、後続のビットストリームシンタックス要素の解析に利用できる効果がある。
また、本発明によれば、MPEG−1、MPEG−2、MPEG−4、MPEG−4AVC以外のブロック単位を処理する動画データ、静止画コーデックの統合時に使用できる効果がある。
また、本発明によれば、多様な規格(コーデック)から提案される多様な復号化方法を構成する機能を、それぞれ機能部(FU)単位で実現してツールボックスに備えることができる効果がある。
また、本発明によれば、多様な形式で符号化されたビットストリームを復号化するためにツールボックスから必要とされる機能部だけを選別してロードし復号化するようにできる効果がある。
また、本発明によれば、ツールボックスに備えられた機能部の変更、追加、削除が容易であるという効果がある。
一般的な復号化器の構成を概略的に示す図面である。 一般的な符号化器の構成を概略的に示す図面である。 本発明の一実施例に係る復号化器の構成を概略的に示す図面である。 本発明の一実施例に係る拡張ビットストリーム(extendedbit-stream)の構成を簡略に示す図面である。 本発明の第1実施例に係る復号化処理ユニットの構成を概略的に示す図面である。 本発明の第2実施例に係る復号化処理ユニットの構成を概略的に示す図面である。 本発明の一実施例に係るツールボックスの構成を例示する図面である。 本発明の一実施例に係る機能部名称(FU name)の区分例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプションの構成例を示す図面である。 本発明の一実施例に係る部分復号化器ディスクリプション構成のための命令語を例示した図面である。 本発明の第3実施例に係る復号化処理ユニットの構成を概略的に示す図面である。 本発明の第4実施例に係る復号化処理ユニットの構成を概略的に示す図面である。 本発明の一実施例に係る符号化器のブロック構成図面である。
本発明は多様な変換を加えることができ、様々な実施例を有することができるため、本願では特定実施例を図面に例示し、詳細に説明する。しかし、これは本発明を特定の実施形態に限定するものではなく、本発明の思想及び技術範囲に含まれるあらゆる変換、均等物及び代替物を含むものとして理解されるべきである。
「第1」、「第2」などの用語は、多様な構成要素を説明するために用いられるに過ぎなく、前記構成要素が前記用語により限定されるものではない。前記用語は一つの構成要素を他の構成要素から区別する目的だけに用いられる。例えば、本発明の権利範囲内における第1構成要素は第2構成要素であると命名されることができ、同様に第2構成要素も第1構成要素であると命名されることができる。「及び/または」という用語は、複数の関連のある記載項目の組合または複数の関連のある記載項目のうち何れかの項目を含む。
ある構成要素が他の構成要素に「連結」あるいは「接続」されていると記載された時には、その他の構成要素に直接的に連結されているか、または接続されていることができ、中間に他の構成要素が存在することもできると理解しなければならない。反面、ある構成要素が他の構成要素に「直接連結」あるいは「直接接続」されていると記載された時には、中間に他の構成要素が存在しないと理解しなければならない。
本願で用いた用語は、ただ特定の実施例を説明するために用いたものであって、本発明を限定するものではない。単数の表現は、文の中で明らかに表現しない限り、複数の表現を含む。本願において、「含む」または「有する」などの用語は明細書上に記載された特徴、数字、段階、動作、構成要素、部品、またはこれらを組み合わせたものの存在を指定するものであって、一つまたはそれ以上の他の特徴や数字、段階、動作、構成要素、部品、またはこれらを組み合わせたものの存在または付加可能性を予め排除するものではないと理解しなくてはならない。
その他、定義しない限り、技術的または科学的な用語を含んで、ここで用いられる全ての用語は、本発明が属する技術分野で通常の知識を有する者であれば、一般的に理解される用語と同一の意味を有する。一般的に用いられる予め定義しているような用語は、関連技術の文脈上の意味と一致する意味を有すると解釈すべきで、本願で明らかに定義しない限り、理想的または過度に形式的な意味として解釈しない。
以下、添付図面を参照しながら、本発明に係る統合コーデック方法及び装置の好ましい実施例を詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の図面符号を付することにより、重複説明を省略する。
図1は、一般的な復号化器の構成を概略的に示す図面であり、図2は、一般的な符号化器の構成を概略的に示す図面である。
図1に示すように、一般的に、MPEG−4復号化器100は、可変長復号化部(Variable Length Decoding)110、逆スキャン部(Inverse Scan)115、逆DC/AC予測部(Inverse DC/AC Prediction)120、逆量子化部(Inverse Quantization)125、逆DCT部(Inverse Discrete Cosine Transform、逆離散余弦変換部ともいう)130、動画復元部(VOP Reconstruction)135を含む。復号化器100の構成は適用される規格に応じて異なり得ることは自明であり、また、一部の構成要素を他の構成要素に代替することも可能である。
伝達されたビットストリーム105がシンタックスパーシングされ、ヘッダ情報と符号化された映像データ(encoded video data)とが抽出されると、可変長復号化部110は、予め設定されたハフマンテーブル(Huffman Table)を用いて量子化したDCT係数を作り、逆スキャン部115は、逆スキャンを行って動画140と同一の順序のデータを生成する。すなわち、逆スキャン部115は、符号化したときの様々な方法でスキャンされた順序の逆順で、値を出力する。符号化するとき、量子化(Quantization)を行った後に周波数帯域値の分布によりスキャン方向が定義されることができる。一般的には、ジグザグのスキャン方法が用いられるが、コーデック別に様々な種類のスキャン方式がある。
シンタックスパーシングは、可変長復号化部110にて統合的に行われるか、または可変長復号化部110に先行してビットストリーム105を処理する任意の構成要素にて行われることができる。この場合、シンタックスパーシングは、符号化器と復号化器とに適用される規格が同じであるため、当該規格に対応するように予め指定されている基準によってのみ処理される。
逆DC/AC予測部120は、周波数帯域でDCT係数の大きさを用いて予測のための参照ブロックの方向性を決める。
逆量子化部125は、逆スキャンされたデータを逆量子化する。すなわち、符号化時に指定された量子化値(QP、Quantization Parameter)を用いてDCとAC係数を還元する。
逆DCT部130は、逆離散余弦変換(Inverse Discrete Cosine Transform)を行い、実際の動画ピクセル値を求めてVOP(Video Object Plane)を生成する。
動画復元部135は、逆DCT部130から生成されたVOPを用いて動画信号を復元して出力する。
図2に示すように、一般的にMPEG−4符号化器200は、DCT部210、量子化部215、DC/AC予測部220、スキャン部230、可変長符号化部235を含む。
符号化器200に含まれている各構成要素は、それぞれ対応する復号化器100の構成要素の逆機能を行い、これは当業者にとって自明なことである。簡単に説明すれば、符号化器200は、動画信号、すなわち、デジタル映像ピクセル値を離散余弦変換、量子化などを通して周波数値に変換して符号化を行い、これを情報の頻度数に応じてビット長を差別化する可変長符号化を行って圧縮ビットストリーム状態で出力する。
図3は、本発明の一実施例に係る復号化器の構成を概略的に示す図面であり、図4は、本発明の一実施例に係る拡張ビットストリームの構成を簡略に示す図面である。
図3に示すように、本発明に係る復号化器300は従来の復号化器(図1参照)とは異なる構成を有する。
すなわち、本発明に係る符号化/復号化方法を行うために、復号化器300に、ビットストリームと共に復号化器ディスクリプション(decoder description)が提供される。復号化器ディスクリプションは、符号化されたビデオデータとそれぞれ独立したデータで復号化器300に提供されてもよく、図3に示すように、復号化器ディスクリプションとビットストリームが統合されて拡張ビットストリーム305の形態で復号化器300に提供されてもよい。勿論、復号化器300の特定の格納部に復号化器ディスクリプションに対応する情報が予め格納されている場合であれば、復号化器ディスクリプションの提供は省略可能である。ただし、以下では当該データが拡張ビットストリーム内に含まれて復号化器300に提供される場合を中心に説明する。
本発明の一実施例に係る復号化器300は、分離部310及び復号化処理ユニット320を含む。図示された復号化器300の構成要素(例えば、分離部310、復号化処理ユニット320そのものまたは復号化処理ユニット320に含まれている一つ以上の構成要素など)のうちの少なくとも1つは、後述する機能を行うように実現されたソフトウェアプログラム(またはプログラムコードの組み合わせ)により実現できることは自明である。
分離部310は、入力された拡張ビットストリーム305を、符号化された復号化器ディスクリプション(Encoded Decoder Description)313と一般的なビットストリーム316(以下、従来ビットストリームという)とに分離して復号化処理ユニット320にそれぞれ入力する。
分離部310は、符号化された復号化器ディスクリプション313をディスクリプション復号化器505に入力し、従来ビットストリーム316は復号化器形成部520に入力できる。上述したように、符号化された復号化器ディスクリプション313と従来ビットストリーム316とがそれぞれ独立したデータとして入力される場合には、分離部310を省略できる。また、従来ビットストリーム316は、上述した図1のビットストリーム105と同一または類似のデータであってよい。
拡張ビットストリーム305の一例が図4に示されている。図4を参照すると、拡張ビットストリーム305は、符号化された復号化器ディスクリプション313と従来ビットストリーム316を含むことができる。図4の拡張ビットストリーム305及び符号化された復号化器ディスクリプション313に対する例示は単に説明及び理解のためのものであって、本発明の拡張ビットストリーム305及び/または符号化された復号化器ディスクリプション313の形式がこれに制限されることはない。
符号化された復号化器ディスクリプション313のディスクリプション復号化器505により復号化処理された復号化器ディスクリプション590は、多様な符号化方式により符号化されたビットストリーム及び/または様々な機能のうちユーザが選択した機能を用いて符号化されたビットストリームを共通の解析方式によりパーシングするために、従来ビットストリーム316の構成情報、従来ビットストリーム316の符号化方式(または機能部(FU)間の連結情報)、特定の機能部に対する入出力データの特定などに関する情報である。復号化器ディスクリプション590は、テキスト記述(textual description)やバイナリ記述(binary description)などの記述方式で記述されることができる。勿論、符号化された復号化器ディスクリプション316がディスクリプション復号化器505の処理なしで復号化器形成部520により認識できるように実現された場合であれば、ディスクリプション復号化器505は省略可能である。
復号化器ディスクリプション590は、FL(Functional unit List)410、F−RT(Functional unit Rule Table)420、FU−CSCIT(Functional Unit CSCIT)430、CSCIT(Control Signal and Context Information Table)440、SET(Syntax Element Table)450、S−RT(Syntax-Rule Table)460、DVT(Default Value Table)470などの部分復号化器ディスクリプションに分離されてディスクリプション格納部510に格納されることができる。復号化器ディスクリプションを構成するための各部分復号化器ディスクリプションの順序を多様に変更できることは自明である。
ここで、FL410、F−RT420、FU−CSCIT430、CSCIT440などは、各機能部(FU)の連結関係(connection)を設定するために用いることができる(当該部分復号化器ディスクリプションは、必要により「第1復号化器ディスクリプション」と称してもよい)。
この中、FU−CSCIT440は、ツールボックス515内の各機能部(すなわち、復号化処理のための機能部)とCSCI格納部532に格納された要素情報の間のマッピング(mapping)のための部分復号化器ディスクリプションであってもよい。この場合、要素情報は、ツールボックス515内の各機能部(すなわち、復号化処理のための機能部または/及びシンタックスパーシングのための機能部)に対する制御変数として機能することができる。
また、CSCIT440、SET450、S−RT460、DVT470などは従来ビットストリーム316のパーシングのために用いることができる(該当部分復号化器ディスクリプションは、必要により「第2復号化器ディスクリプション」と称してもよい)。各部分復号化器ディスクリプションの形態及び機能については後述する。
ディスクリプション復号化器505は、分離部310から入力された符号化された復号化器ディスクリプション313を復号化して復号化器ディスクリプション314を生成した後に、復号化器形成部520(または復号化ソリューション530)で認識できる形態の複数の部分復号化器ディスクリプションに分離し、ディスクリプション格納部510に格納する。
ディスクリプション格納部510に格納される各部分復号化器ディスクリプションは、必ずしも一般的な形態のテーブルである必要はなく、復号化器形成部520(または復号化ソリューション530)で認識可能な情報形態であればよい。
ディスクリプション復号化器505の復号化器ディスクリプション分析によりディスクリプション格納部510に格納される部分復号化器ディスクリプションとしては、FL410、F−RT420、FU−CSCIT440、CSCIT440、SET450、S−RT460、DVT470などが含まれ得る。
ディスクリプション復号化器505は、例えば、各部分復号化器ディスクリプションを示す領域に含まれたTI(Table Identifier)を参照して各部分復号化器ディスクリプションを区分することができる。復号化器ディスクリプション590内には、全ての部分復号化器ディスクリプションに対応する情報が必ずしも含まれる必要はなく、コーデック番号(Codec #)とプロファイル及びレベル番号(Profile and level #)が含まれるか、一部の部分復号化器ディスクリプションに対してのみコーデック番号(Codec #)とプロファイル及びレベル番号(Profile and level #)が含まれてもよい。
コーデック番号(Codec #)とプロファイル及びレベル番号(Profile and level #)が含まれている場合、ディスクリプション復号化器505は、全ての部分復号化器ディスクリプションまたは一部の部分復号化器ディスクリプションに対して新しい部分復号化器ディスクリプションを生成しなく、ディスクリプション格納部510に予め格納されている部分復号化器ディスクリプションのうち、対応する部分復号化器ディスクリプションが復号化時に用いられるように選択することもできる。また、コーデック番号(Codec #)、プロファイル及びレベル番号(Profile and level #)と修正情報が含まれている場合、ディスクリプション復号化器505は、ディスクリプション格納部510に予め格納されている部分復号化器ディスクリプションのうち、当該コーデックに対応する部分復号化器ディスクリプションを抽出して修正情報を反映し、新しい部分復号化器ディスクリプションを生成することもできる。勿論、コーデック番号(Codec #)とプロファイル及びレベル番号(Profile and level #)ではなく、部分復号化器ディスクリプションを生成するためのテーブルディスクリプションが含まれている場合、ディスクリプション復号化器505は、全ての部分復号化器ディスクリプションまたは一部の部分復号化器ディスクリプションに対して復号化時に用いるための新しい部分復号化器ディスクリプションを生成することもできる。
図5は、本発明の第1実施例に係る復号化処理ユニットの構成を概略的に示す図面であり、図6は、本発明の第2実施例に係る復号化処理ユニットの構成を概略的に示す図面である。図7は、本発明の一実施例に係るツールボックスの構成を例示する図面であり、図8は、本発明の一実施例に係る機能部名称(FU name)の区分例を示す図面である。
図5及び図6に復号化処理ユニット320の各実施例が示されている。
復号化処理ユニット320の第1実施例を示す図5を参照すると、復号化処理ユニット320は、ディスクリプション復号化器505、ディスクリプション格納部510、ツールボックス515、復号化器形成部520、及び復号化ソリューション530を含むことができる。
復号化器形成部520は、FU確認部522、情報加工部524、及び情報伝達部526を含む。
FU確認部522は、ディスクリプション復号化器505の処理により部分復号化器ディスクリプションがディスクリプション格納部510に格納されると、部分復号化器ディスクリプション(例えば、FL410など)に記述された機能部がツールボックス515にすべて存在するか否かを確認する。若し部分復号化器ディスクリプションに記述された機能部のうちツールボックス515に存在しない機能部がある場合には、エラーメッセージがディスプレイ装置を介してディスプレイされるようにするか、当該機能部のアップデートをユーザに要請することができる。当該機能部のアップデートのためのサーバ装置と通信網を介して連結されている場合、FU確認部522は、通信網を介して自動アップデートを実行することもできる。
情報加工部524は、ディスクリプション格納部510に格納されている各部分復号化器ディスクリプションを役割に応じて分類し、復号化ソリューション530が容易に運用できるデータ形態に加工する。これは、ディスクリプション格納部510に格納されている部分復号化器ディスクリプションの格納形式(例えば、テーブル形式)が、復号化ソリューション530が用いるのに適合しないことがあり、または復号化ソリューション530がより効率的に利用する情報が必要となることもあるからである。
各部分復号化器ディスクリプションの機能及び形式は、後で図面を参照しながら具体的に説明し、ここでは加工されたデータ形態に対してのみ簡略に説明する。
情報加工部524は、部分復号化器ディスクリプションのそれぞれがCSCI(Control Signal/Context Information、制御情報/文脈情報)の生成または格納に利用されているかのことや、機能部の連結に利用されているかのことなどの役割に応じて分類した後、CSCI制御情報と連結制御情報を加工する。例えば、CSCI制御情報を生成するために用いられる部分復号化器ディスクリプションは、SET450、S−RT460、CSCIT440、及びDVT470であってもよく、連結制御情報を生成するために用いられる部分復号化器ディスクリプションは、FL410、F−RT420、S−RT460、及びFU−CSCIT440であってもよい。
情報加工部524により加工されたCSCI制御情報及び連結制御情報は、例えばXML基盤のADM(Abstract Decoder Model)表現方式により表現でき、これは下記の通りである。しかし、加工されたCSCI制御情報及び連結制御情報の表現方式がこれに制限されることはない。

Figure 0005172945
Figure 0005172945
情報伝達部526は、情報加工部524により加工されたCSCI制御情報と連結制御情報を復号化ソリューション530に伝達する。情報伝達部526は、CSCI制御情報を実際にCSCI情報の格納と運用を担当するCSCI格納部532に伝達し、連結制御情報を機能部間の連結を制御する連結制御部534に伝達できる。若しCSCI格納部532が単にCSCI情報の格納のみを機能し、CSCI情報の運用が連結制御部534により行われる場合であれば、情報伝達部524はCSCI制御情報と連結制御情報とを連結制御部534に伝達できることは自明である。
復号化ソリューション530は、CSCI格納部532及び連結制御部534を含む。図示されていないが、復号化ソリューション530は、連結制御部534の呼出により少なくとも1つの機能部がロードされて予め指定されたプロセスを行うようにする作業メモリをさらに含むことができる。
復号化処理ユニット320の第2実施例が示された図6を参照すると、復号化処理ユニット320は、ディスクリプション復号化器505、ディスクリプション格納部510、ツールボックス515、復号化器形成部520、及び復号化ソリューション530を含むことができる。
図5に比べて図6の復号化処理ユニット320の復号化ソリューション530は、パーシング機能部610をさらに含むことができる。パーシング機能部610は、ビットストリームのシンタックスパーシングを行う機能部である。パーシング機能部610は、独立した構成要素として復号化ソリューション530に含まれることもでき、復号化ソリューション530が2つの作業メモリを具備し、連結制御部534は、1つの作業メモリにより復号化処理のための機能部だけが専用的にロードされるように制御し、他の作業メモリによりパーシング機能部610だけが専用的にロードされるように制御することにより、同じ効果が得られるように実現することもできることは自明である。両方とも、ビットストリームに対するパーシング処理と復号化処理が順次または/及び並列に実行できるという長所を有する。
また、図5と比べると、パーシング機能部610の処理のために、情報加工部524はシンタックスパーシング制御情報をさらに加工して復号化ソリューション530に提供する。したがって、CSCI制御情報、連結制御情報、及びシンタックスパーシング制御情報を生成するために用いられる部分復号化器ディスクリプションの役割が変更されることができる。
すなわち、情報加工部524は、部分復号化器ディスクリプションのそれぞれがCSCI(Control Signal/Context Information、制御情報/文脈情報)の生成または格納に利用されているかのことや、シンタックスパーシングのために利用されているか、機能部の連結に利用されているかのことなどの役割に応じて分類した後、CSCI制御情報、連結制御情報、及びシンタックスパーシング制御情報を加工する。例えば、CSCI制御情報を生成するために利用される部分復号化器ディスクリプションはCSCIT440であってもよく、連結制御情報を生成するための部分復号化器ディスクリプションはFL410、F−RT420、及びFU−CSCIT440であってもよく、シンタックスパーシング制御情報を生成するために利用される部分復号化器ディスクリプションはSET450、S−RT460、CSCIT440、及びDVT470であってもよい。
上述したように、情報加工部524により加工されたCSCI制御情報及び連結制御情報は、例えばXML基盤のADM表現方式により表現でき、シンタックスパーシング制御情報の表現例は下記の通りである。
Figure 0005172945
情報伝達部526は、情報加工部524により加工されたCSCI制御情報、連結制御情報、及びシンタックスパーシング制御情報を復号化ソリューション530に伝達する。情報伝達部526は、CSCI制御情報を実際にCSCI情報の格納と運用を担当するCSCI格納部に伝達し、連結制御情報を機能部間の連結を制御する連結制御部534に伝達し、シンタックスパーシング制御情報をパーシング機能部610に伝達できる。若しCSCI格納部532が単にCSCI情報の格納のみを機能し、CSCI情報の運用が連結制御部534により行われる場合であれば、情報伝達部524はCSCI制御情報と連結制御情報とを連結制御部534に伝達できることは自明である。また、若しパーシング機能部610が連結制御部534の制御によりビットストリームのシンタックスパーシングを行う場合であれば、情報伝達部524はシンタックスパーシング制御情報を連結制御部534に伝達できることも自明である。
復号化ソリューション530は、CSCI格納部532、連結制御部534、及びパーシング機能部610を含む。復号化ソリューション530は、連結制御部534の呼出により少なくとも1つの機能部がロードされて予め指定されたプロセスを行うようにする少なくとも1つの作業メモリをさらに含むことができる。
パーシング機能部610は、ビットストリームの符号化フォーマットに関係なく、全てのビットストリームに対してシンタックスパーシングが可能な機能部であってもよく、特定類型のビットストリームのシンタックスパーシングのために特定して生成された機能部であってもよい。すなわち、パーシング機能部610はシンタックスパーシングを行うための少なくとも1つの機能部であって、後で図面を参照しながら具体的に説明する。
図5及び図6に示すように、本発明に係る復号化器300は、ツールボックス515内に備えられた機能部(復号化処理を行う復号化機能部または/及びシンタックスパーシングを行うパーシング機能部610)を選択的にロードして復号化することにより、入力されたビットストリームの符号化方式を問わずに復号化できるように多様な形態で再組み合わせまたは生成される復号化器の実現が可能となる。
上述したように、復号化器形成部520(または連結制御部534)は、入力されたビットストリームを処理するための復号化器を形成する機能を行い、ビットストリームの復号化は復号化器形成部520(または連結制御部534)の制御により構成された実際の復号化器、すなわち復号化ソリューション530により行われる。このように、機能上の因果関係のある2つの処理部を分離することにより、1つの復号化器形成情報を用いて複数の復号化ソリューションを製作できるようになり、復号化器がより効率的な処理を行うことができる。
以下、図5及び/または図6に示された復号化処理ユニット320の各構成要素の機能及び動作について図面を参照しながら説明する。
ディスクリプション復号化器505は、上述したように、入力された符号化された復号化器ディスクリプション313を復号化器ディスクリプション590に復号化した後、複数の部分復号化器ディスクリプションをディスクリプション格納部510に格納する。
ツールボックス510は、予め指定されたプロセスを行うためにそれぞれ実現された複数の機能部を含む。ここで、1つの機能部で実現されるか、複数の機能部の組み合わせで実現されるパーシング機能部610は、ツールボックス515内に含まれてもよく、復号化ソリューション530内に含まれてもよい。パーシング機能部及びそれぞれの機能部は、それぞれプログラムコードの組み合わせで実現されることもできる。
ツールボックス510に含まれる各機能部は、適用される用途別に区分された複数の細部ツールボックスに細分化されてもよい(図7参照)。例えば、MPEG用機能部が含まれる第1ツールボックス、MPEG用機能部以外の機能部が含まれる第2ツールボックスなどに細分化することができる。または、MPEG−2用機能部の集合を第1ツールボックス、MPEG−4用機能部の集合を第2ツールボックス、中国でのデジタルTV圧縮規格であるAVS用機能部の集合を第3ツールボックスなどに細分化することができる。
また、ツールボックス510そのものを複数で実現し、復号化器形成部520及び復号化ソリューション530とは独立した連結関係を有することもできる。この場合、図示されていないが、上述した第1ツールボックス、第2ツールボックスなどが独立した形式のツールボックスで実現されることができる。
ただし、以下では説明の便宜のために、1つのツールボックス510内に複数の細部ツールボックスが含まれている場合を中心に説明する。
ツールボックス510はそれぞれの機能(すなわち予め設定されたプロセス)を行うように実現された機能部(FU)を含む領域であって、各機能部は連結制御部534の連結制御により作業メモリにロードされて順次連結動作関係を形成することで、従来ビットストリーム316に含まれている符号化されたビデオデータを動画データとして出力する。
また、図6を参照して説明したように、パーシング機能部610は復号化ソリューション530に含まれてシンタックスパーシング制御情報を用いることにより、連結制御部534の連結制御なしで従来ビットストリーム316の解析を行うように設定されることもできる。これは、後行する機能部が、パーシング機能部610の解析によりCSCI格納部532に格納された要素情報及び/またはパーシング機能部610から出力されるマクロブロック(MB)サイズの動画データを用いることができるからである。
パーシング機能部610は、シンタックスパーシング制御情報を用いて入力された従来ビットストリーム316を解析してシンタックスパーシングの結果物である要素情報をCSCI格納部532に格納する。CSCI格納部532は、例えばバッファメモリであってもよい。要素情報は、例えばCSCI(Control Signal/Context Information、制御情報/文脈情報)であってもよい。パーシング機能部610によりパーシングされてCSCI格納部532に格納された要素情報は、該当ステップのパーシング結果値であり、かつ従来ビットストリーム316の後続のシンタックスを決める入力値になることもできる。
パーシング機能部610は、シンタックスパーシングされた従来ビットストリーム316のヘッダと映像データに対するエントロピー復号化を行って予め指定されたマクロブロックサイズの動画データを連結制御部534の連結制御による後行の機能部(FU)に出力できる。
また、パーシング機能部610は、マクロブロックサイズの動画データを予め指定されたバッファメモリに格納し、連結制御部534のロード(すなわち、連結制御)による後行の機能部が当該バッファメモリからマクロブロックサイズの動画データを読み出して処理した後、後行の機能部の処理のために当該バッファメモリに処理した動画データを格納することもできる。
すなわち、パーシング機能部610は、マクロブロックサイズの動画データをCSCI格納部532または別途のバッファメモリに格納した後、連結制御部534が、格納されたマクロブロックサイズの動画データを選択した機能部に提供するか、選択された機能部がCSCI格納部532または別途のバッファメモリから当該動画データを読み出すこともできる。ただし、以下ではパーシング機能部610が出力するマクロブロックサイズの動画データが、連結制御部534の連結制御による機能部に直接入力される場合を仮定して説明する。
パーシング機能部610は1つのソフトウェアプログラム(プログラムコードの組み合わせを含む)で実現できる。複数の規格(例えばMPEG−1/2/4/AVC、AVSなど)にそれぞれ対応する複数の機能を行うようにパーシング機能部610が実現されてもシンタックスパーシング制御情報を用いて対応する動作を行うことができるからである。勿論パーシング機能部610が、図7に示すように、複数の機能部に細分化され実現されてもよく、各機能部がブロック化されたプログラムコードの組み合わせで実現されてもよいことは明らかである。
以下、図7及び図8を参照しながらツールボックス515内の機能部について簡略に説明する。
図7に示すように、ツールボックス510に含まれる各機能部は、適用される用途別の集合で区分された複数の細部ツールボックスに細分化できる。勿論ツールボックス510そのものが複数で実現され、復号化器形成部520及び復号化ソリューション530とは独立した連結関係を有することもできる。
先ず、図7に示された各機能部、すなわち機能別に区分された機能部のうち、パーシング機能を行うパーシング機能部の機能について説明する。パーシング機能部はツールボックス515内に存在し、連結制御部534の制御によりロードされて動作するか、復号化ソリューション530内に備えられて動作することは上述した通りである。
機能別に区分されたパーシング機能部は、図7に示されたように、NALP(Network Abstraction Layer Parsing)機能部710、SYNP(syntax parsing)機能部720、CTX(Context
determination)機能部730、VLD(Variable Length Decoding)機能部740、RLD(Run Length Decoding)機能部750、MBG(Macro Block
Generator)機能部760などであってもよい。
勿論、パーシング機能部にはシンタックスパーシングのための機能部であれば適用される規格を問わずに全て含まれることができ、また技術発展過程でシンタックスパーシングなどのために必要とされる機能部は新規に追加でき、既存機能部の修正も可能であり、不要の機能部は除去できる。また、パーシング機能部として備えられた各機能部は、各規格に独立的に存在せず、規格を問わずに同じ処理が可能な機能部であれば1つの機能部に統合して備えられることもできる。各機能部の機能は当業者にとって自明な事項であるため、簡略に説明する。
NALP機能部710はMPEG−4AVCのNAL(Network Abstraction Layer)をパーシングする機能部であり、SYNP機能部720はビットストリームのシンタックスをパーシングする機能部である。SYNP機能部720がVLD機能部740に含まれることもできる。
CTX機能部730はMPEG−4AVCのVLCテーブルを決める機能部であり、VLD機能部740はエントロピー(Entropy)復号化を行う機能部である。
RLD機能部750はAC値をエントロピー復号化する機能部であり、MBG機能部760はDC値及びAC値を結合して1つのMB(Macro Block)データを生成する機能部である。上で言及したパーシング機能部610内の全ての機能部及び一部の機能部は、システムの実現方式によりVLD機能部740にその機能が含まれることができる。
上述したように、パーシング機能部は1つのソフトウェアプログラムで実現されるか、複数のソフトウェアプログラムで実現(例えば、VLD機能部740などを独立したソフトウェアプログラムで独立的に実現する)されることができる。パーシング機能部がシンタックスパーシング制御情報を用いて要素情報を抽出または生成してCSCI格納部532に格納する過程については、後の連結制御部534の説明で詳細に説明する。
次に、図7に示された各機能部、すなわち機能別に区分された機能部のうち、復号化機能を行う復号化機能部の機能について説明する。
ツールボックス515内に備えられている復号化機能部は、連結制御部534の選択的ロードにより活性化され予め指定されたプロセスをそれぞれ行うことにより、パーシング機能部により出力された(またはパーシング機能部がバッファメモリに格納した)マクロブロック単位の動画データを復号化して予め指定されたサイズの動画データとして出力する。
ツールボックス515には、各規格に対応して上述した機能を行う機能部(FU)が含まれることができる。各機能部は、独立した処理ブロック(例えばソフトウェアプログラム、命令語コードの組み合わせ、関数など)で実現されるか、1つの統合された処理ブロックで実現されることができる。復号化機能部が1つの統合された処理ブロックで実現されても連結制御部534の連結制御により、対応付けられている処理が行われ得ることは明らかである。
復号化機能部は、DF(De-blocking Filter)機能部810、VR(VOP Reconstructor)機能部815、FFR(Frame Field Reordering)機能部820、IPR(Intra prediction and Picture Reconstruction)機能部830、IT(Inverse Transform)機能部835、IQ(Inverse Quantization)機能部845、IAP(Inverse AC Prediction)機能部855、IS(Inverse Scan)機能部860、DCR(DC Reconstruction)機能部865などを含むことができる。
IT4×4機能部840、IQ4×4機能部850、及びDCR4×4機能部870は、処理するブロックサイズが4×4であることを特徴とする。これは、MPEG−1/2/4の場合には、変換(Transform)、量子化(Quantization)、予測(Prediction)時に8×8ブロックサイズでデータを処理することに比してMPEG−4AVCは、4×4ブロックサイズでデータを処理することがあるからである。
ツールボックス515にはデータ復号化機能を行う機能部であれば、適用規格を問わずに全て含まれることができ、さらに技術発展過程で必要とされる機能部を追加でき、既存機能部の修正も可能であり、不要の機能部は除去できる。例えば、復号化処理のために4×4のブロックサイズでデータを処理するIS4×4機能部などがさらに必要とされる場合には、当該機能部をツールボックス515に追加することができる。また、MPEG−4AVCでイントラ予測(Intra Prediction)を行うためのSPR(Special Prediction)機能部(図示せず)などをさらに追加することもできる。
ツールボックス515内に備えられた各機能部は、各規格に対して独立的に存在せず、規格を問わずに同じ処理が可能な機能部であれば、1つの機能部に統合して備えられることもできる。各機能部の機能は当業者にとって自明な事項であるため、簡略に説明する。
DF機能部810はMPEG−4AVCのデブロッキングフィルタ(de-blocking filter)であり、VR機能部815は復元されたピクセル値を格納する機能部である。
FFR機能部820はインターレース(interlaced)モードの機能部であり、IPR機能部830はMPEG−4AVCのイントラ予測の後に復元されたピクセル値を格納する機能部である。上述したように、MPEG−4AVCのイントラ予測はSPR機能部で行われることができる。
IT機能部835はDC値及びAC値の逆変換(inverse transform)を行う機能部であり、IQ機能部845はAC値を逆量子化(inverse quantization)する機能部である。
IAP機能部855はAC値を逆予測(inverse AC prediction)する機能部であり、IS機能部860はAC値を逆スキャン(inverse scan)する機能部である。DCR機能部865はDC値の逆予測及び逆量子化を行う機能部である。
図7に示された各機能部は機能別の区分による広義の名称で表現されており、本発明は、図8に示すように、広義の名称の機能部に、用途別に細分化された機能部が含まれるように実現されることができる。例えば、IT機能部はIT4×4、IT8×8、ITforChromaなどに多様化でき、IQ機能部も量子化(Quantization)機能部とサチュレーション(Saturation)機能部などに多様化できる。具体的な例として、IS機能部860は複数の機能部、すなわちMPEG4.algo.IS.luma.8×8、MPEG4.algo.IS.chroma.8×8、及びMPEG4.mgnt.ISなどに細分化できる。また、IT機能部835も複数の機能部、すなわちMPEG2.algo.IT.luma.8×8、MPEG4.algo.IT.luma.8×8、及びMPEG4AVC.algo.IT.luma.4×4などに細分化できる。また、IQ機能部845も複数の機能部、すなわちMPEG2.algo.quan.luma.8×8、MPEG2.algo.satu.luma.8×8などに細分化できる。
上述したように、機能部の多様化及び従属機能部(Sub-FU)に区分するために、下記表1及び表2の機能部IDまたは/及び名称付与基準を適用することができる。しかし、これに制限されることはない。
ツールボックス515内の各機能部は、機能別に割り当てられた集合体として広義の名称で表現されることができる。すなわち、実行方法は異なっても同じ役割を行う機能部が1つ以上存在すると仮定すると、これらの同じ機能を行う機能部を1つのグループに合わせることができる。このように1つのグループに合わせる理由は、IDや名称を用いるとき、該当機能部へより速くアクセスできるからである。IDを構成する実施例としては、表1及び表2に示すように、名称(Name)の構成方式に応じて対応するビットが割り当てられるようにできる。機能部の名称(FU
Name)を構成する要素のうち、必須挿入要素である{STANDARD}.{Role}.{Name}に基本的なIDを構成でき、その他の追加要素にフラグ(flag)を付与することができる。
機能部の名称表示のために割り当てられたビット
Figure 0005172945
上記以外に、図8に示すように、当該機能部が輝度(Luminance)処理用であるか、クロミナンス(Chrominance)処理用であるかを表示する項目をさらに含むことができる。
すなわち、機能部の名称表示のためのビット割り当ては機能部の名称表現方法に応じて多様に適用できる。
他の実施例によれば、機能部の名称表示形態を{STANDARD}.[list].{Role}.{Name}.
[property].[size].[implementation]のように適用することもできる。
ここで、{STANDARD}は、当該機能部の適用可能な復号化規格を表示するためのものである。例えば、2つ以上の規格に適用できるものであればGENERICに対応し、特定規格にだけ適用できるものであれば当該規格に対応する。
[list]は、当該機能部が2つ以上のstandardに対して汎用的に適用可能な場合、これを表示するためのものである。例えば、MPEG2、4、及びAVCに汎用的に利用できる場合、GENERIC.24avc.algo.Interpolation.halfpelのように表現できる。
{Role}は、当該機能部がアルゴリズムを行うか否かに関する情報を表示するためのものであり、{Name}は当該機能部の処理動作に対応する名称を表示するためのものである。
[Property]は、当該機能部に対して指定された特性や特定のプロセスを表示するためのものである。例えば、GENERIC.24avc.Interpolation.halfpelのように機能部の名称が指定された場合、「halfpel」は特性を示し、これは補間(interpolation)時、1/2ピクセルまで計算に含めることを意味する。
[Size]は、当該機能部が処理するマクロブロックサイズを意味する。
[Implementation]は、当該機能部の実行のための付加的な情報を表示するためのものである。
機能部IDまたは/及び名称付与基準
Figure 0005172945
上述したように、各機能部に特定されたIDまたは/及び名称を付与することにより、各機能部を上位グループに従って合わせて管理することができる。すなわち、図7に示されたように、Standard別に各機能部を区分した後、各Standardに含まれている機能部がAlgorithmであるかまたはManagementであるかを区分して管理することができる。
しかし、上述したパーシング機能部と復号化機能部と間の処理動作が順次に行われる必要がある(すなわち、パーシング機能部の動作終了後に復号化機能部の動作が開始される)とは限らず、連結制御部534の連結制御により2つ以上の機能部が作業メモリにロードされるようにすることで、並列的な処理も可能であることは明らかである。例えば、特定復号化機能部の動作のために必要とされる最小限の要素情報のみがパーシング機能部によりCSCI格納部532に格納されればよい。
また、図6を参照して説明したように、復号化ソリューション530内にパーシング機能部610が備えられているか、2つ以上の作業メモリが備えられている場合には、連結制御部534の別途の制御がなくても、シンタックスパーシング及び復号化処理の並列処理が可能であることは明らかである。
CSCI格納部532には、パーシング機能部でCSCI制御情報(またはシンタックスパーシング制御情報)を用いたシンタックスパーシングによる結果値の要素情報(例えば、CSCI)がCSCIT440に対応するように格納される。CSCI格納部532は、例えばバッファメモリ(buffer memory)であってもよい。
CSCI格納部532に格納された要素情報は、パーシング機能部によりSET450のプロセス実行のための入力データとして利用されるか、S−RT460で後続の連結インデックスを決めるための制御変数として利用されることができる。
また、CSCI格納部532に格納された要素情報は、連結制御部534によりF−RT420で後続の連結インデックスを決めるための制御変数として利用されるか、FU−CSCIT430で特定機能部(FU)の入力CSCIをCSCI格納部532に格納された要素情報とマッピングするために利用されることができる。
すなわち、CSCI格納部532に格納された要素情報は、パーシング機能部と復号化機能部と間を連動させる役割をする。
連結制御部534は、各機能部の選択的なロードを制御することにより、多様な規格で符号化されたビットストリームを復号化する各復号化機能部の連結関係を設定する。すなわち、連結制御部534は、機能部間の動作実行順序を制御するために、ツールボックス515に含まれている各機能部のうち、適切な機能部を選択的にロードする。このために、連結制御部534は、連結制御情報を用いて当該機能部を選択的にロードし、ロードされた復号化機能部は、パーシング機能部から提供された要素情報を用いてマクロブロック単位の動画データを復号化するようにする。
以下、図5に示された復号化器形成部520の情報加工部524の動作を中心に各部分復号化器ディスクリプションの機能及び用途を図面を参照しながら説明する。また、連結制御部534などの処理動作に、情報加工部524で加工された情報が利用されるが、説明及び理解の便宜のために部分復号化器ディスクリプションの内容を参照して説明する。
情報加工部524が連結制御情報を生成するために利用する部分復号化器ディスクリプションには、FL410、F−RT420、FU−CSCIT430、及びCSCIT440などがある。また、シンタックスパーシングのための各機能部の連結関係を設定するためにS−RT460がさらに用いることができる。
先ず、FL(FU List)410は、表3に示すように、ツールボックス515内に備えられた各機能部が含まれるツールボックスのID、当該機能部のIDと名称、当該機能部の入出力データの数などに関する部分復号化器ディスクリプションである。
FL(FU List)
Figure 0005172945
FL410は、各機能部における入力データのバッファメモリの名称(または当該データの記録アドレスあるいは当該データが記録されたバッファメモリ内のアドレス)と当該機能部による出力データのバッファメモリの名称(または当該データの記録アドレスあるいは当該データが記録されるバッファメモリ内のアドレス)をさらに含むことができる。
したがって、各機能部はFL410を用いて入力データを読み込んで処理した出力データを記録することができる。また、FL410に記録された情報を用いて各機能部間に入出力データが伝達されるようにしたり、連結制御部534が各機能部に適切な入力データを提供することもできる。
しかし、FL100には要素情報を生成するパーシング機能部の入力データ及び出力データが記載されていないが、これはパーシング機能部がSET450などの情報を用いて要素情報を生成し、生成した要素情報を指定の位置に記録するからである。
連結制御部534により作業メモリにロードされた特定機能部は、連結制御部534から入力データを受け、予め設定されたプロセスを行って出力データを生成する。ここで、機能部とはツールボックス515に含まれ、入力データを予め指定されたプロセスで処理して出力データを生成する一連の処理過程(例えば、機能、アルゴリズムまたは関数など)を意味する。当該機能部は、出力データを後行の機能部(すなわち、後続して連結制御部534の制御によりロードされた機能部)の処理のためにバッファメモリに格納することができる。
復号化処理ユニット320は、従来ビットストリーム316に含まれている符号化されたビデオデータの復号化のために1つの規格だけを利用すれば十分である場合には、FL410は当該規格に対応する処理を行うための機能部の情報だけを含んでもよい。
しかし、当該ビデオデータが複数の規格により符号化された場合(例えば、複数のフレーム単位で異なる符号化規格を適用した場合)には、当該符号化されたビデオデータの復号化のために複数の規格による機能部の情報が必要となる。したがって、この場合FL410は、対応する複数の規格によるすべての機能部のうち、符号化されたビデオデータの復号化のために必要とされる複数の規格による機能部の情報を含まなければならない。上述した表3を参照すれば、用いられる機能部の名称からMPEG4とAVSの規格が利用されたことが分かる。
しかし、ビデオデータが複数のフレーム単位で異なる符号化規格を適用したとしても、適用された符号化規格別に複数の従来ビットストリーム316及び拡張ビットストリーム305が生成され出力されれば、それぞれのFL410はそれぞれ対応する規格による機能部の情報だけを含めばよい。
FL410は、テキスト記述やバイナリ記述(ビット変換されたバイナリコード形態)などの記述方式で記述できるだけでなく、上記部分復号化器ディスクリプションのうち必要とされる最小限のデータが類似スクリプト言語で記述されることもできる。
次に、F−RT(FU-Rule Table)420は、入力された従来ビットストリーム316を復号化するために用いられる機能部の連結情報を提供する。
F−RT420は、表4に示すように、各連結情報(Rule)を区分するインデックス(Index、R#)、インデックスに対応して機能部を特定するツールボックスのID及び機能部のID、連結制御のために必要な要素情報(Input CS/CI、C#)、後行の機能部と連結可能な分岐の数(No. of
branches)、分岐の数だけ必要となる各分岐情報(branch information)(#1、#2、#3…)などを含む。
F−RT(FU Rule Table)
Figure 0005172945
表4のインデックスR0は、ツールボックスのIDが0Aで、FUのIDがF0092であるため、表3に示されたFLを参照すると、当該機能部がMPEG4.mgnt.Address.16×16であることが分かる。
上記表4には、分岐の数が全て1であると例示されており、必要とされる要素情報は言及されていない。しかし、分岐の数が2以上であれば、必要とされる要素情報が言及され、必要とされる要素情報を用いた条件文の判断結果に応じて連結インデックスが変わることになる。すなわち、分岐の数が1である場合には、必要とされる要素情報が存在せず、分岐情報が指示する連結インデックスに進む。当該条件文の後には、後続の連結インデックス(R)が提示される。
復号化処理ユニット320が、従来ビットストリーム316に含まれている符号化されたビデオデータの復号化のために1つの規格だけを利用すれば十分である場合には、F−RT420は当該規格にだけ対応する処理を行うための機能部の連結関係などを指示する。
しかし、当該ビデオデータが複数の規格により符号化された場合(例えば、複数のフレーム単位で異なる符号化規格を適用した場合)には、当該符号化されたビデオデータの復号化のために複数の規格による機能部の連結関係などを指定する情報が含まれることは明らかである。これは、後述する各部分復号化器ディスクリプションが複数の規格に適用されるために追加情報及び/または修正などを必要とする場合には、当該情報をさらに含むことも明らかである。
F−RT420は、テキスト記述やバイナリ記述(ビット変換されたバイナリコード形態)などの記述方式で記述できるだけでなく、上記部分復号化器ディスクリプションのうち必要とされる最小限のデータが類似スクリプト言語で記述されることもできる。
次に、FU−CSCIT(FU CSCI Table)430は、CSCI格納部532に格納されている要素情報と各機能部が必要とする要素情報(input CSCI)とを連結するための部分復号化器ディスクリプションである。
表5に示すように、FU−CSCIT430は、ツールボックスのID、FL410のインデックスと要素情報との対で示されるインデックス(F−C)、当該要素情報、マッピングのためにCSCIT440で用いるインデックス(C)を含む。以外に、FU−CSCIT430は、要素情報のデータタイプ(data type)をさらに含むことができる。例えば、データタイプは9-bit integer、1-bit flagなどの形式で記述することができる。
FU−CSCIT
Figure 0005172945
FU−CSCIT430は、テキスト記述やバイナリ記述(ビット変換されたバイナリコード形態)などの記述方式で記述できるだけでなく、上記部分復号化器ディスクリプションのうち必要とされる最小限のデータが類似スクリプト言語で記述されることもできる。
例えば、F−RT420からF0098に2つの要素情報が入力されると(表5参照)、FU−CSCIT430には機能部別の要素情報がリストされる。すなわち、F0098−C1、F0098−C2がリストされ、各要素情報はC56、C58であることが分かる。また、当該要素情報はCSCITによりマッピングされる。ここで、C56、C58などはそれぞれ該当する要素情報が格納されているアドレス(例えば、記録アドレス、バッファメモリの名称またはバッファメモリ内の記録アドレス)として認識され、当該機能部は入力データ及びインデックス(C)に対応する要素情報を用いて出力データを生成して出力(またはバッファメモリに記録)することができる。
最後に、CSCIT440は、パーシング機能部610がSET450及びS−RT460を用いたプロセスの結果情報である要素情報(例えば、CSCI)の詳細情報が記述されたものである。すなわち、CSCIT440は、従来ビットストリーム316から処理されてCSCI格納部532に格納され、復号化機能部に用いられる全ての意味のある資料(すなわち、要素情報)に関する情報を有する。
図9に示すように、CSCIT440は当該要素情報の固有番号であって、区分子であるインデックス(C)、フラグ(flag)、当該要素情報の名前(Element Name)、当該要素情報の構造的な特性を指定する属性(例えば、当該要素情報の格納空間のサイズ、当該要素情報が配列型(Array)であるか否かなど)、当該要素情報がシンタックスパーシング過程にだけ利用されるかまたは全体の復号化過程で利用されるかを示すGlobal/Localなどを含む。
CSCIT440は、テキスト記述やバイナリ記述(ビット変換されたバイナリコード形態)などの記述方式で記述できるだけでなく、上記部分復号化器ディスクリプションから必要とされる最小限のデータが類似スクリプト言語で記述されることもできる。
以上、表3から表5を参照しながらFL410、F−RT420、及びFU−CSCIT430について説明した。
以外にも、FL410、F−RT420、及びFU−CSCIT430を表現する方法は様々であり、以下にその表現例を例示する。
FL410、F−RT420、及びFU−CSCIT430の他の表現例
FL
Figure 0005172945
F−RT
Figure 0005172945
FU−CSCIT
Figure 0005172945
FL410、F−RT420、及びFU−CSCIT430のまた他の表現例
FL
Figure 0005172945
F−RT
Figure 0005172945
FU−CSCIT
Figure 0005172945
FL410、F−RT420、及びFU−CSCIT430のまた他の表現例
FL
Figure 0005172945
F−RT
Figure 0005172945
FU−CSCIT
Figure 0005172945
FL410、F−RT420、及びFU−CSCIT430のまた他の表現例
FL
Figure 0005172945
F−RT
Figure 0005172945
FU−CSCIT
Figure 0005172945
上述したように、本発明は、各機能部に固有のIDまたは/及び名称を付与することにより効率的な機能部管理ができる特徴を有する。ツールボックス515は、各機能部のID(または/及び名称)を用いて直接当該機能部を管理し、ユーザは各機能部に割り当てられたIDを用いた復号化器ディスクリプションを通して当該機能部にアクセスできる。例えば、MPEG2のIDCTを構成する機能部の固有IDが000011Aと仮定すると、MPEG2のIDCT機能部を使用しようとするユーザは復号化器ディスクリプションを構成する際に、ただIDを通してアクセスするように記述すればよい。すなわち、ユーザは、ツールボックス515内の使用しようとする機能部の位置を確認する必要がない。単に、IDあるいは名称(Name)の利用による実行速度や可読性には差が発生することはある。
上述したように、特定機能部へのアクセスのために用いられるIDは、最適化された文字及び数字の組み合わせからなるため、当該機能部への迅速なアクセスが可能となる。ツールボックス515も、一部符号の同一である機能部をグループ化して管理することにより、IDを用いた機能部へのアクセス時に、より迅速な検索及びアクセスが可能となる。また、機能部の名称はIDの組み合わせにおいてユーザが容易に認知できるようにする情報を提供する。機能部のIDと名称(name)は、下記のF−RT420の例のように混用して用いることもできる。
Figure 0005172945
以下には、パーシング機能部610(またはツールボックス515内のシンタックスパーシングを行う機能部)が従来ビットストリーム316から要素情報を抽出または生成してCSCI格納部532に格納するために利用するCSCI制御情報を生成するための部分復号化器ディスクリプションである、CSCIT440、SET450、S−RT460、及びDVT470について説明する。ただし、CSCIT440については、前で図9を参照して説明したので、これに対する説明は省略する。
先ず、SET450は、入力された従来ビットストリーム316のシンタックスに関する情報で構成された部分復号化器ディスクリプションである。
図10から図13に示すように、SET450は各シンタックスに対するインデックス(index)、要素名称(Element Name)、入力データ(input data)、出力データ(output data)、及びSET−プロセス(process by SET-PROC)情報を含む。ここで、インデックスは、S−RT460で用いられる各シンタックスを区分する区分子(S)である。要素名称は、シンタックスの名前であって、シンタックスの意味や役割により命名され得る。入力データは、従来ビットストリーム316において一度に入力される名目上のビット長である。出力データは、要素情報(すなわち、CSCI情報(C))であって、獲得したデータを格納する際に参照するCSCIT440の目録を示す。ここで、出力データフィールドは、生成された要素情報の記録されるバッファメモリの名称(または当該データの記録アドレスあるいは当該データが記録されたバッファメモリ内のアドレス)であってもよい。これを用いて、今後当該要素情報が入力データとして必要となる場合、CSCI情報(C)を用いて当該要素情報を読み込む(read)ことができる。SET−プロセスは、各ビットストリームシンタックスの入力を受けて、どのような加工手続きで出力データの要素情報を生成するかの過程を記述する。
SET450は、テキスト記述やバイナリ記述(ビット変換されたバイナリコード形態)などの記述方式で記述できるだけでなく、上記部分復号化器ディスクリプションから必要とされる最小限のデータが類似スクリプト言語で記述されることもできる。
次に、S−RT460は、従来ビットストリーム316内の各シンタックス間の連結情報を示すものである。すなわち、S−RT460は各シンタックスを呼び出し、次のシンタックスに移動するように指示する情報を有する。パーシング機能部610はS−RT460を用いて従来ビットストリーム316を読み込んだり、要素情報がCSCI格納部532に格納及び/または更新される順序を規定する。
図14から図17に示すように、S−RT460は、インデックス(R)、シンタックスのインデックス(S)、入力データ(C)、分岐の数(No. of branches)、分岐情報を含む。
インデックス(R)は、各連結情報(Rule)を区分する。シンタックスのインデックス(S)は、特定連結インデックスで処理するシンタックスを指定するため、パーシング機能部(またはシンタックスパーシングを行う機能部)は、SET450を用いて当該シンタックスに対して指定されたプロセスを行う。
入力データは、当該連結インデックスにおける連結制御のための条件判断に用いられる要素情報の目録を示す。
分岐の数は、後続のシンタックスに連結可能な場合の数であって、当該連結インデックスが有する分岐経路の総数を示す。分岐情報は、分岐の数だけ必要とされる分岐情報が存在(#1、#2、#3…など)し、次に処理する連結インデックスを決定する条件判断アルゴリズムである。分岐情報により、どんな順序でどんな内容を読み込むかが直接判断できるようになる。図14から図17に示すように、分岐の数が1である場合には入力データが存在せず、分岐情報に指定された連結インデックスを処理するために直ちに進む。しかし、分岐の数が2以上である場合には条件判断が行われ(条件文の後には次の連結情報(R)で構成される)、対応する連結インデックスを処理するために進む。
パーシング機能部610は、当該連結インデックスで定義したシンタックスを処理してCSCI格納部532を更新した後、更新されたCSCI格納部532の要素情報を参照して読み込み、その後分岐条件の判断に活用する。例えば、インデックスR0の分岐情報の分岐条件である「C0==1」でのC0はシンタックスS0を処理した後の要素情報C0である。
S−RT460は、テキスト記述やバイナリ記述(ビット変換されたバイナリコード形態)などの記述方式で記述できるだけでなく、上記部分復号化器ディスクリプションから必要とされる最小限のデータが類似スクリプト言語で記述されることもできる。
最後に、DVT470は、各符号化器/復号化器で用いるハフマンテーブル情報が記録された部分復号化器ディスクリプションである。MPEG−1/2/4/AVCでは、各符号化の際にエントロピー符号化(entropy coding)を行う。このとき、主にハフマンコーディング(Huffman
coding)方法が利用され、この場合に用いられる情報がハフマンテーブルである。統合コーデックを実現するためには、各復号の際に、当該復号化器に用いられるハフマンテーブルの情報が提供されなければならない。したがって、本発明に係る復号化ディスクリプションには、シンタックスパーシングの際に、各シンタックスに該当するハフマンテーブルの情報を含む。勿論、各規格に対応するハフマンテーブルの情報が既にディスクリプション格納部510に記録されている場合には、DVT470の伝送は省略されるか、コーデック番号(Codec #)とプロファイル及びレベル番号(Profile and level #)のみが含まれてもよい。
図18から図19に示すように、DVT470は、各ハフマンテーブルにおける名前(name)、ハフマンコーディングにより圧縮され出力される実際値(value)及び圧縮された実際値が従来ビットストリーム316に格納される際に用いられるコード値(code)を含む。例えば、MCBPC値を圧縮して「3」という実際値(value)が得られた場合、ハフマンテーブルのマッピング(Huffman table mapping)作業(例えば、SET450のPROCESS部分)により従来ビットストリーム316にはコード値(code)「011」が記録される。他の例として、上述したSET450のインデックスS77のPROCESS部分にはVLD[1]と記録されており、VLDという関数を呼び出す。この関数により、予め指定された長さ(固定長または可変長)分だけ従来ビットストリーム316を読み込んでコード値(code)を得た後、ハフマンテーブルのマッピング作業により対応する実際値(value)を得ることができる。このとき、利用されるハフマンテーブルは[1]、すなわち1番目のテーブルのCBPYである。
DVT470は、テキスト記述やバイナリ記述(ビット変換されたバイナリコード形態)などの記述方式で記述できるだけでなく、上記部分復号化器ディスクリプションから必要とされる最小限のデータが類似スクリプト言語で記述されることもできる。
各部分復号化器ディスクリプションはバイナリで記述されることにより、格納空間が低減され、処理効率が高くなり、復号化ディスクリプションを含んだ拡張ビットストリーム305の伝送時間を低減できるという長所がある。
以下、パーシング機能部610及び/または連結制御部534に用いられる各部分復号化器ディスクリプション間の連動過程を説明する。
本発明に係る復号化器300の復号化処理ユニット320の動作開始方法は様々である。この中、いくつかの例だけを提示すれば次の通りである。
図5に示された復号化処理ユニット320に適用できる例であって、連結制御部534が、復号化器形成部520から受信したCSCI制御情報と連結制御情報とを用いてツールボックス515内の各機能部の処理関係(例えば、動作順序、連結関係など)を制御する方法が挙げられる。これは上述したF−RT420と同様に、ツールボックス515内の機能部のうち、パーシング機能部610を先にロードして従来ビットストリームをシンタックスパーシングした要素情報がCSCI格納部532に格納されるようにした後、制御権限が連結制御部534に戻る(return)(例えば、S−RT460のインデックスR72と同じく、制御権限が連結制御部534に戻るようにする)と、対応する機能部(FU)が後続の動作を処理するためにロードされることにより、各機能部の連結関係を制御する。
次に、図6に示された復号化処理ユニット320に適用できる例であって、シンタックスパーシング制御情報を受信したパーシング機能部610が独立的に動作を開始して従来ビットストリームに対するシンタックスパーシングを完了すると、連結制御情報を受信した連結制御部534が復号化機能部の選択的ロードにより連結関係を制御する方法が挙げられる。この場合、連結制御部534は、先ずパーシング機能部610が必要とする一部/全体の要素情報がCSCI格納部532に格納完了されたか否かを認識しなければならない。このために、連結制御部534は、必要とする要素情報がCSCI格納部532に格納されたか否かを持続的に監視するか、要素情報を格納したパーシング機能部610がこれを連結制御部534に通知(例えば、S−RT460のインデックスR72と同じく、制御権限が連結制御部534に戻るようにする)しなければならない。しかし、連結制御部534(または連結制御部534の制御によりロードされた任意の機能部)及び/またはパーシング機能部610は、必要とされる情報がCSCI格納部532に格納されたか否かを監視しなく、動作開始した状態で、必要とする情報が当該格納部に格納されるまで待機することもできることは明らかである。
図5または/及び図6に示された復号化処理ユニット320に適用できる例であって、復号化器形成部520がCSCI制御情報、連結制御情報などを連結制御部534及び/またはパーシング機能部610に伝達することにより動作開始されるように実現する方法が挙げられる。
以下、上述した第1実施例を中心にパーシング機能部610及び/または連結制御部534に用いられる各部分復号化器ディスクリプション間の連動過程を説明する。
先ず、連結制御部534は、ディスクリプション格納部510からF−RT420の一番目の規則情報(Rule)を読み込んで当該機能部を呼び出す。連結制御部534は、F−RT420に示されたように、一番初めにF0(R0)を読み込み、ツールボックス515内のパーシング機能部をロードして処理が開始されるようにする。これは、パーシング機能部610に対応するプログラムコードの処理ブロックを活性化させるものであってもよい。FL410により、当該機能部がパーシング機能部であるか否かが分かる。
パーシング機能部は、S−RT460の規則情報(Rule)のうち、連結制御部534により指定された(すなわち、F−RT420により指定された)規則情報(これは情報加工部524により加工された情報であってもよい)に対応するシンタックスを読み込み、対応する出力値を生成してCSCI格納部532に格納する。CSCI格納部532に格納された当該要素情報が何であるかはCSCIT440に記載されている。続いて、パーシング機能部はCSCI格納部532に格納された要素情報をS−RT460の対応する分岐情報に代入し、その結果に対応するインデックスの処理のために進む。例えば、インデックスR0に対応する分岐情報は「C0==1」であるため、これを満たす場合はインデックスR1に進み、そうではない場合はエラー処理をする。このような過程は、「GO RT」により制御権限がF−RT420(すなわち、連結制御部534)に移されるまで続けられる(例えば、S−RT460のインデックスR72)。
しかし、パーシング機能部がSET450を用いて要素情報を生成しCSCI格納部532に格納する過程において、VLD関数が呼び出されると(例えば、SET450のインデックスS74)、DVT470を用いてエントロピー復号化を行う。この過程で要素情報が生成されたら、CSCI格納部532に格納する。
パーシング機能部の処理過程において、「GO RT」により制御権限がF−RT420(すなわち、連結制御部534)に移されると、連結制御部534はF−RT420の対応付けられたインデックスの入力値である要素情報をCSCI格納部532から読み出して分岐情報に代入することにより、以後に処理するインデックスが指定される。
上述したように、パーシング機能部の処理により全体/一部の要素情報がCSCI格納部532に格納されると、連結制御部534はF−RT420の対応付けられた機能部をロードして復号化処理が行われるようにする。連結制御部534は、ロードされた任意の機能部が処理を完了したか否かを認識することができ、先行の機能部の処理が完了したら、後行の機能部の処理を指示する。また、先行の機能部は処理したデータを、後行の機能部が動画データの処理のために予め設定されたバッファメモリまたはCSCI格納部532に格納する。連結制御部534が、任意の機能部の処理が完了されたか否かを認識する方法は当業者にとって自明なことであるため、これに対する説明は省略する。
連結制御部534が上述した過程、具体的に、F−RT420に記述されているインデックス順序及び/または分岐条件によるインデックス順序で処理が行われるように制御することにより、復号化処理ユニット320は入力された従来ビットストリーム316に対応する動画データを出力することができる。
上述の説明から分かるように、本発明に係る部分復号化器ディスクリプション間の連動ループ(loop)は大きく2つに分けることができる。具体的に、F−RTループは、F−RT420、FL410、FU−CSCIT430、F−RT420、CSCIT(分岐条件の適用など)、F−RT(次の番のrule)で構成され、S−RTループは、S−RT460、SET450、CSCIT440、S−RT460、CSCIT(分岐条件の適用など)、S−RT(次の番のrule)で構成される。
また、F−RTループは、次のように2つに分けることができる。先ず、復号化機能部の実行を指示する場合には、F−RT420、FL410、FU−CSCIT440、F−RT420、CSCIT(分岐条件の適用など)、F−RT(次の番のrule)で構成される。次に、パーシング機能部の実行を指示する場合には、F−RT420、FL410、(S−RTループ)、F−RT420、CSCIT(分岐条件の適用など)、F−RT(次の番のrule)で構成される。
また、S−RTループは、次のように2つに分けることができる。次の番の規則情報(rule)に分岐する場合には、S−RT460、SET450、CSCIT440、S−RT460、CSCIT(分岐条件の適用)、S−RT(次の番のrule)で構成され、F−RT420に戻る(return)場合には、S−RT460、SET450、CSCIT440、S−RT460、CSCIT(分岐条件の適用など)、F−RT(呼び出したF−RT420のインデックス)で構成される。
F−RT420による連結制御部534の連結制御により、ツールボックス510内に備えられた各機能部の連結関係は変わることができる。
以下、各部分復号化器ディスクリプションを構成する命令語について詳細に説明する。
図20には、シンタックスパーシングのために各部分復号化器ディスクリプションに用いられる命令語が示されている。例示されたそれぞれの命令語を用いてMPEG−2/MPEG−4/MPEG−4AVCのような規格のシンタックスをパーシングするための情報(すなわち、部分復号化器ディスクリプション)を構成することができる。以下では、MPEG−2 MP(Main Profile)イントラ符号化(Intra coding)されたシンタックスをパーシングするための部分復号化器ディスクリプションの例と各部分復号化器ディスクリプション間の連動関係とを中心に説明する。
図20に示すように、各部分復号化器ディスクリプションを構成するための命令語には、READ、SEEK、FLUSH、IF、WHILE、UNTIL、DO〜WHILE、DO〜UNTIL、BREAK、SET、STOP、PUSHなどがある。尚、全ての命令語が各部分復号化器ディスクリプション内に必ずしも利用されるとは限らず、各部分復号化器ディスクリプション別に任意の命令語を選択的に用いることができることは明らかである。以下、各命令語の用途を簡略に説明する。
先ず、READは、ビットストリームから一定のビットを読み込むための命令語である。例えば、”READ bits B > CSCI;”のように表現できる。ここで、”bits”は、読み込むビット数を示し、”B”はByte-alignmentフラグであり、”> CSCI”は格納するCSCIインデックスを示す。”B”と”> CSCI”は、オプション(option)として用いられ、”> CSCI”が指定されない場合は、変数IBSにだけ格納するように設定される。
次に、SEEKは、ビットストリームから一定のビットを読み込み、ファイルポインタを移動しないようにする命令語である。ファイルポインタとは、一定のビットを読み込むなどの動作時の基準位置を意味する。SEEK命令語のパラメータは、上述したREADと同様に適用することができる。
続いて、FLUSHは、ビッ トストリームから一定のビット数分だけファイルポインタを移動する命令語である。パラメータは、READと類似に適用することができる。
IFは、”IF(condition){ 〜 } ELSE {〜}”の形態で用いることができ、与えられた条件による分岐を提供する命令語である。
WHILEは、”WHILE(condition){ 〜 }”の形態で用いることができ、与えられた条件が真(True)である間には、指定されたブロックを繰り返し行うようにする命令語である。
UNTILは”UNTIL(condition){ 〜 }”の形態で用いることができ、与えられた条件が真になるまで、指定されたブロックを繰り返し行うようにする命令語である。
DO〜WHILEは”DO { 〜}
WHILE(condition)”の形態で用いることができ、WHILE文を変形して条件判断に先行してブロックを行うようにする命令語である。
DO〜UNTILは”DO { 〜 }
UNTIL(condition)”の形態で用いることができ、UNTIL文を変形して条件判断に先行してブロックを行うようにする命令語である。
(〜)(compute)という命令語は、例えば”(C11=(V2+3));”の形態で用いられる。すなわち、SET−PROCの全ての計算式が括弧内に記録されるようにでき、四則演算、代入、比較、加算/減算(++/−−)、ビット演算、論理和/論理積、CSCIを使用したか否かなどの演算子を用いることができる。
BREAKは、最も近いループ構造から離脱するようにする命令語である。
SETは、指定されたCSCIを使用したか否かのフラグを設定する命令語であって、フラグを指定するCSCIが並べられ、コンマ(、)により区分(例えば、SET C0、C2;)されることができる。
STOPは、現在行われているシンタックス要素(Syntax Element)の処理を打ち切って次に進むようにする命令語である。
PUSHは、配列型CSCIにおいて、データが記録された最後の地点から与えられたデータを追加するようにする命令語であって、追加された値が並べられ(例えば、PUSH C8 8、16、32;)、コンマにより区分される。
GOは、指定した位置に分岐するようにする命令語である。例えば、GO R#;;である場合には、R#に分岐するという命令であり、GO RTは呼び出したところに復帰(return)するという命令である。
HEXは、HEX命令語の後の値が16進数であることを示す命令語である。
Figure 0005172945
Figure 0005172945
Figure 0005172945
図21は本発明の第3実施例に係る復号化処理ユニットの構成を概略的に示す図面であり、図22は本発明の第4実施例に係る復号化処理ユニットの構成を概略的に示す図面である。
上述の図5及び図6を参照しながら説明した復号化処理ユニットの場合には、情報加工部524が、ディスクリプション格納部510に格納された部分復号化器ディスクリプションを用いてCSCI制御情報及び連結制御情報などを生成し、連結制御部534は情報加工部524により生成された制御情報を用いてツールボックス515内の機能部を選択的にロードすることにより、符号化されたビデオデータ316が復号化処理される。
しかし、図21及び図22に示された復号化処理ユニットの場合、連結制御部534が、ディスクリプション格納部510に格納された部分復号化器ディスクリプションを直接用いてツールボックス515に備えられた少なくとも1つの機能部を選択的にロードすることにより、符号化されたビデオデータ316が復号化処理される。
以下、図21及び図22に示された復号化処理ユニットについて説明する。ただし、連結制御部534が部分復号化器ディスクリプションを解析して対応付けられた連結制御を行うことができるという僅かな差を有するだけで、上述した図5及び図6を参照しながら説明した大部分の内容(例えば、部分復号化器ディスクリプションの構造及び解析など)は同様であるため、これに対する説明は省略する。
復号化処理ユニット320の第3実施例が示された図21を参照すると、復号化処理ユニット320は、ディスクリプション復号化器505、ディスクリプション格納部510、ツールボックス515、及び復号化器形成部520を含むことができる。復号化器形成部520は、連結制御部534及びCSCI格納部532を含む。図示されていないが、復号化器形成部520は、連結制御部525の呼出により少なくとも1つの機能部がロードされて予め指定されたプロセスが行われるようにするための作業メモリをさらに含むことができる。
図22には、復号化処理ユニット320の第4実施例が示されている。図21の復号化処理ユニット320と比較して図22に示された復号化処理ユニット320は、復号化ソリューション530をさらに含む。復号化ソリューション530は、連結制御部534の呼出によりロードされた少なくとも1つの機能部が積載され、予め指定されたプロセスを行うための作業メモリであってもよい。
図21及び図22に示すように、本発明に係る復号化器300は、ツールボックス515内に備えらたれた機能部を選択的にロードして復号化処理するようにすることで、入力されたビットストリームの符号化方式を問わずに復号化できるように、様々な形態で再組み合わせまたは生成される復号化器300を実現することができる。
上述したように、本発明に係る復号化器300におけるツールボックス515を他の構成要素と分離して実現することにより、他の構成要素の復号化器設計構造を変更することなく、互いに異なるツールボックスをより容易に適用できるという長所がある。例えば、MPEG規格による処理のためのツールボックスが用いられるように製作された復号化器でも、当該ツールボックスを同一のインターフェースを有する非MPEG規格のツールボックス、または任意的/私的に製作されたツールボックスに代替することがより容易となる。
図23は本発明の一実施例に係る符号化器のブロック構成図である。
本発明に係る符号化器2300は、上述の図2を参照しながら説明した従来の符号化器200に比して、拡張ビットストリームの生成及び出力部2310をさらに含む。
拡張ビットストリームの生成及び出力部2310は、前段までの処理により生成された従来ビットストリーム316の生成過程における制御情報(例えば、使用された機能部の目録及び連結関係、当該機能部の入力データ、シンタックス情報、シンタックス連結情報など)を用いて復号化器ディスクリプションを生成する。また、生成された復号化器ディスクリプション及び従来ビットストリーム316を用いて拡張ビットストリーム305を生成し、復号化器300に伝送する。復号化器ディスクリプションの生成方法は、上述の説明により当業者が十分に理解できると思われるので、これに対する説明は省略する。
また、本明細書での可変長符号化部230は、符号化器2300内において従来ビットストリーム316を生成するために最終的に符号化を行う任意の構成要素(例えば、符号化部)を指すことに過ぎず、これに制限されることはなく、また、これにより本発明の権利範囲が制限されることはない。
また、図23は復号化器ディスクリプションの情報及び従来ビットストリーム316を用いて生成した拡張ビットストリーム305が復号化器に提供される場合を仮定した図面である。しかし、上述したように、復号化器ディスクリプションは別途のデータまたはビットストリームなどの形態で復号化器300に伝達されることもできる。この場合は可変長符号化部235の後端に拡張ビットストリームの生成及び出力部2310が位置せず、従来の符号化部200とは独立して復号化器ディスクリプションの生成及び出力部が位置し、独立的に生成した情報を復号化器300に提供することもできることは自明である。
以上、本発明に係る統合コーデック装置及び方法について復号化器を中心に説明したが、復号化器と符号化器との間の相互関係が当業者にとって自明なことであり、復号化器に関する詳細な説明だけでも符号化器の構成が容易であることを考慮すると、本発明が復号化器に制限されないことは明らかである。
上述したように本発明に係る統合コーデック装置及び方法は、1つの規格(またはコーデック)内で、または他の規格(またはコーデック)間でのシンタックス要素の解析及び機能部の連結制御を容易にする。すなわち、特定の規格により生成されるビットストリーム内のシンタックス要素の順序を変更したり、新しいシンタックス要素を挿入したり、既存のシンタックス要素を削除したりすることに特に問題はない。
また、従来技術によれば、このようなシンタックス要素の操作時、復号化器では当該ビットストリームを正常に復号化できないという問題点があった。例えば、ABCのビットストリーム情報を、ACBに順序を変えてビットストリームを構成して伝送すると、復号化器はこれを認識せず、正常な復号化が不可能になる。また、新規にFを挿入してABFCに構成したり、Bを削除してACにビットストリームを構成したりする場合も同様である。
しかし、本発明に係る統合コーデック装置及び方法によれば、拡張ビットストリーム内に含まれるか、または独立したデータとして復号化器ディスクリプション情報が提供されるため、復号化器300の復号化動作が円滑に行なわれる。
以上、本発明に係る復号化装置及びビットストリームの復号化のためのシンタックス解析方法をMPEG−4AVCを基準として説明したが、MPEG−1、MPEG−2、MPEG−4、AVS、及びそれ以外の動画の符号化/復号化規格に何ら制限なしに同様に適用できることは明らかである。
また、各部分復号化器ディスクリプションに含まれる情報も1つの規格による復号化の実行のための機能部の連結関係、当該機能部に要求される処理プロセスなどに関する情報のみで記述されることではなく、複数の規格による復号化実行のための情報として記述されることもできる。
例えば、拡張ビットストリームに含まれている符号化されたビデオデータの初期の複数のフレームはMPEG−2で符号化され、後続の複数のフレームはMPEG−4で符号化され、残りのフレームはMPEG−1で符号化されたと仮定する。この場合、符号化されたビデオデータの復号化のために復号化器ディスクリプションに含まれる部分復号化器ディスクリプション情報は、符号化方法の異なる各フレームがツールボックス335に含まれた各規格による機能部の有機的結合により動作されるように実現されることは自明である。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
本発明は、動画コーデックに適用することができる。

Claims (14)

  1. 予め設定されたプロセスが独立的に行なわれるように実現され、それぞれの固有の識別情報で区分される複数の機能部を含むツールボックスと、
    前記識別情報を用いて少なくとも1つ以上の機能部を選択的にロードしてビットストリームを動画データに復号化するように制御する連結制御部と、
    を含み、
    各機能部の識別情報は、適用規格項目(STANDARD)、複数の適用規格を特定するリスト項目(LIST)、機能の区分による役割項目(ROLE)、機能部の実行アルゴリズムに対応付けられた名称項目(NAME)、機能部の特性またはプロセスに関する情報を表示する特性項目(PROPERTY)、機能部が処理するブロックサイズを表示するサイズ項目(SIZE)、機能部の実行に関する付加情報を表示する実行項目(IMPLEMENTATION)のうちの2つ以上の組み合わせにより付与されることを特徴とする、復号化装置。
  2. 前記ツールボックスは、前記適用規格の項目を基準として構成された機能部の集合であるサブツールボックスで構成されることを特徴とする請求項1に記載の復号化装置。
  3. 前記ツールボックスは、前記ビットストリームのシンタックスパーシングを行う少なくとも1つのパーシング機能部と、前記ビットストリームの復号化処理のための複数の復号化機能部と、を備えることを特徴とする請求項1に記載の復号化装置。
  4. ディスクリプション格納部に格納された部分復号化器ディスクリプションを用いて、CSCI制御情報及び連結制御情報を生成して出力する復号化器形成部をさらに含み、
    前記連結制御部は前記CSCI制御情報及び前記連結制御情報のうちの少なくとも1つを用いて前記ツールボックスに備えられた複数の機能部が選択的にロードされるように制御することを特徴とする請求項1に記載の復号化装置。
  5. 前記復号化器形成部は、
    任意の部分復号化器ディスクリプションに記述されている複数の機能部が前記ツールボックスに備えられているか否かを判断するFU確認部と、
    前記部分復号化器ディスクリプションを用いて前記CSCI制御情報及び連結制御情報を生成する情報加工部と、を含む請求項に記載の復号化装置。
  6. 復号化ソリューションをさらに含み、前記復号化ソリューションは、
    前記複数の機能部のうちの少なくとも1つの機能部がプロセスを行い、前記ビットストリームのシンタックスパーシングにより生成された複数の要素情報が格納されるCSCI格納部と、
    前記連結制御部と、を含むことを特徴とする請求項に記載の復号化装置。
  7. 前記復号化ソリューションは、
    前記CSCI制御情報により前記ビットストリームのシンタックスパーシングを行う少なくとも1つのパーシング機能部をさらに含み、
    前記ツールボックスは前記ビットストリームの復号化処理のための複数の復号化機能部を備える請求項に記載の復号化装置。
  8. 前記復号化ソリューションは、少なくとも1つの機能部がロードされて動作するようにする作業メモリを含むことを特徴とする請求項に記載の復号化装置。
  9. 前記機能部のうちの一部またはすべての動作制御のための部分復号化器ディスクリプションが格納されているディスクリプション格納部と、
    前記ビットストリームに対応するように入力された符号化された復号化器ディスクリプションを用いて少なくとも1つの部分復号化器ディスクリプションを生成して前記ディスクリプション格納部に格納するか、前記ディスクリプション格納部に予め格納されている複数の部分復号化器ディスクリプションのうちの少なくとも1つを指定するディスクリプション復号化器と、をさらに含む請求項1に記載の復号化装置。
  10. 復号化器形成部をさらに含み、前記復号化器形成部は、
    少なくとも1つの機能部がプロセスを行うことにより生成されたCSCI情報、復号化処理のためのデータのうちの少なくとも1つを格納する格納部と、
    前記連結制御部と、を含むことを特徴とする請求項1または9に記載の復号化装置。
  11. 前記復号化器形成部の制御によりロードされた任意の機能部のプロセスを行うための作業メモリは、前記復号化器形成部に含まれるか、前記復号化器形成部に結合されて含まれることを特徴とする請求項10に記載の復号化装置。
  12. 前記符号化された復号化器ディスクリプションと前記ビットストリームとが統合された統合ビットストリームで入力される場合、前記符号化された復号化器ディスクリプションと前記ビットストリームとを分離して出力する分離部をさらに含む請求項に記載の復号化装置。
  13. 前記連結制御部によりロードされた機能部は、予め指定された要素情報、直前にロードされた機能部による出力データのうちの少なくとも1つを入力データとする予め指定されたプロセスを行うことを特徴とする請求項1に記載の復号化装置。
  14. 前記パーシング機能部は、前記CSCI制御情報を用いて要素情報を生成することを特徴とする請求項に記載の復号化装置。
JP2010503975A 2007-04-17 2008-04-17 ビットストリーム復号化装置及び方法 Expired - Fee Related JP5172945B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2007-0037434 2007-04-17
KR20070037434A KR101305491B1 (ko) 2007-04-17 2007-04-17 비트스트림 디코딩 장치 및 방법
PCT/KR2008/002180 WO2008127080A1 (en) 2007-04-17 2008-04-17 Bitstream decoding device and method

Publications (2)

Publication Number Publication Date
JP2010525654A JP2010525654A (ja) 2010-07-22
JP5172945B2 true JP5172945B2 (ja) 2013-03-27

Family

ID=39864126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010503975A Expired - Fee Related JP5172945B2 (ja) 2007-04-17 2008-04-17 ビットストリーム復号化装置及び方法

Country Status (6)

Country Link
US (1) US8817886B2 (ja)
EP (1) EP2147554A4 (ja)
JP (1) JP5172945B2 (ja)
KR (1) KR101305491B1 (ja)
CN (1) CN101743749B (ja)
WO (1) WO2008127080A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101372418B1 (ko) * 2007-10-19 2014-03-12 (주)휴맥스 비트스트림 디코딩 장치 및 방법
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US9154797B2 (en) 2010-09-20 2015-10-06 Onecodec, Limited Systems and methods for encoding and decoding
WO2012047507A1 (en) * 2010-09-28 2012-04-12 Onecodec, Ltd. Systems and methods for encoding and decoding
US10025787B2 (en) 2011-08-17 2018-07-17 Bevara Technologies, Llc Systems and methods for selecting digital data for archival
US10129556B2 (en) 2014-05-16 2018-11-13 Bevara Technologies, Llc Systems and methods for accessing digital data
WO2013112758A1 (en) * 2012-01-25 2013-08-01 Onecodec, Limited Systems and methods for encoding, sharing, and decoding of multimedia
US20130279882A1 (en) * 2012-04-23 2013-10-24 Apple Inc. Coding of Video and Audio with Initialization Fragments
CN102883182B (zh) * 2012-09-26 2015-06-03 同济大学 编码级多媒体流分类方法
WO2015176009A1 (en) 2014-05-16 2015-11-19 Bevara Technologies, Llc Systems and methods for selecting digital data for archival
WO2017188750A1 (ko) * 2016-04-27 2017-11-02 엘지전자 주식회사 고품질 미디어 제공을 위한 방송 신호 송수신 방법 및 장치
US10088749B2 (en) 2016-09-30 2018-10-02 Rohm And Haas Electronic Materials Llc Photoacid-generating compound and associated polymer, photoresist composition, and method of forming a photoresist relief image
US10965780B2 (en) 2018-01-18 2021-03-30 Bevara Technologies, Llc Browser navigation for facilitating data access

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3263582B2 (ja) * 1995-11-29 2002-03-04 シャープ株式会社 符号化/復号化装置
JPH09200767A (ja) * 1996-01-12 1997-07-31 Matsushita Electric Ind Co Ltd 画像復号化装置と画像符号化装置、並びに画像符号化方法と画像復号化方法
EP0840517A3 (en) * 1996-10-31 2003-09-10 Matsushita Electric Industrial Co., Ltd. Video data stream decoding method and apparatus
US5920353A (en) * 1996-12-03 1999-07-06 St Microelectronics, Inc. Multi-standard decompression and/or compression device
US6862320B1 (en) * 1997-10-23 2005-03-01 Mitsubishi Denki Kabushiki Kaisha Image decoder, image encoder, image communication system, and encoded bit stream converter
US20020091816A1 (en) * 1998-12-23 2002-07-11 Altan J. Stalker Broadcast data access system for multimedia clients in a broadcast network architecture
JP4188139B2 (ja) * 2003-05-19 2008-11-26 三菱電機株式会社 トランスコーダ
GB0313375D0 (en) * 2003-06-10 2003-07-16 Symbian Ltd Method of connecting a client running on a computing device to a server running on a different computing device
US7720294B2 (en) * 2004-02-09 2010-05-18 Broadcom Corporation Unified decoder architecture
KR20050113501A (ko) * 2004-05-29 2005-12-02 삼성전자주식회사 에이치 264 비디오 디코더를 위한 구문 분석기
US7830964B2 (en) * 2004-11-24 2010-11-09 Lsi Corporation Method and/or apparatus for parsing compressed video bitstreams
US8009740B2 (en) * 2005-04-08 2011-08-30 Broadcom Corporation Method and system for a parametrized multi-standard deblocking filter for video compression systems
WO2007011116A1 (en) * 2005-07-20 2007-01-25 Humax Co., Ltd. Encoder and decoder
KR100654601B1 (ko) * 2005-10-06 2006-12-08 주식회사 휴맥스 통합 코덱 장치 및 방법

Also Published As

Publication number Publication date
WO2008127080A1 (en) 2008-10-23
EP2147554A4 (en) 2012-10-17
US8817886B2 (en) 2014-08-26
US20100034294A1 (en) 2010-02-11
CN101743749B (zh) 2013-02-27
KR101305491B1 (ko) 2013-09-17
KR20080093565A (ko) 2008-10-22
EP2147554A1 (en) 2010-01-27
CN101743749A (zh) 2010-06-16
JP2010525654A (ja) 2010-07-22

Similar Documents

Publication Publication Date Title
JP5172945B2 (ja) ビットストリーム復号化装置及び方法
KR101232780B1 (ko) 통합 코덱 장치 및 방법
KR101372418B1 (ko) 비트스트림 디코딩 장치 및 방법
JP5238018B2 (ja) ビットストリーム復号化装置及び方法
US20100208829A1 (en) Bitstream decoding device and method having decoding solution
KR20090112453A (ko) 부호화/복호화 방법 및 장치
KR100970145B1 (ko) 부호화/복호화 방법 및 장치
US9031136B2 (en) Device and method for encoding/decoding
KR101380825B1 (ko) 디코딩 솔루션을 구비한 비트스트림 디코딩 장치 및 방법
KR101305517B1 (ko) 디코딩 솔루션을 구비한 비트스트림 디코딩 장치 및 방법
KR100807100B1 (ko) 통합 코덱 장치 및 방법
KR100767606B1 (ko) 통합 코덱 장치 및 방법
KR20100115238A (ko) 코덱 설계 방법 및 장치
KR20100040625A (ko) 부호화/복호화 방법 및 장치
KR20090002508A (ko) 동영상 데이터의 인코딩/디코딩 방법 및 장치
KR101305513B1 (ko) 동영상 데이터의 인코딩/디코딩 방법 및 장치
KR20080006430A (ko) 비트스트림 인코딩/디코딩 장치 및 방법
KR101305516B1 (ko) 디코딩 솔루션을 구비한 비트스트림 디코딩 장치 및 방법
KR20090077602A (ko) 동영상 데이터의 부호화/복호화 방법 및 장치
KR20070098459A (ko) 비트스트림 인코딩/디코딩 장치 및 방법
KR20070075270A (ko) 비트스트림 인코딩/디코딩 장치 및 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120815

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121226

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350