[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2022504772A - 低遅延ビデオ符号化のための効率的な量子化パラメータ予測方法 - Google Patents

低遅延ビデオ符号化のための効率的な量子化パラメータ予測方法 Download PDF

Info

Publication number
JP2022504772A
JP2022504772A JP2021520135A JP2021520135A JP2022504772A JP 2022504772 A JP2022504772 A JP 2022504772A JP 2021520135 A JP2021520135 A JP 2021520135A JP 2021520135 A JP2021520135 A JP 2021520135A JP 2022504772 A JP2022504772 A JP 2022504772A
Authority
JP
Japan
Prior art keywords
video frame
control logic
complexity index
intra
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021520135A
Other languages
English (en)
Other versions
JP7265622B2 (ja
Inventor
リュウ デニス
ワン ジャオ
ジャン レイ
エイ. ハロルド エドワード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATI Technologies ULC
Original Assignee
ATI Technologies ULC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATI Technologies ULC filed Critical ATI Technologies ULC
Publication of JP2022504772A publication Critical patent/JP2022504772A/ja
Application granted granted Critical
Publication of JP7265622B2 publication Critical patent/JP7265622B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Figure 2022504772000001
所定のビットバジェットを満たすようにビデオフレームを符号化するための量子化パラメータ(QP)を計算するシステム、装置及び方法が開示されている。エンコーダに結合された制御ロジックは、以前のビデオフレームを符号化することの難易度を表す複雑度指標を計算する。複雑度指標は、以前のビデオフレームに関連する第1のパラメータに少なくとも部分的に基づいており、分散、イントラ予測係数及びインター対イントラ比のうち1つ以上に対応する。次に、制御ロジックは、複雑度指標を用いて、所定のビットバジェットを満たすように現在のビデオフレームを符号化するのに使用する好ましいQPを計算する。エンコーダは、複雑度指標に基づいて生成された好ましいQPを使用することによって、フレーム中のQP調整を少なくすることができる。これは、結果として得られる符号化されたビデオビットストリームの表示品質を向上させるのに役立つ。
【選択図】図5

Description

(関連技術の説明)
様々なアプリケーションが、画像又はビデオコンテンツの符号化及び復号化を実行する。例えば、ビデオトランスコーディング、デスクトップ共有、クラウドゲーム、ゲーム観戦は、コンテンツの符号化及び復号化のサポートを含むアプリケーションの一部である。コンテンツの符号化方法を決定するパラメータの1つに、量子化パラメータ(QP)がある。H.264規格に準拠する方式等のように、様々なブロックベースのビデオ符号化方式では、QPが、符号化処理中に保持されるディテール(detail)を調整する。ビデオフレーム毎又はフレームのブロック毎に選択されるQPは、符号化されたビデオフレームのサイズ又は符号化されたブロックのサイズと直接関連する。QP値を小さく選択すると、多くのディテールが保持されるが、符号化後に得られるサイズが大きくなる。QP値を大きく選択すると、多くのディテールが失われるが、符号化後に生成されるサイズが小さくなる。「量子化パラメータ」という用語は、より一般的には「量子化強度」とも呼ばれることに留意されたい。
添付図面と併せて以下の説明を参照することによって、本明細書で説明する方法及びメカニズムの利点をより良く理解することができる。
コンテンツを符号化及び復号化するシステムの一実施形態のブロック図である。 ビデオのフレームを符号化するサーバのソフトウェア構成要素の一実施形態のブロック図である。 一実施形態による、ビデオフレームを符号化するための量子化パラメータ(QP)を計算する式を示す図である。 一実施形態による、フレームの符号化に関連するパラメータを計算するための式を示す図である。 ビデオフレームを符号化する際に用いる量子化パラメータ(QP)を求める方法の一実施形態を示す一般化されたフロー図である。 符号化されるフレームの推定サイズを複雑度指標に基づいて計算する方法の別の実施形態を示す一般化されたフロー図である。 ビデオフレームを符号化する際に用いるQPを求める方法の一実施形態を示す一般化されたフロー図である。 符号化されるフレームの推定サイズを複雑度指標に基づいて計算する方法の一実施形態を示す一般化されたフロー図である。
以下の説明では、本明細書に提示される方法及びメカニズムの十分な理解を提供するために、多数の具体的な詳細が記載される。しかしながら、当業者は、様々な実施形態がこれらの具体的な詳細無しに実施され得ることを認識すべきである。場合によっては、本明細書に記載されるアプローチを曖昧にすることを回避するために、周知の構造、構成要素、信号、コンピュータプログラム命令及び技術が詳細に示されていない。説明を簡単且つ明確にするために、図面に示される要素が必ずしも縮尺通りに描かれていないことが理解されよう。例えば、いくつかの要素の寸法は、他の要素に対して誇張されている場合がある。
所定のビットバジェットを満たすようにビデオフレームを符号化するための量子化パラメータ(QP)を計算するシステム、装置及び方法が本明細書に開示されている。一実施形態では、システムは、エンコーダと、制御ロジックと、エンコーダ及び制御ロジックに結合されたメモリと、を少なくとも含む。制御ロジックは、以前のビデオフレーム及び/又は現在のビデオフレームの第1の符号化パスに関連する第1のパラメータに少なくとも基づいて、複雑度指標を計算する。一般的に、複雑度指標は、所定のフレームを符号化することの難易度を表す。一実施形態では、第1のパラメータは、分散である。別の実施形態では、第1のパラメータは、イントラ予測係数(intra-prediction factor)である。さらなる実施形態では、第1のパラメータは、インター対イントラ比(inter-to-intra ratio)である。他の実施形態では、第1のパラメータは、これらのパラメータのうち複数、及び/又は、1つ以上の他のパラメータを含む。いくつかの実施形態では、制御ロジックは、2つ以上の以前のビデオフレームに関連する第1のパラメータに少なくとも基づいて、複雑度指標を計算する。次に、制御ロジックは、複雑度指標を用いて、所定のビットバジェットを満たすように現在のビデオフレームを符号化するのに使用する好ましいQPを計算する。複雑度指標に基づいて生成された好ましいQPを使用することによって、エンコーダは、フレーム中のQP調整を少なくすることができる。これは、結果として得られる符号化ビデオビットストリームの表示品質を向上させるのに役立つ。
図1を参照すると、コンテンツの符号化及び復号化を行うシステム100の一実施形態のブロック図が示されている。システム100は、サーバ105と、ネットワーク110と、クライアント115と、ディスプレイ120と、を含む。他の実施形態では、システム100は、ネットワーク110を介してサーバ105に接続された複数のクライアントを含み、複数のクライアントは、サーバ105によって生成された同じビットストリーム又は異なるビットストリームを受信する。また、システム100は、複数のクライアントのために複数のビットストリームを生成する2つ以上のサーバ105を含むことができる。
一実施形態では、システム100は、ビデオコンテンツの符号化及び復号化を実施する。様々な実施形態では、ビデオゲームアプリケーション、クラウドゲーミングアプリケーション、仮想デスクトップインフラストラクチャアプリケーション又は画面共有アプリケーション等の様々なアプリケーションが、システム100によって実施される。他の実施形態では、システム100は、他のタイプのアプリケーションを実行する。一実施形態では、サーバ105は、ビデオ又は画像のフレームをレンダリングし、レンダリングしたフレームをビットストリームに符号化し、次いで、符号化したビットストリームを、ネットワーク110を介してクライアント115に伝送する。クライアント115は、符号化されたビットストリームを復号化し、ビデオ又は画像のフレームを生成して、ディスプレイ120又はディスプレイコンポジタに送る。
ネットワーク110は、無線接続、直接ローカルエリアネットワーク(LAN)、メトロポリタンエリアネットワーク(MAN)、広域エリアネットワーク(WAN)、イントラネット、インターネット、ケーブルネットワーク、パケット交換網、光ファイバネットワーク、ルータ、ストレージエリアネットワーク、若しくは、他のタイプのネットワークを含む、任意のタイプのネットワーク又はネットワークの組み合わせを表す。LANの例は、イーサネット(登録商標)ネットワーク、光ファイバ分散データインタフェース(FDDI)ネットワーク及びトークンリングネットワークを含む。様々な実施形態では、ネットワーク110は、リモートダイレクトメモリアクセス(RDMA)ハードウェア及び/若しくはソフトウェア、伝送制御プロトコル/インターネットプロトコル(TCP/IP)ハードウェア及び/若しくはソフトウェア、ルータ、リピータ、スイッチ、グリッド、並びに/又は、他の構成要素を含む。
サーバ105は、ビデオ/画像フレームをレンダリングし、フレームをビットストリームに符号化するためのソフトウェア及び/又はハードウェアの任意の組み合わせを含む。一実施形態では、サーバ105は、1つ以上のサーバの1つ以上のプロセッサで実行される1つ以上のソフトウェアアプリケーションを含む。また、サーバ105は、ネットワーク通信機能、1つ以上の入出力装置、及び/又は、他の構成要素を含む。サーバ105のプロセッサ(複数可)は、任意の数及びタイプのプロセッサ(例えば、グラフィックスプロセッシングユニット(GPU)、中央演算処理装置(CPU)、デジタルシグナルプロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)等)を含む。プロセッサ(複数可)は、プロセッサ(複数可)によって実行可能なプログラム命令を記憶する1つ以上のメモリデバイスに結合されている。同様に、クライアント115は、ビットストリームを復号化し、フレームをディスプレイ120に送るためのソフトウェア及び/又はハードウェアの任意の組み合わせを含む。一実施形態では、クライアント115は、1つ以上のコンピューティングデバイスの1つ以上のプロセッサで実行される1つ以上のソフトウェアアプリケーションを含む。様々な実施形態では、クライアント115は、コンピューティングデバイス、ゲームコンソール、モバイルデバイス、ストリーミングメディアプレーヤ、又は、他のタイプのデバイスである。
図2を参照すると、ビデオのフレームを符号化するためのサーバ200のソフトウェア構成要素の一実施形態のブロック図が示されている。他の実施形態では、サーバ200は、他の構成要素を含むこと、及び/又は、図2に示す以外の他の適切な方法で構成されることに留意されたい。ビデオの新しいフレーム205が、サーバ200によって受信され、制御ロジック220及びエンコーダ230に提供される。制御ロジック220及びエンコーダ230の各々は、ハードウェア及び/又はソフトウェアの任意の適切な組み合わせを使用して実装される。制御ロジック220は、新しいフレーム205を符号化する際にエンコーダ230によって使用される量子化パラメータ(QP)225を生成する。一実施形態では、制御ロジック220は、以前のフレーム(複数可)のパラメータ210、及び/又は、新しいフレーム205の第1のパスの符号化からのパラメータに基づいて、QP225を生成する。様々な実施形態では、これらのパラメータは、分散、イントラ予測係数、インター対イントラ比のうち1つ以上、及び/又は、1つ以上の他のパラメータを含む。一実施形態では、制御ロジック220は、新しいフレーム205の分析中、及び/又は、第1のパスの符号化中に生成された統計値に基づいて、新しいフレームパラメータ215を生成する。制御ロジック220は、新しいフレームパラメータ215をメモリ240に記憶し、新しいフレームパラメータ215は、新しいフレーム205の第2のパス、及び/又は、ビデオストリームの後続のフレームを符号化するために使用される。メモリ240は、符号化プロセスに関連するデータ及び/又は命令を記憶するための任意の数及びタイプのメモリ又はキャッシュデバイス(複数可)を表す。
エンコーダ230は、新しいフレーム205を受信し、制御ロジック220によって生成されたQP225と等しいQP値を用いて、新しいフレーム205を符号化する。一実施形態では、エンコーダ230は、新しいフレーム205の符号化を開始すると、開始QP値を、制御ロジック220によって計算されたQP225と等しくなるように設定する。エンコーダ230の出力は、符号化されたフレーム235であり、この符号化されたフレーム235は、1つ以上のクライアント(例えば、図1のクライアント115)に伝送され、及び/又は、メモリに記憶される。一実施形態では、制御ロジック220は、新しいフレーム205の第1のパスの符号化を実行し、エンコーダ230は、新しいフレーム205の第2のパスの符号化を実行する。別の実施形態では、エンコーダ230は、新しいフレーム205の第1のパスの符号化及び第2のパスの符号化を実行する。さらなる実施形態では、新しいフレーム205のシングルパスの符号化のみがエンコーダ230によって実行される。
一実施形態では、制御ロジック220は、以前のフレーム(複数可)のパラメータ210及び/又は新しいフレーム205の第1のパスの符号化からのパラメータに基づいて、複雑度指標を生成する。次に、複雑度指標を用いて、結果として得られる符号化ビットストリームに対して選択されたビットレートに基づいて、新しいフレーム205を符号化するための開始QP値225が生成される。エンコーダ230は、適切な開始QP値225を選択することによって、通常、新しいフレーム205の符号化中のQP調整を少なくすることができる。これは、結果として得られる符号化されたフレーム235の表示品質を向上させるのに役立つ。
図3を参照すると、ビデオフレームを符号化するための量子化パラメータ(QP)を計算する式が示されている。圧縮されたフレームのサイズは、式305に示す式に従って計算される。圧縮されたフレームのビットサイズは、複雑度指標を、2のQP/α乗の値で除算したものに等しい。複雑度指標は、エンコーダがフレームを圧縮することの難しさを表す値である。QP値の範囲は、アドバンスドビデオコーディング(AVC)及び高効率ビデオコーディング(HEVC)のビデオ圧縮規格の場合、0~51である。VP9規格の場合、QP値の範囲は0~255である。α値は、特定のエンコーダで実験的に導出された定数値である。式310は、QPについて式305を解くことによって生成される。
一実施形態では、所定のフレームについての複雑度指標を導出するために、以下のパラメータが求められる。最初に、フレームiの分散、すなわちvariance(i)が求められる。また、QPでのフレームiに対するイントラ予測の有効度を表す値、すなわちintra_pred_factor(i,QP)が求められる。ここで、「intra_pred_factor(i,QP)」は、本明細書では「イントラ予測係数」とも呼ばれることに留意されたい。さらに、QPでのフレームiのインタービット(inter bits)とイントラビット(intra bits)との比率、すなわちinter_intra_ratio(i,QP)が求められる。ここで、「inter_intra_ratio(i,QP)」は、本明細書では「インター対イントラ比」とも呼ばれることに留意されたい。これらのパラメータについて、一実施形態では、「i」は、以前に符号化されたフレームの番号である。別の実施形態では、「i」は、現在符号化中のフレームの第1のパスの番号である。同様に、一実施形態では、「QP」は、以前に符号化されたフレームに使用されるQP値であり、別の実施形態では、「QP」は、現在符号化中のフレームの第1のパスに使用されるQP値である。シングルパスエンコーダでは、3つのパラメータ(variance(i)、intra_pred_factor(i,QP)、inter_intra_ratio(i,QP))は、以前に符号化されたフレームから累積される。2パスエンコーダでは、これら3つのパラメータは、第1のパスで累積される。
一実施形態では、「complex」値の構成要素の1つは、フレームに含まれる情報の分量(measure)である。一実施形態では、フレームに含まれる情報を測定するために使用される値は、アクティビティ(activity)である。一実施形態では、アクティビティは、隣接するピクセル間の絶対差の和を加算することによって計算される。別の実施形態では、分散は、フレームに含まれる情報を測定するために使用される。この実施形態では、フレームの分散は、次の式、すなわち、variance(i)=Σblock_variance(b)によって求められる。この式において、「b」はフレーム内のブロック番号であり、ブロックのサイズは16x16ピクセル、32x32ピクセル、64x64ピクセル又は他のサイズである。また、この式において、block_variance(b)は、ブロック「b」におけるピクセル値の分散である。
図4を参照すると、フレームの符号化に関連するパラメータを計算するための式が示されている。intra_pred_factor(i,QP)値は、フレームに対するイントラ予測の有効度を表す。本明細書で使用される「イントラ予測」は、所定のフレーム内のピクセル値を、同じ所定のフレーム内の他のピクセル値に基づいて予測することを指す。フレームを符号化する間、エンコーダは、イントラブロックを(QPで)符号化するのに必要なビット数を供給する。この値はintraBits(b)と呼ばれ、intraBits(b)は、エンコーダのレート歪み最適化(RDO)プロセスで使用される統計値の1つである。一実施形態では、intra_pred_factor(i,QP)は、式405を使用して導出される。
フレーム間では、inter_intra_ratio(i,QP)値は、(QPで)必要なイントラビットに対する必要なインタービットの比である。本明細書で使用される「インタービット」という用語は、インターフレーム符号化のみを使用してフレームを符号化するの必要なビット数を指す。「インターフレーム符号化」という用語は、フレームの符号化を、フレームの前及び/又は後の1つ以上の他のフレームからの情報を使用して行い、フレーム内の他のピクセルからの情報を使用しないで行うこととして定義される。また、「イントラビット」という用語は、イントラフレーム符号化(すなわち、イントラ予測)のみを使用してフレームを符号化するのに必要なビット数を指す。interBits(b)値は、intraBits(b)値と同様にエンコーダによって供給される。一実施形態では、inter_intra_ratio(i,QP)値は、式410から導出される。
所定のフレームの符号化が完了すると、フレームiに対して次のパラメータ、すなわち、variance(i)、intra_pred_factor(i,QP)、inter_intra_ratio(i,QP)及びsize(i,QP)を使用することができる。size(i,QP)パラメータは、符号化されたフレームiのビット単位のサイズを表す。一実施形態では、実際のフレーム複雑度値(actual_complexity)が、式415を使用して導出される。一実施形態では、イントラフレームの推定複雑度値(estimated_complexity)が、式420、すなわち、estimated_complexity=variance(i)×intra_pred_factor(i,QP)を使用して導出される。一実施形態では、インターフレームの推定複雑度値が、式425、すなわち、estimated_complexity=variance(i)×intra_pred_factor(i,QP)×inter_intra_ratio(i,QP)を使用して導出される。
一実施形態では、圧縮されたフレームの好ましいサイズ(又は、SIZE)が既知である場合には、size(i,QP)<SIZEである場合に、重み係数が、式430に示す次の式、すなわち、weight=size(i,QP)/SIZEを使用して計算される。また、size(i,QP)≧SIZEの場合、重み係数が、式435に示す次の式、すなわち、weight=SIZE/size(i,QP)を使用して計算される。一実施形態では、好ましいQP(又は、QPpreferred)が既知である場合には、QP<QPpreferredの場合に、重み係数が、式440に示す次の式、すなわち、weight=QP/QPpreferredを使用して計算される。また、QP≧QPpreferredの場合に、重み係数が、式445に示す次の式、すなわち、weight=QPpreferred/QPを使用して計算される。一実施形態では、複雑度指標は、式450に示す次の式、すなわち、complex=(weight×actual_complexity)+((1-weight)×estimated_complexity)を使用して計算される。複雑度指標が計算されると、SIZE又はQPの値が、それぞれ式305又は式310を使用して導出される。
図5を参照すると、ビデオフレームを符号化する際に用いる量子化パラメータ(QP)を求める方法500の一実施形態が示されている。説明のために、本実施形態のステップ及び図6~図8のステップを順に示す。ただし、記載する方法の様々な実施形態では、記載された要素のうち1つ以上が、同時に行われてもよいし、図示した順序と異なる順序で行われてもよいし、完全に省略されてもよいことに留意されたい。他の追加の要素も、必要に応じて実行される。本明細書に記載される様々なシステム又は装置の何れも、方法500を実施するように構成されている。
エンコーダに接続された制御ロジックは、以前のビデオフレームに関連する第1のパラメータに少なくとも基づいて、複雑度指標を計算する。上述したように、複雑度指標は、以前のビデオフレームを符号化することの難易度を表す(ブロック505)。一実施形態では、第1のパラメータは、分散である。別の実施形態では、第1のパラメータは、イントラ予測係数である。さらなる実施形態では、第1のパラメータは、インター対イントラ比である。他の実施形態では、第1のパラメータは、これらのパラメータのうち複数、及び/又は、1つ以上の他のパラメータを含む。いくつかの実施形態では、制御ロジックは、2つ以上の以前のビデオフレームに関連する第1のパラメータに少なくとも基づいて、複雑度指標を計算する。
次に、制御ロジックは、複雑度指標に基づいて、及び、符号化されるビデオフレームの好ましいサイズに基づいて、量子化パラメータ(QP)値を計算する(ブロック510)。一実施形態では、QP値は、(図3の)式310を使用して計算される。一実施形態では、符号化されるビデオフレームの好ましいサイズは、符号化されるビデオストリームを伝送するための好ましいビットレートに基づいて決定される。例えば、一実施形態では、好ましいビットレートはビット/秒で指定され(例えば、3メガビット/秒(Mbps))、ビデオシーケンスのフレームレートはフレーム/秒(fps)で指定される(例えば、60fps、24fps)。この実施形態では、制御ロジックは、好ましいビットレートをフレームレートで除算して、符号化されるビデオフレームの好ましいサイズを計算する。次に、エンコーダは、現在のビデオフレームを符号化するためのQPを、制御ロジックによって計算されたQP値に設定する(ブロック515)。次に、エンコーダは、計算されたQP値で現在のビデオフレームを符号化し、符号化した現在のビデオフレームをデコーダに伝送する(ブロック520)。ブロック520の後に、方法500は終了する。
図6を参照すると、符号化されるフレームの推定サイズを、複雑度指標に基づいて計算する方法600の一実施形態が示されている。エンコーダに接続された又はエンコーダ内に組み込まれた制御ロジックは、以前のビデオフレームに関連する第1のパラメータに少なくとも基づいて、複雑度指標を計算する。ここで、複雑度指標は、以前のビデオフレームを符号化することの難易度を表す(ブロック605)。次に、制御ロジックは、複雑度指標に基づいて、及び、ビデオフレームの符号化に使用される所定のQPに基づいて、符号化されるビデオフレームの推定サイズを計算する(ブロック610)。ブロック610の後に、方法600は終了する。
図7を参照すると、ビデオフレームを符号化する際に用いるQPを求める方法700の一実施形態が示されている。エンコーダに関連する制御ロジックは、所定のビデオフレームを符号化する第1のパスに関連する第1のパラメータに少なくとも基づいて、複雑度指標を計算する。ここで、複雑度指標は、所定のビデオフレームの第1のパスの符号化における難易度を表す(ブロック705)。次に、制御ロジックは、複雑度指標に基づいて、及び、最終的に符号化される所定のビデオフレームの好ましいサイズに基づいて、量子化パラメータ(QP)値を計算する(ブロック710)。最終的に符号化される所定のビデオフレームは、所定のビデオフレームの第2のパスの符号化の出力を指す。次に、エンコーダは、所定のビデオフレームの第2のパスの符号化のためのQPを、制御ロジックによって計算されたQP値に設定する(ブロック715)。ブロック715の後に、方法700は終了する。
図8を参照すると、符号化されるフレームの推定サイズを、複雑度指標に基づいて計算する方法800の一実施形態が示されている。エンコーダに結合された制御ロジックは、所定のビデオフレームを符号化する第1のパスに関連する第1のパラメータに少なくとも基づいて、複雑度指標を計算する。ここで、複雑度指標は、所定のビデオフレームの第1のパスの符号化における難易度を表す(ブロック805)。次に、制御ロジックは、複雑度指標に基づいて、及び、所定のビデオフレームの第1のパスの符号化に使用される所定のQPに基づいて、最終的に符号化される所定のビデオフレームの推定サイズを計算する(ブロック810)。ブロック810の後に、方法800は終了する。
様々な実施形態では、ソフトウェアアプリケーションのプログラム命令を使用して、本明細書に記載された方法及び/又はメカニズムを実施する。例えば、汎用プロセッサ又は専用プロセッサによって実行可能なプログラム命令が考えられる。様々な実施形態において、そのようなプログラム命令は、高水準プログラミング言語によって表すことができる。他の実施形態では、プログラム命令は、高水準プログラミング言語からバイナリ、中間又は他の形式にコンパイルされてもよい。或いは、ハードウェアの動作又は設計を記述するプログラム命令を書き込むことができる。このようなプログラム命令を、C等の高水準のプログラミング言語によって表すことができる。或いは、Verilog等のハードウェア設計言語(HDL)を使用することができる。様々な実施形態では、プログラム命令は、様々な非一時的なコンピュータ可読記憶媒体の何れかに記憶される。記憶媒体は、プログラム実行のためにプログラム命令をコンピューティングシステムに提供するために、使用中にコンピューティングシステムによってアクセス可能である。一般的に、このようなコンピューティングシステムは、少なくとも1つのメモリと、プログラム命令を実行することができる1つ以上のプロセッサと、を含む。
上記の実施形態は、実施形態の非限定的な例に過ぎないことを強調しておきたい。上記の開示が十分に認識されると、当業者には多数の変形及び修正が明らかになるであろう。以下の特許請求の範囲は、このような変形及び修正の全てを包含すると解釈されることが意図されている。

Claims (20)

  1. ビデオストリームのビデオフレームを符号化するように構成されたエンコーダと、
    前記エンコーダに結合された制御ロジックと、を備え、
    前記制御ロジックは、
    以前のビデオフレームを符号化することの難易度を表す複雑度指標を計算することと、
    前記複雑度指標と、符号化されるビデオフレームの好ましいサイズと、に基づいて量子化パラメータ(QP)値を計算することと、
    を行うように構成されており、
    前記エンコーダは、
    QPを、前記制御ロジックによって計算されたQP値に設定することによって、現在のビデオフレームを表す符号化されたビデオフレームを生成することと、
    前記符号化されたビデオフレームをデコーダに伝送して表示させることと、
    を行うように構成されている、
    システム。
  2. 前記複雑度指標は、前記以前のビデオフレームに関連する第1のパラメータに少なくとも部分的に基づいており、分散、イントラ予測係数及びインター対イントラ比のうち1つ以上に対応する、
    請求項1のシステム。
  3. 前記イントラ予測係数は、所定のQPでの前記以前のビデオフレームに対するイントラ予測の有効度を表す、
    請求項2のシステム。
  4. 前記インター対イントラ比は、所定のQPでの前記以前のビデオフレームのインター符号化ビットとイントラ符号化ビットとの比率を表す、
    請求項2のシステム。
  5. 前記制御ロジックは、前記ビデオストリームの2つ以上の以前のビデオフレームに基づいて、前記複雑度指標を計算するように構成されている、
    請求項1のシステム。
  6. 前記符号化されるビデオフレームの好ましいサイズは、符号化されるビデオビットストリームの好ましいビットレートに基づいて計算される、
    請求項1のシステム。
  7. 前記制御ロジックは、次のビデオフレームを符号化するための次の複雑度指標を生成する場合に用いるために、前記現在のビデオフレームに基づいて、1つ以上のパラメータを生成するように構成されている、
    請求項1のシステム。
  8. 制御ロジックが、以前のビデオフレームを符号化することの難易度に基づいて複雑度指標を計算することと、
    前記制御ロジックが、前記複雑度指標と、符号化されるビデオフレームの好ましいサイズと、に基づいて量子化パラメータ(QP)値を計算することと、
    エンコーダが、QPを、前記制御ロジックによって計算されたQP値に設定することによって、現在のビデオフレームを表す符号化されたビデオフレームを生成することと、
    前記エンコーダが、前記符号化されたビデオフレームをデコーダに伝送して表示させることと、を含む、
    方法。
  9. 前記複雑度指標は、前記以前のビデオフレームに関連する第1のパラメータに少なくとも部分的に基づいており、分散、イントラ予測係数及びインター対イントラ比のうち1つ以上に対応する、
    請求項8の方法。
  10. 前記イントラ予測係数は、所定のQPでの前記以前のビデオフレームに対するイントラ予測の有効度を表す、
    請求項9の方法。
  11. 前記インター対イントラ比は、所定のQPでの前記以前のビデオフレームのインター符号化ビットとイントラ符号化ビットとの比率を表す、
    請求項9の方法。
  12. 前記ビデオストリームの2つ以上の以前のビデオフレームに基づいて、前記複雑度指標を計算することを含む、
    請求項8の方法。
  13. 前記符号化されるビデオフレームの好ましいサイズは、符号化されるビデオビットストリームの好ましいビットレートに基づいて計算される、
    請求項8の方法。
  14. 次のビデオフレームを符号化するための次の複雑度指標を生成する場合に用いるために、前記現在のビデオフレームに基づいて、1つ以上のパラメータを生成することを含む、
    請求項8の方法。
  15. メモリと、
    前記メモリに結合されたエンコーダと、
    前記エンコーダに結合された制御ロジックと、を備え、
    前記制御ロジックは、
    以前のビデオフレームを符号化することの難易度に基づいて複雑度指標を計算することと、
    前記複雑度指標と、符号化されるビデオフレームの好ましいサイズと、に基づいて量子化パラメータ(QP)値を計算することと、
    を行うように構成されており、
    前記エンコーダは、
    QPを、前記制御ロジックによって計算されたQP値に設定することによって、現在のビデオフレームを表す符号化されたビデオフレームを生成することと、
    前記符号化されたビデオフレームをデコーダに伝送して表示させることと、
    を行うように構成されている、
    装置。
  16. 前記複雑度指標は、前記以前のビデオフレームに関連する第1のパラメータに少なくとも部分的に基づいており、分散、イントラ予測係数及びインター対イントラ比のうち1つ以上に対応する、
    請求項15の装置。
  17. 前記イントラ予測係数は、所定のQPでの前記以前のビデオフレームに対するイントラ予測の有効度を表す、
    請求項16の装置。
  18. 前記インター対イントラ比は、所定のQPでの前記以前のビデオフレームのインター符号化ビットとイントラ符号化ビットとの比率を表す、
    請求項16の装置。
  19. 前記制御ロジックは、前記ビデオストリームの2つ以上の以前のビデオフレームに基づいて、前記複雑度指標を計算するように構成されている、
    請求項15の装置。
  20. 前記符号化されるビデオフレームの好ましいサイズは、符号化されるビデオビットストリームの好ましいビットレートに基づいて計算される、
    請求項15の装置。
JP2021520135A 2018-10-31 2019-06-25 低遅延ビデオ符号化のための効率的な量子化パラメータ予測方法 Active JP7265622B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/177,156 US10924739B2 (en) 2018-10-31 2018-10-31 Efficient quantization parameter prediction method for low latency video coding
US16/177,156 2018-10-31
PCT/IB2019/055357 WO2020089701A1 (en) 2018-10-31 2019-06-25 Efficient quantization parameter prediction method for low latency video coding

Publications (2)

Publication Number Publication Date
JP2022504772A true JP2022504772A (ja) 2022-01-13
JP7265622B2 JP7265622B2 (ja) 2023-04-26

Family

ID=70325678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021520135A Active JP7265622B2 (ja) 2018-10-31 2019-06-25 低遅延ビデオ符号化のための効率的な量子化パラメータ予測方法

Country Status (6)

Country Link
US (1) US10924739B2 (ja)
EP (1) EP3874748A4 (ja)
JP (1) JP7265622B2 (ja)
KR (1) KR102611939B1 (ja)
CN (1) CN112913238A (ja)
WO (1) WO2020089701A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11843772B2 (en) 2019-12-06 2023-12-12 Ati Technologies Ulc Video encode pre-analysis bit budgeting based on context and features
CN117837141A (zh) * 2021-09-03 2024-04-05 谷歌有限责任公司 用于流式传输应用的多尝试编码操作
CN114071142B (zh) * 2021-10-20 2024-06-11 镕铭微电子(济南)有限公司 一种基于硬件编码器的码率控制方法及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0646411A (ja) * 1992-07-24 1994-02-18 Toshiba Corp 画像符号化装置
JPH0775095A (ja) * 1993-09-03 1995-03-17 Toshiba Corp レート制御回路
JP2003230151A (ja) * 2001-11-30 2003-08-15 Sony Corp プログラム、記録媒体、並びに画像符号化装置および方法
US20030185299A1 (en) * 2001-11-30 2003-10-02 Taro Takita Program, recording medium, and image encoding apparatus and method
US20070071094A1 (en) * 2005-09-26 2007-03-29 Naomi Takeda Video encoding method, apparatus, and program

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040076034A (ko) 2003-02-24 2004-08-31 삼성전자주식회사 동 영상의 가변 비트율 부호화 방법 및 장치
US20050047504A1 (en) 2003-09-03 2005-03-03 Sung Chih-Ta Star Data stream encoding method and apparatus for digital video compression
JP4063204B2 (ja) * 2003-11-20 2008-03-19 セイコーエプソン株式会社 画像データ圧縮装置及びエンコーダ
US7869503B2 (en) * 2004-02-06 2011-01-11 Apple Inc. Rate and quality controller for H.264/AVC video coder and scene analyzer therefor
US8155189B2 (en) * 2005-10-19 2012-04-10 Freescale Semiconductor, Inc. System and method of coding mode decision for video encoding
US8798140B2 (en) * 2009-01-27 2014-08-05 Nvidia Corporation Encoding video frames in a video encoder
US20120026394A1 (en) * 2010-07-30 2012-02-02 Emi Maruyama Video Decoder, Decoding Method, and Video Encoder
US8804820B2 (en) * 2011-04-21 2014-08-12 Dialogic Corporation Rate control with look-ahead for video transcoding
GB2498992B (en) * 2012-02-02 2015-08-26 Canon Kk Method and system for transmitting video frame data to reduce slice error rate
US9485515B2 (en) 2013-08-23 2016-11-01 Google Inc. Video coding using reference motion vectors
CN103747237B (zh) * 2013-02-06 2015-04-29 华为技术有限公司 视频编码质量的评估方法及设备
US9998750B2 (en) 2013-03-15 2018-06-12 Cisco Technology, Inc. Systems and methods for guided conversion of video from a first to a second compression format
US9426475B2 (en) 2013-06-25 2016-08-23 VIXS Sytems Inc. Scene change detection using sum of variance and estimated picture encoding cost
GB2523736B (en) * 2014-02-19 2020-03-25 Advanced Risc Mach Ltd Rate control in video encoding
US9621917B2 (en) 2014-03-10 2017-04-11 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
US10397574B2 (en) * 2014-05-12 2019-08-27 Intel Corporation Video coding quantization parameter determination suitable for video conferencing
US20160234496A1 (en) 2015-02-09 2016-08-11 Qualcomm Incorporated Near visually lossless video recompression
US10284849B2 (en) * 2015-04-13 2019-05-07 Qualcomm Incorporated Quantization parameter (QP) calculation for display stream compression (DSC) based on complexity measure
FR3040849A1 (fr) * 2015-09-04 2017-03-10 Stmicroelectronics (Grenoble 2) Sas Procede de compression d'un flux de donnees video
US20170280139A1 (en) * 2016-03-22 2017-09-28 Qualcomm Incorporated Apparatus and methods for adaptive calculation of quantization parameters in display stream compression
JP6857973B2 (ja) * 2016-06-14 2021-04-14 キヤノン株式会社 画像符号化装置及びその制御方法
US10291931B2 (en) 2016-10-13 2019-05-14 Ati Technologies Ulc Determining variance of a block of an image based on a motion vector for the block
US10904552B2 (en) 2018-02-15 2021-01-26 Intel Corporation Partitioning and coding mode selection for video encoding

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0646411A (ja) * 1992-07-24 1994-02-18 Toshiba Corp 画像符号化装置
JPH0775095A (ja) * 1993-09-03 1995-03-17 Toshiba Corp レート制御回路
JP2003230151A (ja) * 2001-11-30 2003-08-15 Sony Corp プログラム、記録媒体、並びに画像符号化装置および方法
US20030185299A1 (en) * 2001-11-30 2003-10-02 Taro Takita Program, recording medium, and image encoding apparatus and method
US20070071094A1 (en) * 2005-09-26 2007-03-29 Naomi Takeda Video encoding method, apparatus, and program
JP2007089035A (ja) * 2005-09-26 2007-04-05 Toshiba Corp 動画像符号化方法、装置及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUN GU LEE, ET AL.: "An Intra-Frame Rate Control Algorithm for Ultralow Delay H.264/Advanced Video Coding (AVC)", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. Volume: 19, Issue: 5, May 2009, JPN6022035140, 16 March 2009 (2009-03-16), pages 747 - 752, ISSN: 0004855146 *

Also Published As

Publication number Publication date
KR20210068569A (ko) 2021-06-09
EP3874748A1 (en) 2021-09-08
CN112913238A (zh) 2021-06-04
KR102611939B1 (ko) 2023-12-08
US20200137390A1 (en) 2020-04-30
JP7265622B2 (ja) 2023-04-26
WO2020089701A1 (en) 2020-05-07
EP3874748A4 (en) 2022-08-17
US10924739B2 (en) 2021-02-16

Similar Documents

Publication Publication Date Title
JP7221957B2 (ja) ビデオエンコーダレンダリング向けのゲームエンジンアプリケーション
US10321138B2 (en) Adaptive video processing of an interactive environment
JP6226490B2 (ja) 小待ち時間レート制御システムおよび方法
JP7265623B2 (ja) コンテンツ適応量子化強度及びビットレートモデリング
JP4390112B2 (ja) ビデオシーケンスのレートを制御する方法及び装置並びにビデオ符号化装置
US20190104311A1 (en) Server-based encoding of adjustable frame rate content
JP7265622B2 (ja) 低遅延ビデオ符号化のための効率的な量子化パラメータ予測方法
CN106162199B (zh) 带反向信道消息管理的视频处理的方法和系统
US20100079575A1 (en) Processing Aspects of a Video Scene
Nguyen et al. A client-based adaptation framework for 360-degree video streaming
US20210185313A1 (en) Residual metrics in encoder rate control system
Korneev et al. How to Model Cloud VR: An Empirical Study of Features That Matter
US20140289369A1 (en) Cloud-based system for flash content streaming
Lv et al. Unequal error protection for 360 VR video based on expanding window fountain codes
Uhrina et al. The impact of bitrate and packet loss on the video quality of H. 264/AVC compression standard
JP2024514060A (ja) ストリーミングアプリケーションにおけるビデオデータの微調整
CN117812268A (zh) 视频转码方法、装置、设备以及介质
CN118450123A (zh) 一种图像编码方法、装置、设备及存储介质
CN118803390A (zh) 客服视频流生成方法、装置、设备、介质及程序产品
Liu et al. Improved methods for initializing RQ model parameters and quantization parameter in H. 264 rate control
CN116391354A (zh) 用于云游戏的内容自适应信噪比引导的两遍次视频编码
KR20050083672A (ko) 비디오 시퀀스의 레이트를 제어하는 방법 및 장치, 비디오부호화 장치
Rao et al. A Cross-Layer Framework for Adaptive Video Streaming over IEEE 802.11 Wireless Networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220823

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230414

R150 Certificate of patent or registration of utility model

Ref document number: 7265622

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150