[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

TW202344060A - 運動向量預測 - Google Patents

運動向量預測 Download PDF

Info

Publication number
TW202344060A
TW202344060A TW112126787A TW112126787A TW202344060A TW 202344060 A TW202344060 A TW 202344060A TW 112126787 A TW112126787 A TW 112126787A TW 112126787 A TW112126787 A TW 112126787A TW 202344060 A TW202344060 A TW 202344060A
Authority
TW
Taiwan
Prior art keywords
motion vector
block
mvp
video
candidates
Prior art date
Application number
TW112126787A
Other languages
English (en)
Other versions
TWI859984B (zh
Inventor
陳義文
錢威俊
孫宇辰
章立
李聖元
李想
莊孝強
陳建樂
法迪姆 塞瑞金
馬塔 卡茲維克茲
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW202344060A publication Critical patent/TW202344060A/zh
Application granted granted Critical
Publication of TWI859984B publication Critical patent/TWI859984B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • H04N19/433Hardware specially adapted for motion estimation or compensation characterised by techniques for memory access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本發明提供一種視訊寫碼器,其可判定視訊資料之一當前圖像之一不鄰近區塊的一運動向量。該不鄰近區塊不鄰近於該當前圖像之一當前區塊。此外,該視訊寫碼器基於該不鄰近區塊之該運動 向量判定該當前區塊之一運動向量預測子(MVP)。該視訊寫碼器可判定該當前區塊之一運動向量。該視訊寫碼器亦可基於該當前區塊之該運動向量判定一預測性區塊。

Description

運動向量預測
本發明係關於經組態以執行視訊寫碼之裝置。
數位視訊能力可併入至廣泛範圍之裝置中,該等裝置包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄裝置、數位媒體播放器、視訊遊戲裝置、視訊遊戲控制台、蜂巢式或衛星無線電電話(所謂的「智慧型電話」)、視訊電話會議裝置、視訊串流裝置及其類似者。數位視訊裝置實施視訊壓縮技術,諸如由 MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4第10部分進階視訊寫碼(AVC)定義之標準、或ITU-TH.265、高效視訊寫碼(HEVC)標準及此等標準的擴展中所描述之技術。視訊裝置可藉由實施此等視訊壓縮技術而更高效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊壓縮技術可執行空間(圖像內)預測及/或時間(圖像間)預測來減少或移除視訊序列中固有的冗餘。對於基於區塊之視訊寫碼,視訊圖塊(例如視訊圖框或視訊圖框之一部分)可分割成視訊區塊,諸如寫碼樹型區塊及寫碼區塊。空間或時間預測產生用於待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。為了進一步壓縮,可將殘餘資料自像素域變換至變換域,從而導致可接著進行量化之殘餘變換係數。
一般而言,本發明描述與運動向量預測有關的技術。本 發明之技術可應用於現有視訊編碼解碼器中之任一者(諸如HEVC(高效視訊寫碼))或任何未來視訊寫碼標準。
在一個實例中,本發明描述一種解碼視訊資料之方法,該方法包含:藉由一視訊解碼器判定該視訊資料之一當前圖像之一不鄰近區塊的一運動向量,該不鄰近區塊不鄰近於該當前圖像之一當前區塊 ;藉由該視訊解碼器基於該不鄰近區塊之該運動 向量判定該當前區塊之一運動向量預測子(MVP);藉由該視訊解碼器基於該當前區塊之該MVP判定該當前區塊之一運動向量;藉由該視訊解碼器基於該當前區塊之該運動向量判定一預測性區塊;藉由該視訊解碼器基於該預測性區塊重構該當前圖像之樣本值。
在另一實例中,本發明描述一種編碼視訊資料之方法,該方法包含:藉由一視訊編碼器判定該視訊資料之一當前圖像之一不鄰近區塊的一運動向量,該不鄰近區塊不鄰近於該當前圖像之一當前區塊 ;藉由該視訊編碼器基於該不鄰近區塊之該運動 向量判定該當前區塊之一運動向量預測子(MVP);藉由該視訊編碼器判定該當前區塊之一運動 向量,其中該運動向量等於該當前區塊之該MVP之一運動向 量或等於該當前區塊之該MVP之該運動向量加在一位元串流中發信之一運動向量差(MVD);藉由該視訊編碼器基於該當前區塊之該運動向量判定一預測性區塊;及藉由該視訊編碼器基於該預測性區塊產生殘餘樣本值。
在另一實例中,本發明描述一種用於解碼視訊資料之設備,該設備包含:一或多個儲存媒體,其經組態以儲存視訊資料;及一或多個處理器,其經組態以:判定該視訊資料之一當前圖像之一不鄰近區塊之一運動向量,該不鄰近區塊不鄰近於該當前圖像之一當前區塊 ;基於該不鄰近區塊之該運動向量判定該當前區塊之一運動向量預測子(MVP);基於該當前區塊之該MVP判定該當前區塊之一運動向 量;基於該當前區塊之該運動向量判定一預測性區塊;及基於該預測性區塊重構該當前圖像之樣本值。
在另一實例中,本發明描述一種用於編碼視訊資料之設備,該方法包含:藉由一視訊編碼器判定該視訊資料之一當前圖像之一不鄰近區塊之一運動向量,該不鄰近區塊不鄰近於該當前圖像之一當前區塊;藉由該視訊編碼器基於該不鄰近區塊之該運動向量判定該當前區塊之一運動向量預測子(MVP);藉由該視訊編碼器判定該當前區塊之一運動 向量,其中該運動向量等於該當前區塊之該MVP之一運動 向量或等於該當前區塊之該MVP之該運動向量加在一位元串流中發信之一運動向量差(MVD);藉由該視訊編碼器基於該當前區塊之該運動 向量判定一預測性區塊;及藉由該視訊編碼器基於該預測性區塊產生殘餘樣本值。
在另一實例中,本發明描述一種用於解碼視訊資料之設備,該設備包含:用於判定該視訊資料之一當前圖像之一不鄰近區塊之一運動向量的構件,該不鄰近區塊不鄰近於該當前圖像之一當前區塊 ;用於基於該不鄰近區塊之該運動向量判定該當前區塊之一運動向量預測子(MVP)的構件;用於基於該當前區塊之該MVP判定該當前區塊之一運動向量的構件;用於基於該當前區塊之該運動向量判定一預測性區塊的構件;及用於基於該預測性區塊重構該當前圖像之樣本值的構件。
在另一實例中,本發明描述一種用於編碼視訊資料之設備,該設備包含:用於判定該視訊資料之一當前圖像之一不鄰近區塊之一運動向量的構件,該不鄰近區塊不鄰近於該當前圖像之一當前區塊 ;用於基於該不鄰近區塊之該運動向量判定該當前區塊之一運動向量預測子(MVP)的構件;用於判定該當前區塊之一運動向量的構件,其中該運動向量等於該當前區塊之該MVP之一運動向量或等於該當前區塊之該MVP之該運動向量加在一位元串流中發信之一運動向 量差(MVD);用於基於該當前區塊之該運動向量判定一預測性區塊的構件;及用於基於該預測性區塊產生殘餘樣本值的構件。
在另一實例中,本發明描述一種儲存指令之電腦可讀儲存媒體,該等指令在執行時致使一或多個處理器進行以下操作 :判定該視訊資料之一當前圖像之一不鄰近區塊之一運動向量,該不鄰近區塊不鄰近於該當前圖像之一當前區塊;基於該不鄰近區塊之該運動向量判定該當前區塊之一運動向量預測子(MVP);基於該當前區塊之該 MVP 判定該當前區塊之一運動向量;基於該當前區塊之該運動向量判定一預測性區塊;及基於該預測性區塊重構該當前圖像之樣本值。
在另一實例中,本發明描述一種儲存指令之電腦可讀儲存媒體,該等指令在執行時致使一或多個處理器進行以下操作 :判定該視訊資料之一當前圖像之一不鄰近區塊之一運動向量,該不鄰近區塊不鄰近於該當前圖像之一當前區塊;基於該不鄰近區塊之該運動向量判定該當前區塊之一運動向量預測子(MVP);判定該當前區塊之一運動向量,其中該運動向量等於該當前區塊之該MVP之一運動向量或等於該當前區塊之該MVP 之該運動向量加在一位元串流中發信之一運動向量差(MVD);基於該當前區塊之該運動向量判定一預測性區塊;及基於該預測性區塊產生殘餘樣本值。
在隨附圖式及以下描述中闡述本發明之一或多個態樣的細節。本發明中所描述之技術的其他特徵、目標及優點將自描述、圖式及申請專利範圍顯而易見。
本申請案主張2017年6月13日申請之美國臨時專利申請案第 62/519,007號之權益,該臨時專利申請案之全部內容以引用之方式併入。
隨著視訊壓縮改良,用以表示運動向量之經編碼資料的比例已上升。因此,為達成較大視訊壓縮,可能需要改良編碼運動向量之方式。出於許多原因而需要達成較大視訊壓縮,原因諸如能夠經由現有基礎架構發送較高品質視訊資料、減少網路擁擠,等。運動向量預測為減少用以編碼區塊之運動向量的資料量之一個共同方式。在大多數運動 向量預測系統中,視訊編碼器判定區塊之運動向量預測子之清單,選擇一運動向量預測子,且接著發信所選擇運動向量之清單中的位置。視訊解碼器判定運動向量預測子之同一清單且基於位元串流中發信之資料判定所選擇運動向量預測子。視訊解碼器接著可使用運動 向量預測子以判定區塊之一或多個運動向量。
本發明描述可藉由更充分使用經重構運動向量資訊改良運動向量預測,且藉此潛在地改良視訊壓縮效率的技術。舉例而言 ,本發明描述使用來自在空間上不鄰近於當前圖像之當前區塊的當前圖像之一或多個區塊的運動向量預測子的技術。在此實例中,視訊寫碼器(例如視訊編碼器或視訊解碼器)可判定視訊資料之當前圖像之不鄰近區塊之運動向量。不鄰近區塊不鄰近於當前圖像之當前區塊。此外,在此實例中,視訊寫碼器可基於不鄰近區塊之運動向量判定當前區塊之運動向量預測子(MVP)。視訊寫碼器接著可判定(例如基於當前區塊之MVP)當前區塊之運動向量。另外,視訊寫碼器可基於當前區塊之運動向量判定預測性區塊。
此外,本發明描述用於產生合成運動向量候選者的技術。本發明亦描述用於產生額外時間運動向量預測子候選者的技術。另外,本發明描述使用來自在空間上不鄰近於當前圖像之當前區塊的當前圖像之一或多個區塊的框內預測模式以判定用於當前區塊之最可能框內預測模式之集合中的一或多個最可能框內預測模式的技術。本 發明之技術或其子組合可一起或單獨地使用。
圖1為說明可利用本發明之技術之實例視訊編碼及解碼系統10的方塊圖。如圖1中所示,系統10包括提供稍後將由目的地裝置14解碼之經編碼視訊資料的源裝置12。源裝置12可為用於編碼視訊資料之設備且目的地裝置14可為用於解碼視訊資料之設備。特定言之,源裝置12經由電腦可讀媒體16將經編碼視訊資料提供至目的地裝置 14 。源裝置12及目的地裝置14可包含廣泛範圍之裝置及設備中之任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、諸如所謂的「智慧型」電話之電話手持機、平板電腦、電視、攝影機、顯示裝置、數位媒體播放器、視訊遊戲控制台、視訊串流裝置或其類似者。在一些情況下,源裝置12及目的地裝置14經裝備用於無線通信。因此,源裝置12及目的地裝置14可為無線通信裝置。可將本發明中所描述之技術應用於無線及/或有線應用。源裝置12為實例視訊編碼裝置(亦即,用於編碼視訊資料之裝置)。目的地裝置14為實例視訊解碼裝置(亦即,用於解碼視訊資料之裝置)。
圖1之所說明系統10僅係一個實例。用於處理視訊資料之技術可由任何數位視訊編碼及/或解碼裝置來執行。在一些實例中,該等技術可由視訊編碼器/解碼器(通常稱為「編碼解碼器」) 執行。源裝置12及目的地裝置14為源裝置12產生經寫碼視訊資料用於傳輸至目的地裝置14 之此類寫碼裝置的實例。在一些實例中,源裝置12及目的地裝置14以實質上對稱方式操作,使得源裝置12及目的地裝置14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援源裝置12與目的地裝置14之間的單向或雙向視訊傳輸,例如用於視訊串流、視訊播放、視訊廣播或視訊電話。
在圖1之實例中,源裝置12包括視訊源18、經組態以儲存視訊資料之儲存媒體19、視訊編碼器20及輸出介面22。目的地裝置14包括輸入介面26、經組態以儲存經編碼視訊資料之儲存媒體28、視訊解碼器30及顯示裝置32。在其他實例中,源裝置12及目的地裝置14包括其他組件或配置。舉例而言,源裝置12可自外部視訊源(諸如,外部攝影機)接收視訊資料。同樣地,目的地裝置14可與外部顯示裝置介接,而非包括整合顯示裝置。
視訊源18為視訊資料之源。視訊資料可包含一系列圖像。視訊源18可包括視訊俘獲裝置,諸如視訊攝影機、含有先前俘獲之視訊的視訊檔案庫及/或用以自視訊內容提供者接收視訊資料之視訊饋送介面。在一些實例中,視訊源18產生基於電腦圖形之視訊資料,或實況視訊、存檔視訊及電腦產生視訊之組合。儲存媒體19可經組態以儲存視訊資料。在每一情況下,所俘獲、所預俘獲或電腦產生視訊可藉由視訊編碼器20編碼。
輸出介面22可將經編碼視訊資訊輸出至電腦可讀媒體 16。輸出介面22可包含各種類型之組件或裝置。舉例而言,輸出介面22可包含無線傳輸器、數據機、有線網路連接組件(例如,乙太網路卡)或另一實體組件。在輸出介面22包含無線傳輸器之實例中,輸出介面22 可經組態以傳輸根據蜂巢式通信標準(諸如4G、4G-LTE、進階LTE、5G及類似者)調變的資料,諸如經編碼視訊資料。在輸出介面22包含無線傳輸器之一些實例中,輸出介面22可經組態以傳輸根據其他無線標準(諸如IEEE 802.11規範、IEEE 802.15規範(例如ZigBee ™)、Bluetooth ™標準及類似者)調變的資料,諸如經編碼視訊資料。在一些實例中,輸出介面22之電路整合於源裝置12之視訊編碼器20及/或其他組件之電路中。舉例而言,視訊編碼器20及輸出介面22 可為系統單晶片(SoC)之部分。SoC亦可包括其他組件,諸如,通用微處理器、圖形處理單元等。
目的地裝置14可經由電腦可讀媒體16接收待解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼視訊資料自源裝置 12 移動至目的地裝置14的任一類型之媒體或裝置。在一些實例中,電腦可讀媒體16包含通信媒體以使源裝置12能夠即時地將經編碼視訊資料直接傳輸至目的地裝置14。通信媒體可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全域網路)之部分。通信媒體可包括路由器、交換器、基地台或可用於促進自源裝置12至目的地裝置14的通信之任何其他裝備。目的地裝置14可包含經組態以儲存經編碼視訊資料及經解碼視訊資料之一或多個資料儲存媒體。
在一些實例中,輸出介面22可將諸如經編碼視訊資料之資料輸出至中間裝置,諸如儲存裝置。類似地,目的地裝置14之輸入介面26可自中間裝置接收經編碼資料。中間裝置可包括多種分佈式或本端存取之資料儲存媒體中之任一者,諸如硬碟機、藍光光碟、 DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體或用於儲存經編碼視訊資料之任何其他合適的數位儲存媒體。在一些實例中,中間裝置對應於檔案伺服器。檔案伺服器之實例包括網頁伺服器、 FTP伺服器、網路附接儲存(NAS)裝置或本機磁碟機。
目的地裝置14可經由任何標準資料連接(包括網際網路連接)而存取經編碼之視訊資料。此可包括無線通道(例如Wi-Fi連接)、有線連接(例如DSL、電纜數據機等),或適合於存取儲存於檔案伺服器上之經編碼視訊資料的兩者之組合。自儲存裝置的經編碼視訊資料之傳輸可為串流傳輸、下載傳輸或其組合。
電腦可讀媒體16可包括暫時性媒體,諸如無線廣播或有線網路傳輸,或儲存媒體 (亦即,非暫時性儲存媒體),諸如硬碟、快閃驅動器、緊密光碟、數位視訊光碟、藍光光碟或其他電腦可讀媒體。 在一些實例中,網路伺服器(圖中未示)可自源裝置12接收經編碼視訊資料且例如,經由網路傳輸提供經編碼視訊資料至目的地裝置14。類似地,諸如光碟衝壓設施之媒體生產設施的運算裝置可自源裝置12接收經編碼視訊資料且生產含有經編碼視訊資料之光碟。因此,在各種實例中,電腦可讀媒體16可理解為包括各種形式之一或多個電腦可讀媒體。
目的地裝置14之輸入介面26自電腦可讀媒體16接收資料。輸入介面26可包含各種類型之組件或裝置。舉例而言,輸入介面26可包含無線接收器、數據機、有線網路連接組件 (例如,乙太網路卡)或另一實體組件。在輸入介面26包含無線接收器之實例中,輸入介面26 可經組態以接收根據蜂巢式通信標準 ( 諸如,4G、4G-LTE、進階LTE、5G及類似者)調變之資料,諸如,位元串流。在輸入介面26包含無線接收器之一些實例中,輸入介面26可經組態以接收根據諸如IEEE  802.11規範、IEEE 802.15規範(例如,ZigBee ™)、Bluetooth™標準及其類似者之其他無線標準而調變的資料,諸如位元串流。在一些實例中,輸入介面26之電路可整合於目的地裝置14之視訊解碼器30及/或其他組件之電路中。舉例而言,視訊解碼器30及輸入介面26可為SoC之部分。SoC 亦可包括其他組件,諸如,通用微處理器、圖形處理單元等。
儲存媒體28可經組態以儲存經編碼視訊資料,諸如藉由輸入介面26接收之經編碼視訊資料(例如,位元串流)。顯示裝置32將經解碼視訊資料顯示給使用者。顯示裝置32可包含各種顯示裝置中之任一者,該等顯示裝置諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示裝置。
視訊編碼器20及視訊解碼器30各自可實施為多種合適電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術以軟體部分地實施時,裝置可將用於軟體之指令儲存於合適之非暫時性電腦可讀媒體中,且可在硬體中使用一或多個處理器執行指令以執行本發明之技術。視訊編碼器 20 及視訊解碼器30中之每一者可包括在一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可整合為各別裝置中之組合式編碼器/解碼器(編碼解碼器)之部分。在一些實例中,視訊編碼器20及視訊解碼器30根據視訊寫碼標準或規範編碼及解碼視訊資料。舉例而言,視訊編碼器20及視訊解碼器30可根據ITU-T  H.261、ISO/IEC  MPEG-1  Visual、ITU-T  H.262或ISO/IEC MPEG-2  Visual、ITU-T  H.263、 ISO/IEC  MPEG-4  Visual及ITU-T H.264(亦被稱作ISO/IEC MPEG-4 AVC)(包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展) 或另一視訊寫碼標準或規範而編碼及解碼視訊資料。在一些實例中,視訊編碼器20及視訊解碼器30根據高效視訊寫碼(HEVC)(其被稱為 ITU-T H.265)、其範圍及螢幕內容寫碼擴展、其3D視訊寫碼擴展 (3D-HEVC)、其多視圖擴展(MV-HEVC)或其可調式擴展(SHVC)而編碼及解碼視訊資料。HEVC、SHVC及3D-HEVC已藉由ITU- T視訊寫碼專家組(VCEG)及ISO/IEC動畫專家組(MPEG)之視訊寫碼聯合協作小組 (JCT-VC)以及3D視訊寫碼擴展開發聯合協作小組(JCT-3V)開發。
ITU-T VCEG (Q6/16)及ISO/IEC MPEG (JTC 1/SC29/WG 11)現正研究對於將具有顯著超過當前HEVC標準(包括其當前擴展及針對螢幕內容寫碼及高動態範圍寫碼的近期擴展)之壓縮能力的壓縮能力之未來視訊寫碼技術標準化的潛在需要。該等群組正共同致力於聯合合作工作(被稱為聯合視訊探索小組(JVET))中之此探索活動,以評估由此領域中之專家提議的壓縮技術設計。JVET在2015年10月19日至21日期間第一次會面。ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG 11之聯合視訊探索小組(JVET)第5次會議:日內瓦,CH,2017年1月12日至20日,文件JVET   E-1001 ,Chen 等人之「Algorithm   Description   of   Joint Exploration  Test  Model  5 」為聯合探索測試模型6 (JEM5)之演算法描述。ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG 11之聯合視訊探索小組 (JVET) 第 6 次會議 : 霍巴特 , AU , 2017年3月31日至4月7日 , 文件JVET F-1001,Chen等人之「Algorithm Description of Joint Exploration Test Model 6」為聯合探索測試模型6 (JEM6)之演算法描述。視訊編碼器20 及視訊解碼器30可 根據聯合探索模型或當前處於開發中之新的通用視訊寫碼(VVC)標準來操作。
本發明通常可指「發信」特定資訊,諸如語法元素。術語「發信」可通常指用以解碼經編碼視訊資料的語法元素及/或其他資料之傳達。此傳達可即時或接近即時發生。替代性地,可歷時時間跨度而 發生此傳達,諸如當在編碼時間處,將位元串流中之語法元素儲存至電腦可讀儲存媒體時,可發生此傳達,接著,在儲存於此媒體之後可由解碼裝置在任何時間處擷取該等語法元素。
在HEVC及其他視訊寫碼規範中,視訊資料包括一系列圖像。圖像亦可被稱為「圖框」。圖像可包括一或多個樣本陣列。圖像之每一各別樣本陣列可包含各別色彩分量之樣本陣列。圖像可包括三個樣本陣列,指示為SL、SCb及SCr。SL為明度樣本之二維陣列(亦即,區塊)。SCb為Cb色度樣本之二維陣列。SCr為Cr色度樣本之二維陣列。在其他情況下,圖像可為單色的,且可僅包括明度樣本陣列。
作為編碼視訊資料之部分,視訊編碼器20可編碼視訊資料之圖像。換言之,視訊編碼器20可產生視訊資料之圖像之經編碼表示。圖像之經編碼表示在本文中可被稱作「經寫碼圖像」或「經編碼圖像」。
為產生圖像之經編碼表示,視訊編碼器20可編碼圖像之區塊。視訊編碼器20可將視訊區塊之經編碼表示包括於位元串流中。在一些實例中,為編碼圖像之區塊,視訊編碼器20執行框內預測或框間預測以產生一或多個預測性區塊。此外,視訊編碼器 20 可產生用於區塊之殘 餘 資料。殘餘區塊包含殘餘樣本。每一殘餘樣本可指示所產生之預測性區塊中之一者之樣本與區塊之對應樣本之間的差異。 以此方式,視訊編碼器20可基於預測性區塊產生殘餘樣本值。視訊編碼器20可將變換應用於殘餘樣本之區塊以產生變換係數。此外,視訊編碼器20可量化變換係數。在一些實例中,視訊編碼器20可產生一或多個語法元素以表示變換係數。視訊編碼器20可熵編碼表示變換係數之語法元素中之一或多者。
更特定言之,當根據HEVC或其他視訊寫碼規範編碼視訊資料時,為產生圖像之經編碼表示,視訊編碼器20可將圖像之每一樣本陣列分割成寫碼樹型區塊(CTB)且編碼CTB。CTB可為圖像之樣本陣列中的樣本之N×N區塊。在HEVC主規範中,CTB之大小可介於16×16至 64×64之範圍(儘管技術上可支援8×8 CTB大小)。
圖像之寫碼樹型單元(CTU)可包含一或多個CTB且可包含用以編碼該一或多個CTB之樣本的語法結構。舉例而言,每一CTU可包含明度樣本之CTB、色度樣本之兩個對應CTB,及用以編碼CTB之樣本的語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,CTU可包含單一CTB及用以編碼CTB之樣本的語法結構。CTU亦可被稱作「樹型區塊」或「最大寫碼單元」(LCU)。在本發明中,「語法結構」可經定義為按指定次序一起在位元串流中呈現的零或多個語法元素。在一些編碼解碼器中,經編碼圖像為含有圖像之所有CTU的經編碼表示。
為編碼圖像之CTU,視訊編碼器20可將CTU之CTB分割成一或多個寫碼區塊。寫碼區塊為樣本之N×N區塊。在一些編碼解碼器中,為編碼圖像之CTU,視訊編碼器20可對CTU之寫碼樹型區塊遞回地執行四分樹分割以將CTB分割成寫碼區塊,因此命名為「寫碼樹單元」。寫碼單元(CU)可包含一或多個寫碼區塊及用以編碼一或多個寫碼區塊之樣本的語法結構。舉例而言,CU可包含具有明度樣本陣列、Cb樣本陣列及Cr樣本陣列之圖像的明度樣本之寫碼區塊,及色度樣本之兩個對應寫碼區塊,及用以對寫碼區塊之樣本進行編碼的語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,CU可包含單個寫碼區塊及用以寫碼該寫碼區塊之樣本的語法結構。在HEVC中,圖塊中之最大寫碼單元被稱作寫碼樹型區塊(CTB)或寫碼樹型單元(CTU)。CTB含有四分樹,該四分樹之節點為CU。CTB之大小可介於HEVC主規範中之16×16至64×64的範圍(儘管技術上可支援8×8 CTB 大小)。寫碼單元(CU)可與CTB具有相同大小,且可小如8×8。每一寫碼單元係運用一個模式寫碼。
另外,視訊編碼器20可編碼視訊資料之圖像之CU。在一些編碼解碼器中,作為編碼CU之部分,視訊編碼器20可將CU之寫碼區塊分割成一或多個預測區塊。預測區塊為供應用相同預測的樣本之矩形(亦即,正方形或非正方形) 區塊。CU之預測單元(PU)可包含CU之一或多個預測區塊,及用以預測該一或多個預測區塊之語法結構。舉例而言,PU可包含明度樣本之預測區塊、色度樣本之兩個對應預測區塊,及用以對預測區塊進行預測之語法結構。在單色圖像或具有三個單獨色彩平 面之圖像中,PU可包含單個預測區塊及用於預測該預測區塊的語法結構。
視訊編碼器20可產生用於CU之PU的預測區塊(例如,明度、Cb及Cr預測區塊)之預測性區塊(例如,明度、Cb及Cr預測性區塊)。視訊編碼器20可使用框內預測或框間預測以產生預測性區塊。 若視訊編碼器20使用框內預測以產生預測性區塊,則視訊編碼器20可基於包括CU的圖像之經解碼樣本產生預測性區塊。 若視訊編碼器20使用框間預測以產生當前圖像之PU之預測性區塊,則視訊編碼器20可基於參考圖像(亦即,除當前圖像外之圖像) 之經解碼樣本產生PU之預測性區塊。在HEVC中,視訊編碼器20在「coding_unit」語法結構內產生用於框間預測之PU之「prediction_unit」語法結構,但不在「coding_unit」語法結構內產生用於框內預測之PU之「prediction_unit」語法結構。確切而言,在HEVC中,關於框內預測之PU之語法元素直接包括於「coding_unit 」語法結構中。當CU經框間寫碼時,CU可經進一步分割成2個或4個PU或當不應用進一步分割時變為僅一個PU。當兩個PU存在於一個CU中時,其可為一半大小的矩形或具有CU之¼或¾大小的兩個矩形大小。當CU經框間寫碼時,針對每一PU提供運動資訊之一個集合。另外,每一PU係運用唯一框間預測模式來寫碼以導出運動資訊集合。在本發明中,術語「區塊」可指CU、PU或用於視訊寫碼目的之任何其他寫碼單元。
諸如視訊編碼器20或視訊解碼器30之視訊寫碼器可使用自複數個可用框內預測模式選擇之框內預測模式執行框內預測。框內預測模式可包括定向框內預測模式,其亦可被稱作框內預測方向。不同定向框內預測模式對應於不同角。在一些實例中,為使用定向框內預測模式判定預測性區塊之當前樣本之值,視訊寫碼器可判定在對應於定 向框內預測模式之角下穿過當前樣本的線與邊界樣本集合交叉處的點。邊界樣本可包含緊靠預測性區塊左側之行中的樣本及預測性區塊正上方之列中的樣本。若該點介於邊界樣本中之兩個樣本之間,則 視訊寫碼器可內插或以其他方式判定對應於該點的值。若該點對應於邊界樣本中之單個樣本,則視訊寫碼器可判定該點之值等於邊界樣本。視訊寫碼器可將預測性區塊之當前樣本的值設定為等於該點之經判定值。
在HEVC及一些其他編碼解碼器中,視訊編碼器20使用僅僅一種預測模式(亦即,框內預測或框間預測)編碼CU。因此,在HEVC及特定其他編碼解碼器中,視訊編碼器20可使用框內預測產生CU之每一PU的預測性區塊或視訊編碼器20可使用框間預測產生CU之每一PU的預測性區塊。當視訊編碼器20使用框間預測來編碼CU時,視訊編碼器20可將CU分割成2或4個PU,或一個PU對應於整個CU。當兩個PU存在於一個CU中時,兩個PU可為一半大小的矩形或具有CU之¼或¾大小的兩個矩形大小。在HEVC中,存在用於運用框間預測模式寫碼之CU之八分割模式,亦即:PART_2N×2N、PART_2N×N、 PART_N×2N、PART_N×N、PART_2N×nU、PART_2N×nD、PART_nL×2N及PART_nR×2N。當CU經框內預測時,2N×2N及N×N為僅容許之PU形狀,且在每一PU內,單個框內預測模式經寫碼(而色度預測模式係在CU層級處發信)。
視訊編碼器20可產生CU之一或多個殘餘區塊。舉例而言,視訊編碼器20可產生CU之明度殘餘區塊。CU之明度殘餘區塊中之每一樣本指示CU之預測性明度區塊中的一者中之明度樣本與CU之原始明度寫碼區塊中之對應樣本之間的差異。另外,視訊編碼器20可產生用於CU之Cb殘餘區塊。CU之Cb殘餘區塊中之每一樣本可指示CU之預測性Cb區塊中之一者中的Cb樣本與CU之原始Cb寫碼區塊中之對應樣本之間的差異。視訊編碼器20亦可產生CU之Cr殘餘區塊。CU之Cr殘餘區塊中之每一樣本可指示CU之預測性Cr區塊之中之一者中的Cr樣本與CU之原始Cr寫碼區塊中之對應樣本之間的差異。
另外,視訊編碼器20可將CU之殘餘區塊分解為一或多個變換區塊。舉例而言,視訊編碼器20可使用四分樹分割以將CU之殘餘區塊分解成一或多個變換區塊。變換區塊為供應用相同變換的樣本之矩形(例如,正方形或非正方形)區塊。CU之變換單元(TU)可包含一或多個變換區塊。舉例而言,TU可包含明度樣本之變換區塊、色度樣本之兩個對應變換區塊,及用以對變換區塊樣本進行變換之語法結構。因此,CU之每一TU可具有明度變換區塊、Cb變換區塊以及Cr變換區塊。TU之明度變換區塊可為CU之明度殘餘區塊的子區塊。Cb變換區塊可為CU之Cb殘餘區塊之子區塊。Cr變換區塊可為CU之Cr殘餘區塊的子區塊。在單色圖像或具有三個單獨色彩平面之圖像中,TU可包含單一變換區塊及用於變換該變換區塊之樣本的語法結構。
視訊編碼器20可將一或多個變換應用於TU之變換區塊以產生TU之係數區塊。係數區塊可為變換係數之二維陣列。變換係數可為純量。在一些實例中,一或多個變換將變換區塊自像素域轉換至頻域。因此,在此等實例中,變換係數可為視為在頻域中的純量。變換係數層級為表示在按比例調整變換係數值之計算之前與解碼程序中之特定2維頻率索引相關聯之值的整數數量。
在一些實例中,視訊編碼器20將變換之應用跳至變換區塊。在此等實例中,視訊編碼器20可以與變換係數相同之方式處理殘餘樣本值。因此,在視訊編碼器20跳過變換之應用的實例中,變換係數及係數區塊之以下論述可適用於殘餘樣本之變換區塊。
根據JEM,視訊寫碼器(諸如視訊編碼器200)將圖像分割成複數個寫碼樹型單元(CTU)。視訊編碼器200可根據樹狀結構(諸如四分樹二進位樹(QTBT)結構)分割CTU。JEM之QTBT結構移除多個分割類型之概念,諸如HEVC之CU、PU及TU之間的間距。因此,在JEM之上下文中,術語「PU」或「TU」可適用於CU。JEM之QTBT結構包括兩個層級:根據四分樹分割分割的第一層級,及 根據二進位樹分割分割的第二層級。QTBT結構之根節點對應於CTU。二進位樹之葉節點對應於寫碼單元(CU)。
在一些實例中,視訊編碼器200及視訊解碼器300可使用單一QTBT結構以表示明度及色度分量中之每一者,而在其他實例中,視訊編碼器200及視訊解碼器300可使用兩個或大於兩個QTBT結構,諸如用於明度分量之一個QTBT結構及用於兩個色度分量之另一QTBT結構(或用於各別色度分量之兩個QTBT結構)。
產生係數區塊之後,視訊編碼器 20可量化係數區塊以可能地減小用以表示係數區塊之資料的量,潛在地提供進一步壓縮。量化通常係指其中值之範圍壓縮為單個值的程序。舉例而言,可藉由以常數除以值且接著捨入至最接近的整數進行量化。為量化係數區塊,視訊編碼器20可量化係數區塊之變換係數。舉例而言,量化可減小與變換係數中之一些或全部相關聯的位元深度。舉例而言,在量化期間,可將n位元變換係數降值捨入至m位元變換係數,其中n大於m。在一些實例中,視訊編碼器20跳過量化。
視訊編碼器20可產生指示一些或所有潛在地經量化的變換係數之語法元素。視訊編碼器20可熵編碼指示經量化變換係數之語法元素中之一或多者。舉例而言,視訊編碼器20可對指示經量化變換係數之語法元素執行上下文適應性二進位算術寫碼(CABAC)。因此,經編碼區塊(例如,經編碼CU)可包括指示經量化變換係數之經熵編碼語法元素。
視訊編碼器20可輸出包括經編碼視訊資料之位元串流。換言之,視訊編碼器20可輸出包括視訊資料之經編碼表示的位元串流。視訊資料之經編碼表示可包括視訊資料之圖像之經編碼 表示。舉例而言,位元串流可包含形成視訊資料及相關聯資料的經編碼圖像之 表示的位元之序列。在一些實例中,經編碼圖像之表示可包括圖像之區塊之經編碼表示。
視訊解碼器30可接收由視訊編碼器20產生之位元串流。如上文所提及,位元串流可包含視訊資料之經編碼 表示。視訊解碼器30可解碼位元串流以重構視訊資料之圖像。作為解碼位元串流之部分,視訊解碼器30可獲得來自位元串流之語法元素。視訊解碼器30可至少部分地基於自位元串流獲得之語法元素重構視訊資料之圖像。重構視訊資料之圖像的程序可大體上互逆於由視訊編碼器20執行以編碼圖像之程序。
舉例而言,作為解碼視訊資料之圖像之部分,視訊解碼器30可使用框間預測或框內預測以產生預測性區塊。此外,視訊解碼器30可基於自位元串流獲得的語法元素判定變換係數。在一些實例中,視訊解碼器30反量化經判定變換係數。反量化將經量化值映射至經重構值。舉例而言,視訊解碼器30可藉由判定一值乘以量化步長而反量化該值。 此外,視訊解碼器30可對經判定變換係數應用反變換以判定殘餘樣本之值。視訊解碼器30可基於殘餘樣本及所產生之預測性區塊之對應樣本重構圖像之區塊。舉例而言,視訊解碼器30可將殘餘樣本添加至所產生之預測性區塊之對應樣本以判定區塊之經重構樣本。
更特定言之,在HEVC及其他視訊寫碼規範中,視訊解碼器30可使用框間預測或框內預測以產生當前CU之每一PU之一或多個預測性區塊。另外,視訊解碼器30可反量化當前CU之TU之係數區塊。視訊解碼器30可對係數區塊執行反變換,以重構當前CU之TU的變換區塊。基於當前CU之PU之預測性區塊的樣本及當前CU之TU之變換區塊的殘餘樣本,視訊解碼器30可重構當前CU之寫碼區塊。在一些實例中,藉由將當前CU之PU的預測性區塊之樣本添加至當前CU之TU的變換區塊之對應經解碼樣本,視訊解碼器30可重構當前CU之寫碼區塊。藉由重構圖像之各CU的寫碼區塊,視訊解碼器30可重構圖像。
圖像之圖塊可包括圖像之整數數目個區塊。舉例而言,在HEVC及其他視訊寫碼規範中,圖像之圖塊可包括圖像之整數數目個CTU。圖塊之CTU可按掃描次序(諸如光柵掃描次序)連續排序。在HEVC及潛在地其他編碼解碼器中,圖塊定義為含於一個獨立圖塊片段及先於相同存取單元內之下一獨立圖塊片段(若存在)之所有後續相關圖塊區段(若存在)中之整數數目個CTU。此外,在HEVC及潛在地其他編碼解碼器中,圖塊片段定義為在影像塊掃描中連續排序且含於單一NAL單元中的整數數目個CTU。圖像塊掃描為分割圖像之CTB的特定順序排序,其中CTB在圖像塊中在CTB光柵掃描中經連續排序,而圖像中之圖像塊係在圖像之圖像塊的光柵掃描中經連續排序。圖像塊為圖像中之特定圖像塊行及特定圖像塊列內的CTB之矩形區。
如上文所提及,視訊寫碼器(例如視訊編碼器20或視訊解碼器30)可應用框間預測以產生用於當前圖像之視訊區塊的預測性區塊。舉例而言,在HEVC及其他視訊寫碼規範之上下文中,視訊寫碼器可應用框間預測以產生用於當前區塊之 CU的PU之預測區塊的預測性區塊。若視訊寫碼器應用框間預測以產生預測性區塊,則視訊寫碼器可基於一或多個參考圖像之經解碼樣本產生預測性區塊。參考圖像為除當前圖像以外之圖像。視訊寫碼器可判定一或多個參考圖像清單。參考圖像清單中之每一者可包括零或多個參考圖像。在HEVC及其他視訊寫碼規範之上下文中,參考圖像清單中之一者可被稱為參考圖像清單0(亦即,RefPicList0或list0)且另一參考圖像清單可被稱為參考圖像清單1(亦即,RefPicList1或list1)。
視訊寫碼器可應用單向框間預測或雙向框間預測以產生預測性區塊。當視訊寫碼器應用單向框間預測以產生用於視訊區塊之預測性區塊時,視訊寫碼器基於單一參考圖像之樣本判定用於視訊區塊之單一參考區塊。此外,當視訊寫碼器應用單向框間預測時,視訊寫碼器可將預測性區塊設定為等於參考區塊。當視訊寫碼器應用雙 向框間預測以產生視訊區塊之預測性區塊時,視訊寫碼器判定視訊區塊之兩個參考區塊。在一些實例中,兩個參考區塊係在不同參考圖像清單中之參考圖像中。另外,當視訊寫碼器應用雙向框間預測時,視訊寫碼器可基於兩個參考區塊判定預測性區塊。舉例而言,視訊寫碼器可判定預測性區塊,使得預測性區塊之每一樣本為兩個參考區塊之對應樣本的加權平均。參考清單指示符可用於指示參考圖像清單中之哪一者包括用於判定參考區塊的參考圖像。
如上文所提及,視訊寫碼器可基於參考圖像之樣本判定參考區塊。在一些實例中,視訊寫碼器可判定參考區塊,使得參考區塊之每一樣本等於參考圖像之樣本。在一些實例中,作為判定參考區塊之部分,視訊寫碼器可自參考圖像之樣本內插參考區塊 之樣本。舉例而言,視訊寫碼器可判定預測性區塊之樣本為參考圖像之兩個或大於兩個樣本的加權平均。
在一些實例中,當視訊編碼器20執行單向框間預測時,視訊編碼器20搜尋參考圖像清單中的一者之一或多個參考圖像內之參考區塊。參考區塊可為類似於預測區塊的樣本之區塊。在一些實例中,視訊編碼器20使用均方誤差以判定參考區塊與預測區塊之間的相似性。此外,視訊編碼器20可判定用於預測區塊之運動資訊。用於預測區塊之運動資訊(亦即,運動參數)可包括運動向量及參考索引。運動向量可指示當前圖像(亦即包括特定視訊區塊之圖像)內之特定視訊區塊的位置與參考圖像內之參考區塊的位置之間的空間位移。參考索引指示含有參考圖像清單之參考圖框之參考圖像清單內的位置。用於特定視訊區塊之預測性區塊可等於參考區塊。
當視訊編碼器20對於特定視訊區塊執行雙向框間預測時,視訊編碼器20可搜尋第一參考圖像清單(「清單0」)中之參考圖像內的第一參考區塊且可搜尋第二參考圖像清單(「清單1」)中之參考圖像內的第二參考區塊。視訊編碼器20可至少部分地基於第一參考區塊及第二參考區塊產生用於特定視訊區塊之預測性區塊。另外,視訊編碼器 20可產生指示特定視訊區塊與第一參考區塊之間的空間位移的第一運動向量。視訊編碼器20亦可產生識別含有第一參考區塊的參考圖像之第一參考圖像清單內之位置的第一參考索引。此外,視訊編碼器20可產生指示特定視訊區塊與第二參考區塊之間的空間位移的第二運動向量。視訊編碼器20亦可產生識別包括第二參考區塊的參考圖像之第二參考圖像清單內之位置的第二參考索引。
當視訊編碼器20對特定視訊區塊執行單向框間預測時,視訊解碼器30可使用特定視訊區塊之運動資訊以識別特定視訊區塊之參考區塊。視訊解碼器30接著可基於參考區塊產生特定視訊區塊之預測性區塊。當視訊編碼器20執行雙向框間預測以判定用於特定視訊區塊之預測性區塊時,視訊解碼器30可使用特定視訊區塊之運動資訊以判定兩個參考區塊。視訊解碼器30可基於特定視訊區塊之兩個參考樣本產生特定視訊區塊之預測性區塊。以此方式,對於單向框間預測或雙向框間預測,視訊編碼器20及視訊解碼器30可基於區塊之運動向量判定預測性區塊。
視訊編碼器20可以各種方式發信視訊單元之運動資訊。此類運動資訊可包括運動向量、參考索引、參考圖像清單指示符,及/或與運動相關之其他資料。在一些實例中,視訊編碼器20及視訊解碼器30可使用運動預測以減小用於發信運動資訊的資料之量。運動預測可包含基於一或多個其他視訊單元之運動資訊而判定視訊單元(例如, PU)之運動資訊。存在各種類型之運動預測。舉例而言,合併模式及進階運動向量預測(AMVP)模式為運動預測之兩個類型。亦即,在HEVC 標準中,存在兩個框間預測模式,分別稱為用於預測單元(PU)之合併(跳過被視為合併之特殊情況)及進階運動向量預測(AMVP)模式。在AMVP或合併模式中,針對多個運動向量預測子維持運動向量(MV) 候選者清單。參見2013年,信號處理專題 IEEE 期刊第 7 卷 , 第 6 號 , 第 957 至 968 頁 , J.-L.  Lin,  Y.-W. Chen, Y.-W. Huang 及S.-M. Lei 之「 Motion vector coding in the HEVC standard」。
在合併模式中,視訊編碼器20產生候選者清單。候選者清單包括指示一或多個源視訊單元之運動資訊的候選者之集合。源視訊單元可在空間上或在時間上鄰近當前視訊單元。此外,在合併模式中,視訊編碼器20可自候選者清單選擇候選者,且可將藉由所選擇之候選者所指示的運動資訊用作當前視訊單元之運動資訊。視訊編碼器 20可發信所選擇之候選者之候選者清單中的位置。視訊解碼器30可基於自位元串流獲得的資訊判定至候選者清單中之索引。另外,視訊解碼器 30可產生相同候選者清單且可基於該索引判定所選擇之候選者。視訊解碼器 30接著可使用所選擇候選者的運動資訊以產生用於當前視訊單元之預測性區塊。
跳過模式類似於合併模式。在跳過模式中,視訊編碼器20及視訊解碼器30以與視訊編碼器20及視訊解碼器30在合併模式中使用候選者清單之相同方式,產生且使用候選者清單。然而,當視訊編碼器20使用跳過模式發信當前視訊單元之運動資訊時,視訊編碼器20不發信用於當前視訊單元之任何殘餘資料。因此,視訊解碼器30可在不使用殘餘資料的情況下,基於藉由候選者清單中之所選擇候選者的運動資訊指示的一或多個參考區塊判定視訊單元之預測性區塊。
對於跳過模式及合併模式,合併索引經發信以指示使用合併候選者清單中之哪一候選者。不傳輸框間預測指示符、參考索引或運動向量差。在合併模式中考慮兩種或大於兩種類型之合併候選者,包括:空間運動向量預測子(SMVP)及時間運動向量預測子(TMVP)。對於SMVP導出,在定位於如圖2中所描繪的位置中之候選者當中選擇四個合併候選者中之最大。導出之次序為A1 àB1 àB0 àA0 à(B2 )。在HEVC中,僅僅當位置A1 、B1 、B0 、A0 之任一PU不可用或經框內寫碼時或在修剪(刪除)之後來自位置A1 、B1 、B0 、A0的候選者之總數小於四,才考慮位置B2 。
在TMVP之導出中,基於屬於經發信參考圖像清單內的當前圖像之參考圖像中之一者的同置PU導出按比例調整之運動向量。用於同置PU之導出的參考圖像清單可在當前圖像之圖塊的圖塊標頭中明確地發信。可使用POC距離(tb及td),運用同置PU之按比例調整運動向量獲得用於時間合併候選者之按比例調整之運動向量,其中tb定義為當前圖像之參考圖像與當前圖像之間的POC差,且td定義為同置圖像之參考圖像與同置圖像之間的POC差。時間合併候選者之參考圖像索引經設定為等於零。按比例調整程序之實務實現係描述於HEVC 草案規範中,該HEVC草案規範可自https://www.itu.int/rec/T-REC-H.265獲得。對於B圖塊,兩個運動向量(用於參考圖像清單0之一個運動向量及用於參考圖像清單1之另一運動向量)經獲得並經組合以形成雙向預測性合併候選者。
同置PU之位置係在兩個候選者位置C與H之間選擇,如圖2中所描繪。若在位置H處之PU不可用,或經框內寫碼,或在當前CTU列(亦即,含有當前PU之CTU列)外部,則使用位置C。否則,位置H用於導出時間合併候選者。
除了SMVP及TMVP之外,可存在兩種類型合成合併候選者: (1)組合之雙向預測性MVP及(2)零MVP。組合雙向預測性MVP藉由利用SMVP 及TMVP而產生。在HEVC中,組合之雙向預測性合併候選者僅僅用於B圖塊。舉例而言,原始合併候選者清單中之兩個候選者(其具有mvL0及refIdxL0或mvL1及refIdxL1)用以建立組合之雙向預測性合併候選者。零MVP具有量值0之一或多個運動向量。
在候選者選擇之程序中,按處理次序具有與前一候選者相同之運動參數的複製候選者可自候選者清單中移除。此程序定義為修剪程序。另外,不考慮同一合併估計區域(MER)內部之候選者,以便有助於並行合併處理。避免冗餘分割形狀,以便不仿真虛擬2N×2N分割。
在產生合併候選者清單中之合併候選者的每一步驟之間,若合併候選者之數目到達MaxNumMergeCand,則導出程序可停止。在HEVC及潛在地其他編碼解碼器中,MaxNumMergeCand經設定為等於五。由於候選者之數目為恆定,所以最佳合併候選者之索引可使用截短之一元二值化來編碼。
AMVP模式類似於合併模式,此係因為視訊編碼器20可產生候選者清單,且可自候選者清單選擇候選者。然而,對於用於判定當前區塊(亦即,視訊單元)之預測性區塊的每一各別參考區塊,視訊編碼器 20可發信當前區塊之各別運動向量差(MVD)、當前區塊之各別參考索引,及指示候選者清單中之所選擇候選者的各別候選者索引。區塊之MVD可指示區塊之運動向量與所選擇候選者之運動向量之間的差。當前區塊之參考索引指示供判定參考區塊的參考圖像。
此外,當使用AMVP模式時,對於在判定當前區塊之預測性區塊時使用的每一各別參考區塊,視訊解碼器30可判定當前區塊之MVD、當前區塊之參考索引,及候選者索引及運動向量預測 (MVP)旗標。視訊解碼器30可產生相同的候選者清單,且可基於候選者索引而判定候選者清單中之所選擇候選者。如前所述,此清單可包括與相同參考索引相關聯之相鄰區塊的運動向量以及時間運動向量預測子,該時間運動向量預測子係基於時間參考圖像中之同置區塊的相鄰區塊之運動參數而導出。視訊解碼器30可藉由將MVD添加至由所選擇之 AMVP候選者所指示的運動向量而恢復當前PU之運動向量。亦即,視訊解碼器30可基於藉由所選擇之AMVP候選者及MVD所指示的運動向量,判定當前PU運動向量。接著,視訊解碼器30 可使用當前PU之經恢復運動向量或運動向量,以產生用於當前PU之預測性區塊。
當視訊寫碼器(例如,視訊編碼器20或視訊解碼器30)產生用於當前PU之AMVP候選者清單時,視訊寫碼器可基於涵蓋在空間上與當前PU相鄰之位置的PU(亦即,空間相鄰PU)之運動資訊而導出一或多個AMVP候選者,且基於在時間上與當前 PU相鄰之PU之運動資訊而導出一或多個AMVP候選者。在本發明中,若PU(或其他類型之視訊單元或區塊)之預測區塊(或視訊單元之其他類型之樣本區塊)包括位置,則PU可據稱為「涵蓋」該位置。候選者清單可包括與相同參考索引相關聯的鄰近區塊之運動向量以及基於時間參考圖像中之同置區塊的鄰近區塊之運動參數 (亦即,運動資訊) 導出的時間運動向量預測子。 在 合併候選者清單或AMVP候選者清單中的基於在時間上與當前PU鄰近之PU(亦即,不同於當前PU之時間執行個體中的PU) 的運動資訊之候選者可被稱作TMVP。TMVP可用以改良HEVC之寫碼效率,且不同於其他寫碼工具,TMVP可能需要存取經解碼圖像緩衝器中,更具體而言參考圖像清單中之圖框的運動向量。
對於 AMVP 模式,框間預測指示符經傳輸以表示清單0預測、清單1預測或雙向預測。接下來,當存在多個參考圖像時傳輸一個或兩個參考索引。索引經傳輸用於每一預測方向以自候選者清單選擇一個運動候選者。如圖2 中所示,用於框間模式之候選者清單包括兩個空間運動候選者及一個時間運動候選者: 1. 左側候選者(可自A0 ,A1 獲得之第一者) 2. 頂部候選者(可自B0 ,B1 ,B2 獲得之第一者) 3. 時間候選者(可自H及C獲得之第一者)
在HEVC中,視訊寫碼器自左下方至左側(亦即A0及A1)搜尋左側空間運動候選者且視訊寫碼器選擇第一可用者作為左側候選者。視訊寫碼器自右上方至左上方(亦即B0、B1及B2)搜尋頂部空間運動候選者且視訊寫碼器選擇第一可用者作為頂部候選者。視訊寫碼器可自定位於一參考圖像中之區塊(H或C)選擇時間運動候選者,該參考圖像被稱為時間同置圖像。時間同置圖像係藉由傳輸一圖塊標頭中之指定哪一參考圖像清單的一個旗標及該圖塊標頭中之指示該參考清單中之哪一參考圖像用作同置參考圖像的一個參考索引而指示。在HEVC中,在傳輸索引之後,傳輸一個或兩個對應運動向量差(MVD)。
此外,在HEVC及潛在地其他編碼解碼器中,固定候選者清單大小用以解耦候選者清單構造及索引之剖析。為了補償由固定清單大小所引起的寫碼效能損失,額外候選者經指派給候選者清單中之空位置。在此過程中,索引係以最大長度之截短一元碼來寫碼,其中最大長度 係在圖塊標頭中傳輸以用於跳過模式及合併模式且對於框間模式固定至 2。如上文所描述,對於跳過模式及合併模式,在導出並修剪四個空間運動候選者及一個時間運動候選者之後,若可用候選者的數目小於固定候選者清單大小,則額外合成候選者經導出並經添加以填充合併候選者清單中之空位置。對於AMVP模式,在導出並修剪兩個空間運動候選者及一個時間運動候選者之後,零向量運動候選者被添加以填充AMVP候選者清單中之空位置。
在JEM 參考軟體中,存在若干框間寫碼工具,其在解碼器側導出及/或改進當前區塊之運動向量(MV)或利用仿射運動模型。下文詳述此等新的框間預測方法。
圖案匹配運動向量導出(PMMVD)模式為基於圖框速率向上轉換(FRUC)技術之特定合併模式。運用PMMVD模式,區塊之運動資訊並不被發信,但實際上在解碼器側被導出。FRUC旗標在其合併旗標為真時經發信用於區塊(例如CU)。當FRUC旗標為假時,合併索引經發信且使用常規合併模式。當FRUC旗標為真時,額外FRUC模式旗標經發信以指示哪一方法(雙向匹配或模板匹配)將用以導出用於區塊之運動資訊。
在編碼器側,與對於正常合併候選者執行一樣,關於是否使用FRUC合併模式用於CU的決策可基於速率/失真(RD)成本選擇。亦即,可藉由使用RD成本選擇針對CU檢查兩個匹配模式(雙向匹配及模板匹配)兩者。導致最小成本之模式進一步與其他CU模式相比較。若FRUC匹配模式為最高效模式,則FRUC旗標對於CU設定成真且使用相關匹配模式。
FRUC合併模式中之運動導出程序包括兩個步驟。CU層級運動搜尋可首先被執行,緊接著為子CU層級運動改進。在CU層級處,基於雙向匹配或模板匹配導出用於整個CU之初始運動向量(亦即,起始MV)。首先,產生MV候選者之清單(FRUC MV候選者)且導致最小匹配成本之候選者經選擇為起點以用於進一步 CU層級改進。接著,執行基於雙向匹配或模板匹配圍繞起點的本端搜尋且導致最小匹配成本之MV被視為用於整個CU之MV。隨後,運動資訊係在子CU層級處運用作為起點的導出之CU運動向量來進一步改進。
舉例而言,以下導出程序可經執行用於WxH CU運動資訊導出,其中W為寬度且H為高度。在第一階段,導出用於整個WxH CU之MV。在第二階段,CU經進一步分裂成MxM子CU。如下文等式(1)中計算M的值, D為在JEM中經預設地設定成3的預定義分裂深度。接著,導出用於每一子CU之MV。
如圖3中所示,雙向匹配用以藉由發現在兩個不同參考圖像中之沿著當前CU的運動軌跡的兩個區塊之間的最佳匹配而導出當前 CU之運動資訊。在假定連續運動軌跡情況下,指向兩個參考區塊之運動向量MV0及MV1與當前圖像與兩個參考圖像之間的時間距離(亦即, TD0及TD1) 成比例。作為特殊狀況,當當前圖像在時間上介於兩個參考圖像之間,且自當前圖像至兩個參考圖像之時間距離相同時,雙邊匹配變為基於鏡像之雙向MV。
如圖4中所示,模板匹配用以藉由發現當前圖像中之模板( 當前CU之上方及/或左側鄰近區塊)與參考圖像中之區塊(與模板相同大小) 之間的最佳匹配而導出當前CU之運動資訊。除前述FRUC合併模式以外,模板匹配亦應用於AMVP模式。在JEM中,類似於HEVC中,AMVP具有兩個候選者。運用模板匹配方法,導出新的候選者。若藉由模板匹配新導出之候選者不同於第一現有AMVP候選者,則新導出之候選者在AMVP候選者清單之絕對開頭處插入且接著清單大小設定成二 (意謂移除第二現有 AMVP 候選者) 。當應用於AMVP模式時,僅僅應用 CU 層級搜尋。
在CU層級FRUC MV候選者集合中,在CU層級處之MV候選者集合包含或其組成為: (i) 若當前CU在AMVP模式中,則原始AMVP候選者 (ii)所有合併候選者, (iii)經內插MV場中之若干MV,其在本發明中別處引入 (iv)上方及左側鄰近運動向量
當使用雙向匹配時,合併候選者之每一有效MV用作輸入以產生在假定雙向匹配情況下的MV對。舉例而言,合併候選者之一個有效MV為在參考清單A處的(MVa ,refa)。接著,在另一參考清單B中發現其配對雙向MV之參考圖像refb,使得refa及refb在時間上在當前圖像之不同側。若此refb 在參考清單B中並不可用,則refb 經判定為不同於refa之參考且其至當前圖像之時間距離為清單B中之最小者。在判定refb之後,藉由基於按比例調整當前圖像與refa、refb之間的時間距離導出MVb。
來自經內插MV場之四個MV亦可被添加至CU層級候選者清單。更具體言之,可添加在當前CU之位置(0,0)、(W/2,0)、(0,H/2)及(W/2,H/2)處的經內插MV。當在AMVP模式中應用FRUC時,原始AMVP候選者亦可被添加至CU層級MV候選者集合。在CU層級處,用於AMVP CU之至多15個MV及用於合併CU之至多13個MV被添加至候選者清單。在本發明中, AMVP CU為其中使用AMVP模式預測運動資訊的CU。此外,在本發明中,合併CU為其中使用合併模式預測運動資訊的CU。
在一些實例中,在子CU層級處之MV候選者集合其組成為或包含: (i) 自CU層級搜尋判定之MV, (ii)上方、左側、左上方及右上方鄰近MV, (iii)來自參考圖像之同置MV的按比例調整版本, (iv)至多4個進階時間運動向量預測(ATMVP)候選者, (v)至多4個空間時間運動向量預測(STMVP)候選者。
來自參考圖像的按比例調整之MV可導出如下。兩個清單中之所有參考圖像被橫穿。在參考圖像中的子CU之同置位置處的MV按比例調整至起始CU層級MV之參考。亦即,類似於HEVC中之TMVP,在同置位置處之MV可根據POC距離按比例調整。ATMVP及STMVP候選者限於至多四個ATMV及STMVP候選者。在子CU層級處,至多17個MV被添加至候選者清單。
如上文所提及,在CU層級FRUC MV候選者集合中,在CU層級處之MV候選者集合可包括在經內插MV場中的一或多個MV。在寫碼圖框之前,經內插運動場(亦即經內插MV場)基於單側運動估計而產生用於整個圖像。運動場接著可在稍後用作CU層級或子CU層級MV候選者。首先,兩個參考清單中之每一參考圖像之運動場可在4×4區塊層級處橫穿。圖5為圖框速率向上轉換中單側運動估計之實例。圖5中之圖像500為當前圖像之參考圖像。當前圖像具有對應於圖像 502之輸出時間的輸出時間。圖像504為圖像500之參考圖像。視訊寫碼器使用圖像500中之區塊的指向圖像504中之位置的運動向量以內插當前圖像之樣本。圖像502含有所得經內插樣本。在一些實例中,對於圖5之圖像500中的每一4×4區塊,若與4×4區塊相關聯的運動穿過當前圖像中之4×4區塊且該4×4區塊尚未指派任一經內插運動,則參考區塊之運動根據時間距離TD0及TD1而按比例調整至當前圖像(與HEVC中TMVP之MV按比例調整的方式相同的方式)且按比例調整之運動經指派給當前圖框中之區塊。若無按比例調整之MV經指派給當前圖框中之4×4區塊,則當前圖框中之區塊的運動在經內插運動場中標記為不可用。在其他實例中,可使用其他區塊大小。
當運動向量指向分數樣本位置時,可需要經運動補償之內插。經運動補償之內插可自圖像之實際樣本內插圖像之實際樣本之間的位置之樣本值。為將經運動補償之內插的複雜度保持為低,雙線性內插(而非常規8抽頭HEVC內插)可以用於雙向匹配及模板匹配兩者。匹配成本之計算在不同步驟處係不同的。舉例而言,當自在 CU層級處之候選者集合中選擇最佳候選者時,匹配成本為雙向匹配或模板匹配之絕對總和差(SAD)。在判定起始MV之後,可使用下文等式(2)計算匹配成本C: 在等式(2)中,W為憑經驗設定成4之加權因數,MV及MV S分別指示當前MV及起始MV( MV xMV x S 分別為當前MV及起始MV之水平分量; MV yMV y S 分別為當前MV及起始MV之垂直分量),且|∙|指示絕對值。
在一些實例中,在FRUC模式中,藉由僅僅使用明度樣本導出MV。在此等實例中,所導出運動可以用於明度及色度兩者以用於運動補償框間預測。在MV導出之後,使用用於明度之8抽頭內插濾波器及用於色度之4抽頭內插濾波器執行最終運動補償。
MV改進可包括運用雙向匹配成本或模板匹配成本之準則的基於圖案之MV搜尋。在JEM中,支援兩個搜尋圖案:(1)無限制中心偏向菱形搜尋(UCBDS),及(2)分別用於CU層級及子CU層級處之MV改進的自適應交叉搜尋。對於CU層級及子CU層級MV改進兩者,MV 可以四分之一明度樣本MV準確度來直接搜尋,其接著可繼之以八分之一明度樣本MV改進。用於CU及子CU步驟兩者的MV改進之搜尋範圍可經設定成等於8個明度樣本。
視訊寫碼器可如下選擇模板匹配FRUC合併模式中之預測方向。在雙向匹配合併模式中,總是應用雙向預測,此係因為CU之運動資訊係基於兩個不同參考圖像中沿著當前 CU之運動軌跡的兩個區塊之間的最佳匹配而導出。在JEM中,不存在對於模板匹配合併模式之此限制。在模板匹配合併模式中,視訊寫碼器可在自list0之單向預測、自list1之單向預測或用於CU之雙向預測之間選擇。選擇可基於如下之模板匹配成本: 序列 1costBi <=因數×min( cost0, cost1),則使用雙向預測; 否則若 cost0<= cost1,則使用自list0之單向預測;否則,使用自list1之單向預測; 在以上序列1之偽碼中,cost0為list0模板匹配之SAD,cost1為list1模板匹配之SAD且costBi為雙向預測模板匹配之SAD。因數之值等於5/4,此意謂選擇程序偏向至雙向預測。在JEM中,框間預測方向選擇僅僅應用於CU層級模板匹配程序。
在雙向預測模板匹配操作中 ,對於一個區塊區域之預測,分別使用list0之MV及list1之MV形成的兩個預測區塊經組合以形成單一預測信號。在解碼器側運動向量改進(DMVR)方法中,雙向預測之兩個運動向量係藉由雙向模板匹配程序進一步改進。雙向模板匹配可在視訊解碼器30中應用以在雙向模板與參考圖像中之重構樣本之間執行基於失真之搜尋以便在不傳輸額外運動資訊的情況下獲得改進MV。
在DMVR中,雙向模板係分別自如圖6中所示的list0之初始MV0及list1之MV1產生為兩個預測區塊之加權組合(亦即平均值)。模板匹配操作可包括計算所產生雙向模板與參考圖像中之樣本區域(圍繞初始預測區塊)之間的成本量測值或由其組成。對於兩個參考圖像中之每一者,產生最小模板成本之MV可被視為彼清單之經更新MV 以替換原始MV。模板成本可經計算為當前模板與參考樣本之間的絕對差之總和(SAD)或平方差之總和(SSD)。在JEM中,針對每一清單搜尋九個MV候選者。九個 MV 候選者包括原始 MV 及在水平方 向 或垂直方向或兩個方向上與原始MV有一個明度樣本偏移之8個環繞MV。最終,兩個新的MV (亦即如圖6中所示之MV0'及MV1')用於產生最終雙向預測結果。SAD可用作成本量測值。圖6為基於雙向模板匹配之經提議DMVR。
因此,在圖6的實例中,當前圖像602中之當前區塊600具有第一運動向量604(MV0)及第二運動向量606(MV1)。運動向量604指向list0參考圖像610中之參考區塊608。運動向量606指向list1參考圖像614中之參考區塊 612。參考區塊608及參考區塊612亦可在本文中稱為預測區塊。在識別參考區塊608及參考區塊612之後,視訊寫碼器可產生預測性區塊616作為參考區塊608及參考區塊612之加權平均。預測性區塊616亦可在本文中稱為雙向模板。因此,在圖6的實例中,視訊寫碼器可自藉由MV0及MV1 所參考之預測區塊產生雙向模板。另外,視訊寫碼器可在參考圖像610中搜尋最佳匹配預測性區塊616的區塊。在圖6的實例中,視訊寫碼器已將參考圖像610之區塊618識別為預測性區塊616之最佳匹配。視訊寫碼器亦可在參考圖像614中搜尋最佳匹配預測性區塊616的區塊。在圖6的實例中,視訊寫碼器已將區塊620識別為預測性區塊616之最佳匹配。運動向量622(MV0')指示當前區塊600與區塊618之間的空間位移。運動 向量624 (MV1')指示當前區塊600與區塊620之間的空間位移。
DMVR可在不傳輸額外語法元素的情況下運用來自過去參考圖像之一個MV及來自未來參考圖像之另一MV應用於雙 向預測之合併模式。在JEM5中,當本端照明補償(LIC)、仿射運動、FRUC,子CU合併候選者經啟用用於CU時,並不應用DMVR。
在具有QTBT之JEM中,每一CU可具有用於每一預測方向的運動之至多一個集合。藉由將大CU分裂成子CU及導出大CU之所有子CU的運動資訊來提供兩種子CU層級運動向量預測方法。進階時間運動向量預測(ATMVP)方法允許每一CU自小於同置參考圖像中之當前CU的多個區塊提取多個運動資訊集合。在空間時間運動向量預測 (STMVP)方法中,藉由使用時間運動向量預測子及空間鄰近運動向量遞回地導出子CU之運動向量。為保持用於子CU運動預測之更準確運動場,當前在JEM中停用用於參考圖框之運動壓縮。
在進階時間運動向量預測(ATMVP)方法中,運動向量時間運動向量預測(TMVP)藉由允許每一CU自小於當前CU之多個區塊提取運動資訊(包括運動向量及參考索引)之多個集合而改良。如圖7中所示,子CU為正方形N×N區塊(N經預設地設定成4)。
ATMVP在兩個步驟中預測CU內之子CU之運動向量。第一步驟係識別參考圖像中之具有所謂時間向量的對應區塊。參考圖像稱為運動源圖像。第二步驟係將當前CU分裂成子CU並自對應於每一子 CU之區塊獲得運動向量以及每一子CU之參考索引,如圖7中所示。
圖7展示用於當前圖像702中之當前CU 700的ATMVP運動預測。在第一步驟中,參考圖像704及對應區塊706係藉由當前CU 700之空間鄰近區塊的運動資訊判定。參考圖像704亦可被稱作運動源圖像704,此係因為視訊寫碼器使用運動源圖像704作為用於當前圖像702中之當前CU 700的運動資訊之源。為避免鄰近區塊之重複掃描程序,當前CU 700之合併候選者清單中的第一合併候選者之運動資訊用以判定參考圖像704及對應區塊706。第一可用運動向量以及其相關聯參考索引設定成時間向量708及至運動源圖像704之索引。因此,與TMVP相比較,在ATMVP中,對應區塊706可被更準確地識別,其中對應區塊(有時稱為同置區塊)總是在相對於當前CU 700的右下或中心位置中。
在第二步驟中,當前CU 700的子CU之對應區塊藉由添加時間向量708至當前CU 700之(x,y)座標,藉由運動源圖像704中之時間向量708而識別。對於當前CU 700之每一子CU,其對應區塊(涵蓋中心像素之最小運動網格)之運動資訊用以導出子CU之運動資訊。在對應N×N區塊之運動資訊被識別之後,對應N×N區塊之運動資訊以與TMVP相同的方式轉換成當前子CU之運動向量及參考索引,其中運動按比例調整及其他程序應用。舉例而言,視訊解碼器30可檢查低延遲條件是否滿足且可能使用運動向量MVx(對應於參考圖像清單X之運動向量)以預測用於每一子CU之運動向量MVy(其中X等於0或1且Y等於 1-X)。此以與用於時間運動向量預測相同之方式完成。
在空間時間運動向量預測中,遵循光柵掃描次序遞回地導出子CU之運動向量。圖8說明此概念。舉例而言,考慮含有四個4×4子CU A、B、C及D之8×8 CU(圖8中展示為具有較粗輪廓之正方形),如圖8中所示。當前圖框中之鄰近N×N區塊在圖8中經標記為a、b、c及d。
用於子CU A之運動導出藉由識別其兩個空間鄰近者而開始。第一鄰近者為在子CU A上方之N×N區塊(區塊c)。若區塊c並不可用或經框內寫碼,則在子CU A上方之其他N×N區塊被檢查(自左至右,在區塊c處起始)。第二鄰近者為子CU A左側之區塊(區塊b)。若區塊b並不可用或經框內寫碼,則子CU A左側之其他區塊被檢查(從上至下,在區塊b處起始)。每一清單之自鄰近區塊獲得的運動資訊按比例調整至給定清單之第一參考圖框。接下來,子區塊A之時間運動向量預測子(TMVP)係藉由遵循與HEVC中指定及在上文本發明中描述之導出程序相同的TMVP導出程序而導出。在位置D處之同置區塊的運動資訊被提取且相應地被按比例調整。最後,在擷取及按比例調整運動資訊之後,所有可用運動向量(至多3)經單獨地平均用於每一參考清單。經平均運動向量被指派為當前子CU之運動向量。
在子CU運動預測模式發信中,子CU模式經啟用為額外合併候選者且不存在發信模式所需要的額外語法元素。兩個額外合併候選者被添加至每一CU之合併候選者清單以表示ATMVP模式及STMVP模式。若序列參數集指示ATMVP及STMVP被啟用,則使用至多七個合併候選者。在編碼邏輯處,額外合併候選者與HEVC測試模型(HM)中之合併候選者相同,此意謂對於P或B圖塊中之每一CU,兩個以上RD檢查需要用於兩個額外合併候選者。為改良合併索引寫碼,在JEM中,合併索引之所有二進位數藉由CABAC而上下文寫碼。而在HEVC中,僅僅第一二進位數經上下文寫碼且剩餘二進位數經上下文旁路寫碼。
相比於對二進位數執行常規CABAC寫碼,對二進位數執行旁路CABAC寫碼在計算上可花費較少。此外,執行旁路CABAC寫碼可允許較高的並行化度及輸送量。使用旁路CABAC寫碼編碼之二進位數可被稱作「旁路二進位數」。將旁路二進位數分組在一起可使視訊編碼器20及視訊解碼器30之輸送量增加。旁路CABAC寫碼引擎可能夠在單一循環中寫碼若干二進位數,而常規CABAC寫碼引擎在一循環中可僅能夠寫碼單個二進位數。旁路CABAC寫碼引擎可較簡單,此係因為旁路CABAC寫碼引擎不選擇上下文且可針對兩個符號(0及1)假定1/2 之機率。因此,在旁路CABAC寫碼中,間隔係直接分裂成兩半。然而,壓縮效率可降低。
在 HEVC 中,僅 僅 平 移 運 動 模 型 應 用 於 運 動 補 償 預 測(MCP)。在真實世界中,存在許多種類之運動,例如放大 / 縮小、 旋轉、透視運動及其他不規則運動。在JEM中,仿射變換運動補償預測經應用以改良寫碼效率。若區塊遵循仿射運動模型,則區塊中之位置 (x,y)之MV可由仿射運動模型判定: 在等式 ( 3 )中a、b、c、d、e及f為仿射參數。此外,在等式 ( 3 )中,vx為位置(x,y)的MV之水平分量且vy為位置(x,y)的MV之垂直分量。
圖9為用於當前仿射區塊900之簡化仿射運動模型的方塊圖。如圖9中所示,6參數仿射運動模型可由左上方控制點902 (x0 ,y0 )之運動向量 v0、右上方控制點904(x1 ,y1)之運動向量 v1及左下方控制點 906(X2 ,y2)之運動向量 v 2表示。假定左上方控制點902為座標系統之原點(此意謂(x0 ,y0 )=(0,0)),當前仿射區塊900中之位置(x,y)之MV係藉由以下等式 ( 4 )描述: 在等式 ( 4 )中,( v 0x, v 0y)為左上方拐角控制點902之運動向量,( v 1x, v 1y)為右上方拐角控制點904之運動向量,( v 2x, v 2y)為左下方拐角控制點906之運動向量, w=(x1 -x0)為左上方控制點902與右上方控制點904之間的水平距離,且 h=(y2 -y0)為左上方控制點902與左下方控制點906之間的垂直距離。在等式 ( 4 )中,vx 為位置(x,y)之MV的水平分量且vy為位置(x,y)之MV的垂直分量。
然而,在JEM中,仿射運動模型藉由在等式 ( 3 )中假設a=e且b=-d而簡化為4參數仿射運動模型,產生如下文在等式 ( 5 )中所示的vx 及vy之表達式: 4參數仿射運動模型接著由被假定為原點之左上方控制點902 (x0,y0)的運動向量 v0及右上方控制點904(x1,y1)之運動向量 v1表示。在等式 (5)中, v x為位置(x,y)之MV的水平分量且 v y為位置(x,y)之MV的垂直分量。圖10為當前仿射區塊1000之簡化仿射運動模型的實例。如圖10中所示,區塊之仿射運動場係由兩個控制點運動向量v0及v1描述。區塊之運動向量場(MVF)係藉由等式 ( 6 )描述: 在等式 (6)中,( v 0x, v 0y)為左上方拐角控制點1002之運動向量,( v 1x, v 1y)為右上方拐角控制點1004之運動向量且 w=(x1-x0)為左上方控制點1002與右上方控制點1004之間的水平距離。vx為位置(x,y)之MV的水平分量且vy為位置(x,y)之MV的垂直分量。
為進一步簡化運動補償預測,可應用基於區塊之仿射變換預測。為導出每一子區塊之運動向量,如圖11中所示,每一子區塊之中心樣本的運動向量係根據等式(6)計算,並捨入至1/16分率準確度。視訊寫碼器接著可應用運動補償內插濾波器以運用導出之運動向量產生每一子區塊之預測。仿射區塊內的每一子區塊之 經內插運動向量在以下上下文中稱為MCP運動向量場(MVF)。子區塊大小可取決於控 制點之間的MV差而變化。圖11為實例MCP MV場,其中每一子區塊 (例如4×4區塊)之MV藉由控制點之MV內插;MV接著用以執行每一子區塊之運 動補償預測(MCP)。每一子區塊之運動向量可用於識別對應參考區塊,其組合形成預測性區塊。因此,以此方式,視訊寫碼器可產生基於區塊之運動向量(例如區塊之控制點的運動向量)的預測性區塊。
在運動補償預測之後,每一子區塊之高準確度運動向量經捨入為與正常運動向量相同之準確度並被保存。在JEM中及在HEVC中,每一框間預測CU或PU的運動向量經儲存用於其他框間區塊之MV預測。運動向量之儲存單元為4×4區塊。換言之,在JEM中,仿射區塊之經內插MV經產生並儲存用於每一4×4區塊。然而,由於控制點之MV可以用於後續區塊,所以拐角4×4區塊之所儲存MV為控制點之MV而非如圖12中所示之用於MCP的相關聯MV。應注意,在JEM6中,左下方及右下方控制點之MV亦由左上方及右上方控制點之MV產生。
因此,在圖12中,CU 1200包括十六個子區塊。對於不在CU 1200之拐角處的十二個子區塊中之每一各別子區塊,視訊寫碼器儲存用於各別子區塊之中心點的運動向量。對於CU 1200之拐角處的每一各別子區塊,視訊寫碼器儲存用於各別子區塊之外部拐角的運動向量。
在JEM中,存在兩個仿射運動模式:仿射框間(AF_INTER)模式及仿射合併(AF_MERGE)模式。對於具有寬度及高度均大於8之CU,可應用AF_INTER模式。在位元串流中在CU層級處發信仿射旗標以指示是否使用AF_INTER模式。在此模式下,具有運動向量集合                              之候選者清單係使用鄰近區塊建構。如圖13中所示,MVP 0係選自區塊A、B或C之運動向量。圖13 說明用於AF_INTER之MVP的實例。來自鄰近區塊之運動向量根據參考清單及用於鄰近區塊之參考的圖像次序計數(POC)、用於當前CU之參考的POC及當前CU之POC之間的關係按比例調整。自鄰近區塊D及E選擇MVP1的方法係類似的。在JEM中,若候選者清單中之候選者的數目小於2,則該清單藉由藉由複製AMVP 候選者{AMVP0 ,AMVP0 }及  {AMVP1 ,AMVP1 }中之每一者而組成的運動向量對填補。
此外,在JEM中,當候選者清單中之候選者的數目大於2時,候選者首先根據鄰近運動向量之一致性(一對候選者中之兩個運動向量的類似性)排序且僅僅前兩個候選者如圖13之右側部分所示而保持。視訊寫碼器可使用速率-失真(RD)成本檢查,速率-失真(RD)成本檢查用以判定哪一運動向量集合候選者經選擇為當前CU之控制點運動向量預測(CPMVP)。指示候選者清單中之CPMVP的位置之索引係在位元串流中發信。在判定當前仿射CU之CPMVP之後,應用仿射運動估計且發現控制點運動向量(CPMV)。CPMV及CPMVP的差接著可在位元串流中發信。
當在仿射合併(AF_MERGE) 模式中應用CU時,CU取得運用仿射模式基於以下訪問次序自有效鄰近經重構區塊寫碼的第一區塊 :A1àB1àB0àA0àB2。用於候選者區塊之選擇次序如圖14A中所示係自左側、上方、右上方、左下方至左上方。若鄰近左下方區塊A係以如圖14B中所示之仿射模式寫碼,則導出含有區塊A的CU之左上方拐角、右上方拐角及左下方拐角之運動向量 v2、 v3及 v4。藉由假設(X2 ,y2 )為原點(此意謂(X2 ,y2 )=(0,0)),使用下文等式 (7)根據 v2、 v3及 v4外推當前 CU之左上方拐角之運動向量 v0 。其次,當前CU之右上方的運動向量 v1係以類似方式計算。下文展示等式 ( 7 )在等式 (7)中,( v 2x, v 2y)為左上方拐角控制點(x2,y2)之運動向量,( v 3x, v 3y)為右上方拐角控制點(x3,y3)之運動向量,( v 4x, v 4y)為鄰近仿射區塊中之左下方拐角控制點(x4,y4)的運動向量, w=(x3-x2)為左上方控制點與右上方控制點之間的水平距離,且 h =(y4-y2)為左上方控制點與左下方控制點之間的垂直距離, v x為用於位置(x,y)之運動向量的水平分量,且 v y為用於位置(x,y)之運動向量的垂直分量。
在當前CU之CPMV v0及v1被導出之後,根據仿射運動模型等式(6),產生當前CU之MVF。為了識別當前CU是否運用AF_MERGE模式寫碼,當存在在仿射模式中寫碼的至少一個鄰近區塊時在位元串流中發信仿射旗標。
在HEVC中,運動向量差(MVD)(PU之運動向量與預測運動向量之間)係以四分之一明度樣本為單位發信。在JEM中,引入進階運動向量解析度(AMVR)。在JEM5中,MVD可以四分之一明度樣本、整數明度樣本或四個明度樣本為單位寫碼。在JEM5中,MVD解析度經控制在CU層級處且MVD解析度旗標經有條件地發信用於具有至少一個非零MVD分量的每一CU。
對於具有至少一個非零MVD分量之CU,第一旗標經發信以指示四分之一明度樣本MV精確度是否用於CU。當第一旗標(等於1)指示未使用四分之一明度樣本MV精確度時,另一旗標經發信以指示使用整數明度樣本MV精確度抑或四個明度樣本MV精確度。
當CU之第一MVD解析度旗標為零,或未經寫碼用於CU(意謂CU 中之所有MVD為零)時,四分之一明度樣本MV解析度用於CU。當CU使用整數明度樣本MV精確度或四個明度樣本MV精確度時,用於CU的AMVP候選者清單中之MVP捨入至對應精確度。
在編碼器側,視訊編碼器20可使用CU層級RD檢查以判定哪一MVD解析度用於CU。亦即,CU層級RD檢查可分別對於每一MVD解析度執行三次。為加速編碼器速度,以下編碼方案應用於JEM中: 在運用正常四分之一明度樣本MVD解析度對CU進行RD檢查期間,儲存當前CU之運動資訊(整數明度樣本準確度)。所儲存運動資訊(在捨入之後)在運用整數明度樣本及4明度樣本MVD解析度對同一CU 進行RD檢查期間用作起點以用於進一步小範圍運動向量改進,使得耗時運動估計程序不重複三次。 有條件地調用運用4明度樣本MVD解析度的CU之RD檢查。對於CU,當用於整數明度樣本MVD解析度之RD成本比四分之一明度樣本MVD解析度大得多(例如,用於整數明度樣本MVD解析度之RD成本與用於四分之一明度樣本MVD解析度之RD成本的比率大於臨限值)時,跳過用於CU的4明度樣本MVD解析度之RD檢查。
經重構運動向量資訊並不全部用於現有視訊編碼解碼器中之運動向量預測之現有方案(諸如,HEVC/H.265、AVC/H.264及JEM)中。
本發明描述可改良執行運動向量預測(MVP)之計算裝置的技術。在下文所描述之若干不同態樣中詳述該等技術。以下技術可經單獨地應用。替代地,可應用技術之任何組合。
根據本發明之一或多個技術 ,視訊寫碼器可使用不緊鄰當前區塊的區塊之運動向量,此係因為不鄰近區塊之運動向量可進一步改良預測效率,尤其當空間運動向量之間的相關度對於類似於不鄰近區塊之運動資訊的當前區塊之運動資訊足夠強時。因此,來自不鄰近區塊之運動資訊可為用於當前區塊之良好MVP候選者。在本發明中,提議一或多個不鄰近空間運動向量預測子(NA-SMVP)用以導出用於當前區塊之運動資訊的運動向量預測子;或NA-SMVP可藉由當前區塊直接再使用以執行框間預測。本發明描述適應性地將NA-SMVP 與其他MV預測子(例如常規SMVP、TMVP、合成MVP)合併在一起以用於MV預測的技術。
因此,根據本發明之技術,視訊編碼器20可判定視訊資料之當前圖像之不鄰近區塊之運動向量。不鄰近區塊不鄰近於當前圖像之當前區塊。此外,視訊編碼器20可基於不鄰近區塊之運動向量判定當前區塊之MVP。視訊編碼器20亦可判定當前區塊之運動向量。運動向量可等於當前區塊之MVP的運動向量或可等於當前區塊之MVP的運動向量加在位元串流中發信之運動向量差(MVD)。另外,視訊編碼器20可基於當前區塊之運動向量判定預測性區塊。視訊編碼器20可基於預測性區塊產生殘餘樣本值。
類似地,視訊解碼器30可判定視訊資料之當前圖像之不鄰近區塊之運動向量。不鄰近區塊不鄰近於當前圖像之當前區塊。此外,視訊解碼器30可基於不鄰近區塊之運動向量判定當前區塊之MVP。 另外,視訊解碼器30可基於當前區塊之MVP判定當前區塊之運動向量。視訊解碼器30亦可基於當前區塊之運動向量判定預測性區塊。視訊解碼器30 接著可基於預測性區塊重構當前圖像之樣本值。
在一些實例中,不鄰近空間運動向量預測子(NA-SMVP)係自定位於當前區塊定位於其中的相同圖像、圖塊或預定義區域內的在空間上不鄰近區塊之運動資訊導出。因為不鄰近區塊之運動資訊可再用作當前區塊之運動向量預測子,所以僅僅具有經重構運動資訊之不鄰近區塊經考慮用於不鄰近MVP導出。本發明提議進一步添加一約束條件至NA區塊以將NA區塊與當前區塊之間的距離約束在一範圍內。距離可在 L1或L2意義上以像素距離量測;或距離可在 L1 或 L2 意義上 以區塊距離量測。在運用固定笛卡爾座標系統之n維實向量空間中兩個座標點之間的L1距離為點之間的線段至座標軸上的投影之長度的總和。在 L1 像素距離之情況下,投影之長度為一個像素之高度或寬度。在 L1 區塊距離之情況下,投影之長度為區塊之寬度或高度。L2 距離為兩個點之間的歐幾裡得距離。距離可在區塊中心或每一區塊內之任一指定點之間量測。在一些實例中,另一約束條件被添加至NA區塊,該約束條件將NA區塊約束為不鄰近於當前區塊且不鄰近於緊鄰當前區塊之區塊的區塊。
圖15為說明根據本發明之技術之實例不鄰近區塊的方塊圖。如圖15中所示,不鄰近區塊1500為不緊鄰當前區塊1502之經重構區塊。不鄰近區塊之大小可定義為用以儲存運動資訊之最小單元區塊(例如4×4 區塊)或用於框間預測之基本單元(例如HEVC中之PU)或如在仿射模式、JEM中之FRUC模式中所使用的子區塊或任何其他指定之區塊大小。圖15亦展示鄰近非經重構區塊1504及不鄰近非經重構區塊1506。
圖16為說明根據本發明之技術之不鄰近區塊之選擇的實例之方塊圖。圖17為說明根據本發明之技術的基於親代區塊之不鄰近區塊的選擇之實例的方塊圖。儘管潛在地所有不鄰近區塊可用於 MVP 導出,但可更需要(就實施複雜度而言)選擇僅僅有限數目個不鄰近區塊 (NA區塊)用於MVP 導出。下文詳述選擇 N(其中 N為非負整數) 個不鄰近區塊用於運動向量預測子(MVP) 導出之若干方式。舉例而言,在選擇 N個不鄰近區塊用於MVP導出之一個實例中,不鄰近區塊之固定圖案經選擇用於 NA-SMVP導出。固定圖案相對於當前區塊之位置而定位。在如圖16中所示之一個實例中,除了用以導出如在HEVC中用於當前區塊1600之所使用的常規SMVP的鄰近區塊(例如A0、A1、B0、B1及B2 )以外,環繞當前區塊1600之11個NA區塊(NA1 , 1、NA1 , 2、NA1 , 3、NA1 , 4、NA1 , 5、NA1 , 6、NA1 , 7、NA1 , 8、NA1 , 9、NA1 , 10、NA1 , 11)之固定圖案用以導出NA-SMVP。水平距離 s 1及垂直距離 t 1為此圖案之兩個描述符。
在如圖17中所示之另一實例中。在圖 17的實例中,除了用以導出如在HEVC 中所使用之常規SMVP 的鄰近區塊以外,視訊寫碼器使用含有當前區塊1702之親代區塊1700之鄰近區塊作為用於MVP導出之NA區塊。在圖 17 中,親代區塊 1700 之 鄰近區塊 (NA1 , 1、 NA1 , 2、NA1 , 3、NA1 , 4、NA1 , 5、NA1 , 6、NA1 , 7、NA1 , 8、NA1 , 9 )經選擇為親代區塊1700內的區塊(包括當前區塊1702)之不鄰近區塊。親代區塊1700之大小可經預定或在位元串流中 發信或取決於當前區塊 1702 之大小或取決於當前區塊 1702之寫碼模式(例如跳過/合併/AMVP)。本發明之NA-SMVP可自不鄰近空間區塊之所揭示圖案(但不限於該所揭示圖案)導出。
環繞 NA 區塊之多層級的實例如下給出。應注意對於每一層級,NA區塊之數目可係不同的。
圖案A1:環繞NA區塊之多層級。每一層級(層級i)係藉由距離參數 ( s i及 t i) 來描述。圖20、圖 21及圖 22展示環繞NA區塊之2層級的實例但層級之數目可為任一非負整數。在圖20、圖21及圖22之實例中,黑色正方形對應於第一層級中之NA區塊且灰色正方形對應於第二層級中之NA區塊。t1 指示自當前區塊2000、2100或2200至第一層級之垂直距離。t2 指示自當前區塊2000、2100或2200至第二層級的垂直距離。s1 指示自當前區塊2000、2100或2200至第一層級之水平距離。s2 指示自當前區塊2000、2100或2200至第二層級之水平距離。
圖案A2:基於親代區塊環繞NA區塊的多層級。每一層級(層級i)係藉由距離參數( s it i)來描述。親代區塊之大小可經預定或在位元串流中發信。圖23展示環繞NA區塊之2層級的實例但層級之數目可為任一非負整數。
此外,在一些實例中,當前區塊與不鄰近區塊之間的距離係由L1範數(亦即L1距離)或L2範數(亦即歐幾裡得距離)界定。
在一些實例中,視訊編碼器20及視訊解碼器30根據反向寫碼次序選擇N個不鄰近區塊。舉例而言,視訊寫碼器(例如視訊編碼器20或視訊解碼器30)可藉由根據與視訊寫碼器寫碼區塊所按之次序相反的次序掃描區塊而選擇不鄰近區塊。
在一些實例中,視訊編碼器20及視訊解碼器30藉由根據預定義次序將所有經重構MV插入至此清單中而建構全域MV候選者清單。全域MV候選者清單可含有自鄰近區塊導出的MV以及自不鄰近區塊導出之MV。可接著使用此全域MV候選者來導出當前區塊之MV預測子。因此,在此等實例中,視訊寫碼器(例如視訊編碼器20或視訊解碼器30)可判定包含指定用於在當前圖像中且在當前區塊之前經編碼的每一區塊之運動向量之MVP候選者的全域運動向量候選者清單。另外,視訊寫碼器可自全域運動向量候選者清單中之MVP候選者判定不鄰近區塊之運動向量。
在一些實例中,因為直接提取不鄰近MV候選者可增加線緩衝器之大小,所以視訊寫碼器應用儲存經重構MV之替代方式。舉例而言,視訊寫碼器可以先進先出方式將經重構MV儲存於歷史緩衝器中。為模擬不鄰近MV候選者,歷史緩衝器中之僅僅彼等舊MV被視為不鄰近MV候選者。歷史緩衝器中之舊MV可經定義為接近於歷史緩衝器之末端的彼等MV。舉例而言,若歷史緩衝器之大小為N,則臨限值T(諸如T=N/4) 可經發信或設定以使得T個最接近於歷史緩衝器中之出口的MV經定義為舊MV。
在一些實例中,為減小用以儲存不鄰近運動資訊(亦即,不鄰近區塊之運動資訊)的緩衝器之緩衝器大小,約束條件被添加以導出不鄰近空間運動向量預測子。若不鄰近區塊與當前區塊(或當前CTU)之間的距離大於臨限值,則不鄰近區塊之位置可經修改。換言之,視訊寫碼器可在自第一位置至當前區塊之距離大於臨限值時基於第一位置判定第二位置,而非基於在第一位置(例如,藉由NA區塊之固定圖案指定的位置)處之NA區塊判定MV候選者。在一些實例中,視訊寫碼器可在自第一位置至當前區塊之距離大於臨限值時判定第一位置並不有效,而非基於在第一位置(例如藉由NA區塊之固定圖案指定的位置)處之NA區塊判定MV候選者。臨限值對於水平距離及垂直距離可 係不同的。因此,在一些實例中,在判定不鄰近區塊之運動向量之前及基於不鄰近區塊與當前區塊之間的距離大於臨限距離,視訊寫碼器可修改不鄰近區塊之位置。在一些實例中,在判定不鄰近區塊之運動向量之前及基於不鄰近區塊與當前寫碼樹型區塊之間的距離大於臨限距離,視訊寫碼器可修改不鄰近區塊之位置。在此等實例中,當前寫碼樹型區塊含有當前區塊。
位置修改之一個實例可為將第一位置捨入至粗略網格,亦即減少所儲存不鄰近運動。因此,在此實例中,視訊寫碼器可至少部分地藉由將不鄰近區塊之位置捨入至比當前圖像之區塊的第二網格粗略的當前圖像中之區塊之第一網格上的位置而修改不鄰近區塊之位置。
位置修改之另一實例可為若位置之距離大於臨限值,則截割第一位置至臨限值。截割位置至臨限值意謂若位置超過臨限值 ,則修改位置至臨限值處。因此,在此實例中,視訊寫碼器可至少部分地藉由將不鄰近區塊之位置截割至距離臨限值而修改不鄰近區塊之位置。可組合運用不同臨限值之多個位置修改方法。
圖18A及圖18B為說明根據本發明之技術的不鄰近區塊之位置修改的實例之方塊圖。圖 19A及圖19B為說明根據本發明之技術的用於修改不鄰近區塊之臨限值的實例之方塊圖。修改位置之若 干實例提供於下文中。在此等實例中,假定不鄰近區塊之位置為(xNA,yNA),不鄰近區塊之經修改位置為(xNA',yNA'),當前CTU 1800、1900之左上方網格的位置為(xCTU,yCTU),且當前CU 之位置為(xCU,yCU)。約束條件之實例可為: 1. 若(yCTU-yNA)>(或>=)yThrd,則yNA'=yThrd。若(xCTU- xNA)>(或>=)xThrd,則xNA'=xThrd。yThrd可小於xThrd。圖18A展示具有yThrd之實例,其中Thrd為臨限值之縮寫。因此,在圖18A中,CTU 1800含有當前CU(curr) 1802。若不鄰近區塊之位置NA 1804之垂直座標與CTU 1800之垂直座標之間的差大於臨限值(yThrd),則視訊寫碼器將位置NA 1804之垂直座標截割至臨限值,從而產生位置NA' 1806。 2. 若(yCTU-yNA)>(或>=)yThrd(或)(xCTU-xNA)>(或>=)xThrd,則abs(xNA',yNA')=((xNA>>CompressedLog2SizeX)  <<CompressedLog2SizeX,(yNA>>CompressedLog2SizeY)<< CompressedLog2SizeY)。 CompressedLog2SizeX及CompressedLog2SizeY為用於控制位置捨入之值。舉例而言,若(xNA, yNA)為(36, 18)且(CompressedLog2SizeX,  CompressedLog2SizeY)為(4,4),則捨入之位置(xNA', yNA')將為 ((36>>4)<<4,(18>>4)<<4)=(32, 16)。換言之,若不鄰近區塊之位置遠離當前區塊,則視訊寫碼器可將位置捨入至粗略網格。因此,運動緩衝器可僅僅儲存在粗略網格上之不鄰近區塊運動。圖18B展示實例。因此,在圖18B的實例中,CTU 1850含有當前CU(curr) 1852。若位置NA 1854之垂直(y)座標與CTU 1850之位置之垂直座標之間的差大於垂直臨限值(yThrd)及/或位置NA 1854之水平(x)座標之間的差大於水平臨限值(xThrd),則視訊寫碼器可將經修改位置NA'1856之水平座標判定為 (xNA>>CompressedLog2SizeX)<<CompressedLog2SizeX且將經修改位置NA'1856之   垂直座標判 定為(yNA>>CompressedLog2SizeY)<< CompressedLog2SizeY。在一些實例中,xThrd為負無窮。因此,在此等實例中,(xCTU-xNA)總是大於xThrd。 3. 在一些實例中,修改不鄰近區塊之臨限值為:若(yCTU- yNA)>yThrd,則不鄰近區塊經修改。圖19A展示實例,且加陰影區塊為應經修改的不鄰近區塊位置。特定言之,在圖19A的實例中,CTU 1900包括當前CU(curr) 1902。若不鄰近區塊之垂直座標與CTU 1900之垂直座標的差大於臨限值(yThrd),則視訊寫碼器可修改不鄰近區塊之位置。 4. 修改不鄰近區塊之臨限值可為多於一個規則之組合。實例可為:(1)若(yCTU-yNA)>yThrd,則不鄰近區塊應經修改。(2)若(yCTU- yNA)>0且(xCTU-xNA)>0,則不鄰近區塊應經修改。圖19B展示兩個規則之組合的實例,且加陰影區塊為應經修改的不鄰近區塊位置。特定言之,在圖19B的實例中,CTU 1950包括當前CU(curr) 1952。若不鄰近區塊之垂直座標與CTU 1950之垂直座標的差大於垂直臨限值(yThrd),則視訊寫碼器可修改不鄰近區塊之垂直座標。另外,若不鄰近區塊之水平座標與CTU  1950之水平座標之間的差大於0且不鄰近區塊之垂直座標與CTU 1950之垂直座標之間的差大於0,則視訊寫碼器可修改不鄰近區塊之水平座標。 在一個實例中,僅僅位於與當前區塊相同之CTU列處的不鄰近區塊可被選擇。在另一實例中,僅僅位於與當前區塊相同之CTU處的不鄰近區塊可被選擇。
在視訊寫碼器判定 N個不鄰近區塊之後,視訊寫碼器可自 N個不鄰近區塊(NA區塊)導出 M(其中 MN)個不鄰近空間運動向量預測子(NA-SMVP)。存在取決於視訊編碼解碼器中使用的框間預測機制利用不鄰近SMVP的不同方式。舉例而言,當使用競爭性運動候選者機制(例如HEVC或JEM中之合併/跳過模式)時,一或多個不鄰近空間MVP(NA- SMVP)經導出並根據預定義次序插入至候選者清單中。在如圖16中所示之一個實例中,11個不鄰近MVP在習知空間MVP、時間MVP之後及在合成組合候選者、合成零候選者之前被插入至合併候選者清單中。
在一些實例中,完整運動修剪程序可應用於NA-SMVP及其他合併候選者;或部分運動修剪可應用於NA-SMVP及其他合併候選者。完整運動修剪程序對照當前候選者清單中之所有先前導出的候選者比較一個候選者以避免在一定程度上插入相同候選者。為減小複雜度,部分運動修剪程序僅僅比較有限數目個候選者,而不是將每一潛在候選者與所有其他現有候選者相比較。下文在序列2至序列5中給出不鄰近區塊之更多插入次序。本發明之NA-SMVP可插入至候選者清單中,包括(但不限於)所揭示插入次序。 序列2 用於合併模式之插入次序: 1. 常規SMVP(例如A1、B1、B0、A0、B2)àTMVP(例如H或C)àNA- SMVPà合成候選者 2. 常規SMVP(例如A1、B1、B0、A0、B2)à子區塊MV候選者(例如ATMVP、STMVP)àTMVP(例如H或C)àNA-SMVPà合成候選者 3. 常規SMVP(例如A1、B1、B0、A0、B2)àNA-SMVPàTMVP(例如H或C)à合成候選者 序列3 用於AMVP模式之插入次序(用於List0或List1 MV預測): 1. 左側SMVP(例如A0、A1)à按比例調整之左側SMVP(例如A0、A1)à上方SMVP(例如B0、B1、B2)à按比例調整之上方SMVP(例如B0、B1、B2)àNA-SMVPà按比例調整之NA-SMVPàTMVPà合成候選者 序列4 用於仿射合併模式之插入次序: 1. 常規SMVP(例如A1、B1、B0、A0、B2)àNA-SMVP 序列5 用於仿射AMVP模式之插入次序: 1. 外推仿射MVPà左側SMVP(例如A0、A1)à按比例調整之左側SMVP(例如A0、A1)à上方SMVP(例如B0、B1、B2)à按比例調整之上方SMVP(例如B0、B1、B2)àNA-SMVPà按比例調整之NA-SMVPàTMVPà合成候選者
競爭性空間時間運動候選者方案可包括其中運動預測子選自可用運動預測子之一集合的系統。當使用競爭性空間時間運動候選者方案(諸如HEVC或JEM或其他視訊編碼解碼器中之AMVP模式) 時,不鄰近MVP候選者經導出並根據預定義次序插入至候選者清單中。在一個實例中,視訊寫碼器在習知空間MVP、時間MVP之後及在任何合成零候選者之前將圖16之11不鄰近MVP插入至AMVP候選者清單中。NA-SMVP導出可遵循與HEVC或應用於自鄰近區塊導出的SMVP之任何其他規則相同的導出規則。
NA-SMVP 候選者之次序可藉由特定預定義規則判定或可以適應性方式判定。舉例而言,視訊寫碼器可以根據在本發明中別處提供的實例中之任一者選擇N個NA區塊相同的次序配置來自N個不鄰近區塊之M個候選者。替代地,在一個實例中,視訊寫碼器根據彼等候選者之頻率( 亦即,所有MV候選者當中候選者出現的數目)及/或 NA區塊與當前區塊之間的距離重新排序 M個候選者。因此,在此實例中,視訊寫碼器可在NA-SMVP候選者清單(亦即,包括NA-SMVP候選者及可能其他候選者之候選者清單)中在前方置放更頻繁候選者及 /或來自更接近於當前區塊之NA區塊之候選者。另外,視訊寫碼器可如上文在序列2至序列5中所描述在候選者清單中之固定位置中插入所有NA-SMVP候選者,該等NA-SMVP候選者經允許在僅僅 NA-SMVP候選者之間經重新排序。在另一實例中,視訊寫碼器可根據特定準則(諸如,運動資訊之頻率 (亦即,在所有MV候選者之間運動向量出現的數目)或來自當前圖像及/或先前經寫碼圖像的任何可用運動統計資料)重新排序清單中之所有候選者(包括NA- SMVP及其他候選者)。候選者清單中NA-SMVP之次序可對於特定寫碼模式(例如合併及/或AMVP模式)係不同的,且未必限制於所揭示候選者次序。舉例而言,視訊寫碼器可根據第一次序將NA-SMVP候選者插入至合併候選者清單中且可根據不同於第一次序之第二次序將NA-SMVP候選者插入至AMVP候選者清單中。
在一些實例中,修剪程序適應於區塊大小。在一個實例中,臨限值可用以界定需要被修剪之物。舉例而言,若區塊大小較大 (亦即,大於預定義區塊大小),則視訊寫碼器可相應地增加臨限值。考慮具有運動向量MV0(較早被添加至清單)及MV1之兩個候選者,在一個實例中,若MV0與MV1之間的距離之L1或L2範數小於臨限值,則視訊寫碼器修剪MV1之候選者。視訊編碼器20可發信經由SPS、PPS、圖塊標頭或在另一語法結構中發信之臨限值。
在另一實例中,臨限值基於當前區塊大小而自適應。舉例而言,在此實例中,第一臨限值應用於具有小於預定義區塊大小之大小的區塊,且第二不同臨限值應用於具有大於預定義區塊大小之大小的區塊。在此實例中,當產生用於具有小於預定義區塊大小之大小的區塊之候選者清單時,若一候選者之運動向量與清單中之另一候選者的運動向量之間的距離之L1或L2範數小於第一臨限值,則視訊寫碼器可 自清單修剪該候選者。在此實例中,當產生用於具有大於預定義區塊大小之大小的區塊之候選者清單時,若一候選者之運動向量與清單中之另一候選者的運動向量之間的距離之L1或L2範數小於第二臨限值,則視訊寫碼器可自清單修剪該候選者。
在另一實例修剪程序中,臨限值基於候選者之空間位置與當前區塊之空間位置之間的距離而自適應。若候選者較遠遠離當前區塊定位,則視訊寫碼器可使用較大臨限值。舉例而言,當產生用於當前區塊之候選者清單時,視訊寫碼器可基於特定不鄰近區塊判定第一NA-SMVP。在此實例中,若第一NA-SMVP候選者之運動向量與清單中之第二候選者運動向量之間的距離之L1或L2 範數小於特定臨限值,則視訊寫碼器可自清單修剪第一NA-SMVP候選者。在此實例中,特定臨限值可取決於特定不鄰近區塊與當前區塊之間的距離。
在一些實例中,運動向量之分類可使用包括(但不限於)K-平均或支援向量機之方法完成,且僅僅來自Nc類別中之每一者的前 Mc候選者應保持在候選者清單中,其中Mc及類別之數目Nc可經預定義或在高層級語法中發信。
在使用僅僅單一MVP的方案( 諸如JEM中之仿射合併模式)中,視訊寫碼器(例如視訊編碼器20或視訊解碼器30)亦可將一或多個不鄰近SMVP (NA-SMVP)連同其他MVP一起包括在候選者集合中。最終MVP接著根據預定義次序經選為第一可用MVP。在一個實例中,當 CU經應用於仿射合併(AF_MERGE) 模式中時,其取得運用仿射模式基於以下訪問次序自有效鄰近經重構區塊寫碼之第一區  塊:A1àB1àB0àA0àB2àNA- 區塊。因此,在此實例中,若區塊A1、B1、B0、A0或B2中無一者係運用仿射模式寫碼,則視訊寫碼器可判定用於CU之MVP為不鄰近區塊中之在仿射模式中寫碼的第一者。
如上文簡單論述,FRUC合併模式中之運動導出程序包括兩個步驟。特定言之,CU層級運動搜尋被首先執行,緊接著為子CU層級運動改進。在CU層級處,視訊寫碼器基於雙向匹配或模板匹配導出用於整個CU之初始運動向量。為導出用於整個CU之初始運動向量,視訊寫碼器可首先產生MV候選者之清單(FRUC CU層級MV候選者集合)且視訊寫碼器選擇導致最小匹配成本的候選者作為用於進一步CU層級改進之起點。接著,視訊寫碼器基於雙向匹配或模板匹配執行圍繞起點之本端搜尋。視訊寫碼器接著採用導致最小匹配成本之MV作為用於整個CU之MV。隨後,視訊寫碼器可進一步運用含有經導出CU運動向量之FRUC子CU層級MV候選者集合以改進子CU層級處之運動資訊。
本發明提議添加一或多個NA-SMVP至FRUC CU層級MV候選者集合、FRUC子CU層級MV候選者集合或兩者中。因此,視訊寫碼器(例如視訊編碼器20或視訊解碼器30)可判定CU層級FRUC運動向量候選者之集合。根據本發明之技術,CU層級FRUC運動向量候選者之集合可包括一或多個NA-SMVP。另外,視訊寫碼器可自CU層級FRUC運動向量候選者之集合選擇CU層級FRUC運動向量候選者。視訊寫碼器接著可至少部分地藉由執行自所選擇CU層級FRUC運動向量候選者開始的本端搜尋判定CU層級運動向量。視訊寫碼器亦可運用FRUC子CU層級運動向量候選者之集合在子CU層級處改進CU層級運動向量。在此實例中,CU層級FRUC運動向量候選者之集合及FRUC子CU層級運動向量候選者之集合中的至少一者可包括指定不鄰近區塊之運動向量的NA-SMVP。NA-SMVP可根據在本發明中別處提供的實例中之任一者判定。
與不鄰近MVP有關之高層級語法可經預定或經明確地發信至位元串流中。高層級語法包括(但不限於)以下控制參數: 1. 鄰近區塊之數目N。在一些實例中,該數目根據諸如區塊大小之寫碼資訊自適應。在一些實例中,數目N取決於寫碼模式(例如跳過/合併/AMVP)或用於合併/AMVP/跳過模式之候選者的最大允許數目。 2. 距離s/t(若其存在,則發信多個參數s/t),其中如圖20至圖23中所示,s為水平移位且t為NA區塊之垂直移位。 3. 用於NA區塊判定之親代區塊之大小。 4. 不鄰近MVP之啟用/停用。 5. 如上文參看圖20至圖22所論述用於定位NA區塊之層級的數目。
在HEVC中,合併候選者清單大小在1至5之範圍內,而AMVP 候選者清單大小固定至2。在JEM中,合併候選者清單大小在1至7範圍內而 AMVP 候選者清單大小固定至2。當NA-SMVP包括於MVP或合併候選者清單中時,最大候選者清單大小可相應地增加。舉例而言,當一或多個NA-SMVP插入至合併候選者清單大小中時,合併候選者清單大小可增加至 N(其中 N為正整數且 N>7) 。在此實例中,當一或多個NA-SMVP插入至合併候選者清單大小中時,AMVP候選者清單大小可增加至 M( M為正整數且 M>2)。
本發明亦提議除了HEVC中提供之彼等候選者之外還使用合成MV候選者。額外合成MV候選者之利用亦可遵循關於不鄰近 MVP 之使用在本發明中別處提供的實例。亦即,合成MV候選者可基於不鄰近區塊之運動參數而產生,其中不鄰近區塊 係根據上文提供的實例中之任一者而判定。
在一些實例中,視訊寫碼器(例如視訊編碼器20或視訊解碼器30)根據預定義次序(諸如A1、B1、B0、A0、B2(參見圖2))藉由將可用雙向預測MV候選者分裂成兩個獨立單向預測候選者產生合成單向預測候選者。視訊寫碼器接著可將產生之合成單 向預測候選者插入至候選者清單中。
此外,在一些實例中,當整數MVD(亦即,經指定至一個明度樣本之精確度的MVD)或四個明度樣本MVD(亦即,經指定至四個明度樣本之精確度的MVD)啟用時,視訊寫碼器可藉由將可用MV候選者捨入或截斷至整數MV或四個明度樣本MV候選者而產生合成整數MV候選者(亦即,具有一個明度樣本之精確度的運動向量的MV候選者) 或四個明度樣本MV候選者(亦即,具有四個明度樣本之精確度的運動向量的MV候選者)。視訊寫碼器接著可將產生之合成整數MV候選者或4個明度樣本MV插入至候選者清單中。
本發明亦提議將多個TMVP候選者包括於合併候選者清單或AMVP候選者清單中的方式。在一個實例中,遵循一個同置圖像被發信的HEVC設計,視訊寫碼器使用更多時間鄰近區塊以導出更多 TMVP候選者。舉例而言,除了按次序僅檢查H及C區塊(圖2中描繪)及挑選其中的一者之外,視訊寫碼器可檢查更多區塊(例如,當前區塊的空間鄰近區塊之同置區塊)。在一個實例中,藉由視訊寫碼器檢查的空間鄰近區塊可包括僅僅鄰近區塊,例如如圖16中所示之A0、A1、B0、B1及B2。因此,在此實例中,視訊寫碼器考慮鄰近區塊之至多五個同置區塊 (包括或外加H及C區塊)。在另一實例中,視訊寫碼器亦可考慮 NA區塊之同置區塊(例如,圖16中之11個NA區塊(NA1 , 1、NA1 , 2、NA1 , 3、NA1 , 4 、NA1 , 5、NA1 , 6、NA1 , 7、NA1 , 8、NA1 , 9、NA1 , 10、NA1 , 11))。
在一些實例中,視訊寫碼器考慮位於當前區塊之相對側處的同置區塊。舉例而言,對於圖16中之NA區塊NA1 , 6 (位於(-4,-4)位置處),視訊寫碼器可將對應NA同置區塊(亦即,與不鄰近區塊同置且為參考圖像的區塊)選擇為位於(W+3,H+3)處的區塊,其中W及H為以運動資訊之區塊大小(例如4×4)的基本單位計的當前區塊之寬度及高度。此產生處於當前區塊之底部及右側位置中的NA同置區塊之一集合。在一些實例中,視訊寫碼器以交錯方式添加MV候選者(亦即自NA同置區塊界定的MV候選者)之此集合至NA-SMVP。替代地,在一些實例中,視訊寫碼器可如在本發明中別處描述的現有AMVP或合併導出程序中一樣將MV候選者之此集合作為TMVP候選者之集合插入。
在一些實例中,視訊寫碼器可選擇多於一個同置圖像。換言之,視訊寫碼器可選擇多於一個參考圖像,自該等參考圖像導出TMVP候選者。在此等實例中,所選擇圖像可經定義為包括於參考圖像清單中之所有參考圖像或所選擇圖像可經發信。在一個實例中,對於每一所選擇參考圖像,視訊寫碼器可以與HEVC中 所使用之次序相同的次序 (亦即右下,接著中心)檢查所選擇參考圖像內的H及C區塊。替代地,在一個實例中,對於每一所選擇圖像,視訊寫碼器檢查更多區塊(例如在空間上鄰近之同置區塊及/或當前區塊之NA區塊)。
此外,當視訊寫碼器導出多個TMVP候選者時,視訊寫碼器可應用修剪程序以移除其中之相同候選者。替代地,在一些實例中,視訊寫碼器可應用有限修剪程序,此意謂TMVP候選者中之一者可僅僅與某一數目個候選者而非所有其他候選者相比較。此外,在一個實例中,視訊寫碼器可進一步在一個TMVP候選者與其他候選者 (諸如空間合併候選者)之間應用修剪程序。使用額外TMVP之所提議技術可應用於特定寫碼模式,諸如合併及/或AMVP模式。
如視訊技術電路及 系 統之 IEEE 彙刊, 2012 年 12 月, 第 22卷,第12號,第1649頁至1668頁,G. J. Sullivan, J.-R. Ohm, W.-J. Han及 T.  Wiegand 之「Overview  of  the  High  Efficiency  Video  Coding (HEVC) Standard」中所描述,歸因於與H.264/MPEG-4 AVC相比,增加數目之框內預測方向,當預測性地寫碼明度框內預測模式時 ,HEVC考慮三個最可能模式(MPM)而非H.264/MPEG-4  AVC中考慮的一個最可能模式。MPM係自在空間上鄰近區塊之框內模式導出。在當前明度預測模式為三個MPM中之一者的情況下,僅僅 MPM索引被傳輸至解碼器。另外,不包括三個MPM之當前明度預測模式的索引藉由使用5位元固定長度碼而傳輸至解碼器。JEM亦遵循相同框內模式預測方案。然而,JEM可包括多於三個MPM。
本發明提議使用不鄰近區塊之框內模式以導出一或多個MPM以達成較好預測效率的技術。先前章節中描述之技術可應用於 MPM導出。下文參看圖35及圖36提供自不鄰近區塊導出MPM的實例。
圖24為說明可實施本發明之技術的實例視訊編碼器20之方塊圖。出於解釋之目的提供圖24,且不應將該圖視為對如本發明中廣泛例示及描述之技術的限制。本發明之技術可應用於各種寫碼標準或方法。
處理電路包括視訊編碼器20,且視訊編碼器20經組態以執行本發明中所描述之實例技術中之一或多者。舉例而言,視訊編碼器20包括積體電路,且圖24中所說明之各種單元可形成為與電路匯流排互連之硬體電路區塊。此等硬體電路區塊可為單獨電路區塊或該等單元中之兩者或兩者以上可組合為共用硬體電路區塊。硬體電路區塊可形成為電力組件之組合,該等電力組件形成諸如算術邏輯單元 (ALU)、基礎功能單元(EFU)之操作區塊,以及諸如AND、OR、NAND、NOR、XOR、XNOR及其他類似邏輯區塊的邏輯區塊。
在一些實例中,圖24中所說明之單元中之一或多者可為在處理電路上執行之軟體單元。在此等實例中,用於此等軟體單元之目標碼儲存於記憶體中。作業系統可使得視訊編碼器20擷取目標碼並執行目標碼,其使得視訊編碼器20執行實施實例技術之操作。在一些實例中,軟體單元可為視訊編碼器20在啟動處執行之韌體。 因此,視訊編碼器20為具有執行實例技術之硬體或具有在硬體上執行以特化執行該等實例技術之硬體的軟體/韌體的結構性組件。
在圖 24 之實例中,視訊編碼器20包括預測處理單元100、視訊資料記憶體101、殘餘產生單元102、變換處理單元104、量化單元106、反量化單元108、反變換處理單元110、重構單元112、濾波器單元114、經解碼圖像緩衝器116及熵編碼單元118 。預測處理單元100包括框間預測處理單元120及框內預測處理單元126。框間預測處理單元120可包括運動估計單元及運動補償單元(圖中未示)。
視訊資料記憶體101可經組態以儲存待由視訊編碼器20 之組件編碼的視訊資料。儲存於視訊資料記憶體101中之視訊資料可(例如)自視訊源18獲得。經解碼圖像緩衝器116可為參考圖像記憶體,其儲存用於由視訊編碼器20在編碼視訊資料(例如,在框內或框間寫碼模式中)時使用之參考視訊資料。視訊資料記憶體101及經解碼圖像緩衝器116可由多種記憶體裝置中之任一者形成,諸如,動態隨機存取記憶體(DRAM),包括同步DRAM(SDRAM)、磁阻式RAM(MRAM)、電阻式RAM(RRAM) 或其他類型之記憶體裝置。可藉由相同記憶體裝置或獨立記憶體裝置來提供視訊資料記憶體101及經解碼圖像緩衝器116。在各種實例中,視訊資料記憶體101可與視訊編碼器20之其他組件一起在晶片上,或相對於彼等組件在晶片外。視訊資料記憶體 101可與圖1之儲存媒體19相同或為圖1之儲存媒體19的部分。
視訊編碼器20接收視訊資料。視訊編碼器20可編碼視訊資料之圖像之片段中的每一 CTU 。該等 CTU 中之每一者可與圖像之相等大小的明度寫碼樹型區塊(CTB)及對應CTB相關聯。作為編碼CTU之部分,預測處理單元100可執行分割以將CTU之CTB分成逐漸較小的區塊。該等較小區塊可為CU之寫碼區塊。舉例而言,預測處理單元100可根據樹狀結構分割與CTU相關聯的CTB。
視訊編碼器20可編碼CTU之CU以產生CU之經編碼表示(亦即,經寫碼 CU)。作為編碼 CU 之部分,預測處理單元 100 可分割與 CU 之一或多個PU中的CU相關聯之寫碼區塊。因此,每一PU可與明度預測區塊及對應的色度預測區塊相關聯。視訊編碼器20及視訊解碼器30可支援具有各種大小之PU。如上文所指示,CU之大小可指 CU 之明度寫碼區塊的大小,且PU之大小可指PU之明度預測區塊的大小。假定特定CU之大小為2N×2N,則視訊編碼器20及視訊解碼器30可支援用於框內預測的2N×2N或N×N之PU大小,及用於框間預測的 2N×2N、2N×N、N×2N、N×N或類似大小之對稱PU大小。視訊編碼器20及視訊解碼器30亦可支援用於框間預測的2N×nU、2N×nD、nL×2N及nR×2N之PU大小的不對稱分割。
框間預測處理單元120可產生用於PU之預測性資料。作為產生用於PU之預測性資料之部分,框間預測處理單元 120 對PU執行框間預測。用於PU之預測性資料可包括PU之預測性區塊及用於PU之運動資訊。取決於PU係在I圖塊中、P圖塊中抑或 B 圖塊中,框間預測處理單元120可針對CU之PU執行不同操作。在 I 圖塊中,所有PU經框內預測。因此,若PU在I 圖塊中,則框間預測處理單元 120並不對PU執行框間預測。因此,對於在I模式中編碼之區塊,經預測之區塊係使用空間預測自相同圖框內的先前經編碼之相鄰區塊而形成。若PU在P圖塊中,則框間預測處理單元 120 可使用單向框間預測以產生 PU之預測性區塊。若PU在B圖塊中,則框間預測處理單元120可使用單向或雙向框間預測以產生PU之預測性區塊。
框間預測處理單元120可執行本發明之特定技術。舉例而言,框間預測處理單元120可判定視訊資料之當前圖像之不鄰近區塊之運動向量,不鄰近區塊不鄰近於當前圖像之當前區塊。另外,框間預測處理單元120可基於不鄰近區塊之運動 向量判定當前區塊之MVP。另外,框間預測處理單元120可判定當前區塊之運動 向量,其中該運動向量等於當前區塊之MVP的運動向量或等於當前區塊之MVP的運動向量加在位元串流中發信之MVD。
框內預測處理單元126可藉由對PU執行框內預測而產生用於PU之預測性資料。用於PU之預測性資料可包括PU之預測性區塊及各種語法元素。框內預測處理單元126可對I圖塊、P圖塊及B圖塊中之PU執行框內預測。
為對PU執行框內預測,框內預測處理單元126可使用多個框內預測模式來產生用於PU之預測性資料的多個集合。框內預測處理單元126可使用來自鄰近PU之樣本區塊的樣本以產生用於PU之預測性區塊。對於PU、CU及CTU,假定自左至右、自上而下之編碼次序,則該等鄰近PU可在PU上方、右上方、左上方或左側。 框內預測處理單元 126 可使用各種數目之框內預測模式,例如,33個定向框內預測模式。在一些實例中,框內預測模式之數目可取決於與PU相關聯之區域的大小。
預測處理單元100可自由框間預測處理單元120所產生的用於PU之預測性資料中,或自由框內預測處理單元126所產生的用於 PU之預測性資料中選擇用於CU之PU的預測性資料。在一些實例中,預測處理單元100基於數組預測性資料之速率/失真量度而選擇用於 CU之PU的預測性資料。選定之預測性資料的預測性區塊在本文中可被稱作選定之預測性區塊。框內預測處理單元126可執行與MPM有關的本發明之技術。
殘餘產生單元102可基於CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)及CU之PU的所選預測性區塊(例如,預測性明度、Cb及Cr區塊)產生CU之殘餘區塊(例如,明度、Cb及Cr殘餘區塊)。舉例而言,殘餘產生單元102可產生CU之殘餘區塊,使得殘餘區塊中之每一樣本具有等於CU之寫碼區塊中的樣本與CU之PU之對應所選擇預測性樣本區塊中的對應樣本之間的差的值。
變換處理單元104可將CU之殘餘區塊分割成CU之TU的變換區塊。舉例而言,變換處理單元104可執行四分樹分割以將CU之殘餘區塊分割成CU之TU的變換區塊。因此,TU可與一明度變換區塊及兩個色度變換區塊相關聯。CU之TU的明度變換區塊及色度變換區塊的大小及位置可或可不基於CU之PU的預測區塊之大小及位置。被稱為「殘餘四分樹」(RQT)的四分樹結構可包括與區域中之每一者相關聯的節點。CU之TU可對應於RQT之葉節點。
變換處理單元104可藉由將一或多個變換應用於TU之變換區塊而產生CU之每一TU的變換係數區塊。變換處理單元104可將各種變換應用於與TU相關聯之變換區塊。舉例而言,變換處理單元104可將離散餘弦變換(DCT)、定向變換或概念上類似之變換應用 於變換區塊。在一些實例中,變換處理單元104並不將變換應用於變換區塊。在此等實例中,變換區塊可經處理為變換係數區塊。
量化單元106可將係數區塊中之變換係數量化。量化單元106可基於與CU相關聯之量化參數(QP)值來量化與CU之TU相關聯的係數區塊。視訊編碼器20可藉由調整與CU相關聯之QP值來調整應用於與CU相關聯之係數區塊的量化程度。量化可引入資訊的損失。因此,經量化變換係數可具有比最初變換係數低的精度。
反量化單元108及反變換處理單元110可分別將反量化及反變換應用於係數區塊,以自係數區塊重構殘餘區塊。重構單元112可將經重構之殘餘區塊添加至來自由預測處理單元100產生之一或多個預測性區塊的對應樣本,以產生與TU相關聯的經重構之變換區塊。藉由以此方式重構CU之每一TU的變換區塊,視訊編碼器20可重構CU之寫碼區塊。
濾波器單元114可執行一或多個解區塊操作以減小與 CU相關聯之寫碼區塊中的區塊假影。經解碼圖像緩衝器116可在濾波器單元114對經重構寫碼區塊執行一或多個解區塊操作之後,儲存經重構寫碼區塊。框間預測處理單元120可使用含有經重構寫碼區塊之參考圖像以對其他圖像之PU執行框間預測。另外,框內預測處理單元126可使用經解碼圖像緩衝器116中之經重構寫碼區塊,以對處於與CU相同之圖像中的其他PU執行框內預測。
熵編碼單元118可自視訊編碼器20的其他功能組件接收資料。舉例而言,熵編碼單元118可自量化單元106接收係數區塊,並可自預測處理單元100接收語法元素。熵編碼單元118可對資料執行一或多個熵編碼操作以產生經熵編碼的資料。舉例而言,熵編碼單元118可對資料執行CABAC操作、上下文自適應性可變長度寫碼 (CAVLC)操作、可變至可變(V2V)長度寫碼操作、基於語法之上下文自適應性二進位算術寫碼(SBAC)操作、概率區間分割熵(PIPE)寫碼操作、指數哥倫布編碼操作或另一類型之熵編碼操作。視訊編碼器20可輸出包括由熵編碼單元118所產生之經熵編碼資料的位元串流。舉例而言,位元串流可包括 表示用於CU之變換係數之值的資料。
圖25為說明經組態以實施本發明之技術的實例視訊解碼器30之方塊圖。出於解釋之目的而提供圖25,且其並不限制如本發明中所廣泛例示及描述之技術。 出於解釋之目的,本發明描述在HEVC寫碼之上下文中的視訊解碼器30。然而,本發明之技術可適用於其他寫碼標準或方法。
處理電路包括視訊解碼器30,且視訊解碼器30經組態以執行本發明中所描述之實例技術中之一或多者。舉例而言,視訊解碼器30包括積體電路,且圖25中所說明之各種單元可形成為與電路匯流排互連之硬體電路區塊。此等硬體電路區塊可為單獨電路區塊或該等單元中之兩者或兩者以上可組合為共用硬體電路區塊。硬體電路區塊可形成為電子組件之組合,該等電子組件形成諸如算術邏輯單元 (ALU)、基礎功能單元(EFU)之操作區塊,以及諸如AND、OR、NAND、NOR、XOR、XNOR及其他類似邏輯區塊的邏輯區塊。
在一些實例中,圖25中所說明之單元中之一或多者可為在處理電路上執行之軟體單元。在此等實例中,用於此等軟體單元之目標碼儲存於記憶體中。作業系統可使得視訊解碼器30擷取目標碼並執行目標碼,其使得視訊解碼器30執行實施實例技術之操作。在一些實例中,軟體單元可為視訊解碼器30在啟動處執行之韌體。因此,視訊解碼器30 為具有執行實例技術之硬體或具有在硬體上執行以特化執行該等實例技術之硬體的軟體/韌體的結構性組件。
在圖25之實例中,視訊解碼器30包括熵解碼單元150、視訊資料記憶體151、預測處理單元152、反量化單元154、反變換處理單元156、重構單元158、濾波器單元160,及經解碼圖像緩衝器162。預測處理單元152包括運動補償單元164及框內預測處理單元166。在其他實例中,視訊解碼器30可包括較多、較少或不同的功能組件。
視訊資料記憶體151可儲存待由視訊解碼器30之組件解碼的經編碼視訊資料,諸如經編碼視訊位元串流。儲存於視訊資料記憶體151中之視訊資料可(例如)經由視訊資料之有線或無線網路通信自電腦可讀媒體16(例如,自本端視訊源(諸如攝影機))或藉由存取實體資料儲存媒體獲得。視訊資料記憶體 151可形成儲存來自經編碼視訊位元串流之經編碼視訊資料的經寫碼圖像緩衝器(CPB)。經解碼圖像緩衝器162可為儲存用於視訊解碼器30(例如)以框內或框間寫碼模式解碼視訊資料或以供輸出之參考視訊資料的參考圖像記憶體。視訊資料記憶體151及經解碼圖像緩衝器162可由多種記憶體裝置中之任一者形成,諸如,動態隨機存取記憶體(DRAM),包括同步 DRAM(SDRAM)、磁阻式RAM(MRAM)、電阻式RAM(RRAM)或其他類型之記憶體裝置。視訊資料記憶體151及經解碼圖像緩衝器162可藉由同一記憶體裝置或單獨記憶體裝置來提供。在各種實例中,視訊資料記憶體151可與視訊解碼器30之其他組件一起在晶片上,或相對於彼等組件在晶片外。視訊資料記憶體151可與圖1之儲存媒體28相同或為圖1之儲存媒體28的部分。
視訊資料記憶體151接收並儲存位元串流之經編碼視訊資料(例如,NAL單元)。熵解碼單元150可自視訊資料記憶體151接收經編碼視訊資料(例如,NAL單元),且可剖析NAL單元以獲得語法元素。熵解碼單元150可對NAL單元中之經熵編碼語法元素進行熵解碼。預測處理單元152、反量化單元154、反變換處理單元156、重構單元158及濾波器單元160可基於自位元串流提取的語法元素而產生經解碼視訊資料。熵解碼單元150可執行大體上互逆於熵編碼單元118之彼程序的程序。
除自位元串流獲得語法元素之外,視訊解碼器30可對未經分割之CU執行重構操作。為對CU執行重構操作,視訊解碼器30可對CU之每一TU執行重構操作。藉由對CU之每一TU執行重構操作,視訊解碼器30可重構CU之殘餘區塊。
作為對CU之TU執行重構操作之部分,反量化單元154可反量化(例如,解量化)與TU相關聯之係數區塊。在反量化單元154反量化係數區塊之後,反變換處理單元 156可將一或多個反變換應用於係數區塊,以便產生與TU相關聯之殘餘區塊。舉例而言,反變換處理單元156可將反DCT、反整數變換、反Karhunen-Loeve變換(KLT)、反旋轉變換、反定向變換或另一反變換應用於係數區塊。
若使用框內預測編碼PU,則框內預測處理單元166可執行框內預測以產生PU之預測性區塊。框內預測處理單元166可使用框內預測模式來基於樣本空間鄰近區塊產生PU之預測性區塊。框內預測處理單元166可基於自位元串流獲得的一或多個語法元素判定用於PU之框內預測模式。框內預測處理單元166可執行與MPM有關的本發明之技術。
若使用框間預測編碼PU,則熵解碼單元150及/或運動補償單元164可判定用於PU之運動資訊。運動補償單元164可基於PU之運動資訊而判定一或多個參考區塊。 運動補償單元164可基於一或多個參考區塊產生PU之預測性區塊(例如,預測性明度、Cb及Cr區塊)。
根據本發明之技術,運動補償單元164可判定視訊資料之當前圖像之不鄰近區塊之運動向量,該不鄰近區塊不鄰近於當前圖像之當前區塊。另外,運動補償單元164可基於不鄰近區塊之運動向量判定用於當前區塊之運動。運動補償單元164亦可基於用於當前區塊之MVP判定當前區塊運動向量。
重構單元158可使用CU之TU之變換區塊(例如,明度、Cb及Cr變換區塊)及CU之PU之預測性區塊(例如,明度、Cb及Cr區塊)(亦即,可適用之框內預測資料或框間預測資料)來重構CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)。舉例而言,重構單元158可添加變換區塊(例如,明度、Cb及Cr變換區塊)之樣本至預測性區塊(例如,明度、Cb及Cr預測性區塊)之對應樣本來重構CU之寫碼區塊(例如,明度、Cb及Cr寫碼區塊)。
濾波器單元160可執行解區塊操作以減少與CU之寫碼區塊相關聯的區塊假影。視訊解碼器30可將CU之寫碼區塊儲存於經解碼圖像緩衝器162中。經解碼圖像緩衝器162可提供參考圖像用於後續運動補償、框內預測及在顯示裝置(諸如圖1之顯示裝置32)上的呈現。舉例而言,視訊解碼器30 可基於經解碼圖像緩衝器162 中之區塊對其他CU之PU執行框內預測或框間預測操作。
為了說明之目的,本發明之某些態樣已經關於HEVC標準之擴展而描述。然而,本發明中所描述之技術可用於其他視訊寫碼程序,包括尚未開發之其他標準或專有視訊寫碼程序。
如本發明中所描述,視訊寫碼器可指視訊編碼器或視訊解碼器。類似地,視訊寫碼單元可指視訊編碼器或視訊解碼器。同樣地,如適用,視訊寫碼可指視訊編碼或視訊解碼。在本發明中,片語「基於」可指示僅僅基於、至少部分地基於,或以某一方式基於。本 發明可使用術語「視訊單元」或「視訊區塊」或「區塊」以指代一或多個樣本區塊及用以寫碼樣本之一或多個區塊之樣本的語法結構。視訊單元之實例類型可包括CTU、CU、PU、變換單元(TU)、巨集區塊、巨集區塊分割區,等等。在一些情形中,PU之論述可與巨集區塊或巨集區塊分割區之論述互換。視訊區塊之實例類型可包括寫碼樹型區塊、寫碼區塊及其他類型之視訊資料區塊。
圖26為說明根據本發明之一或多個技術的用以編碼視訊資料之視訊編碼器的實例操作之流程圖。在圖26的實例中,視訊編碼器20可判定視訊資料之當前圖像之不鄰近區塊之運動向量(2600)。不鄰近區塊不鄰近於當前圖像之當前區塊。
此外,視訊編碼器20可基於不鄰近區塊之運動向量判定用於當前區塊之MVP(2602)。在一些實例中,用於當前區塊之MVP係在仿射模式中。換言之,運動向量經指定用於MVP中之控制點。在一些實例中,不鄰近區塊為界定不鄰近區塊相對 於當前區塊之位置的固定圖案的模板中之區塊。
在一個實例中,作為判定用於當前區塊之MVP之部分,視訊編碼器20可部分地基於不鄰近區塊之運動向量產生MVP候選者之清單。在此實例中,MVP候選者之清單包括指定不鄰近區塊之運動向量的MVP候選者。此外,在此實例中,視訊編碼器20可自MVP候選者之清單中的MVP候選者當中判定當前區塊之MVP。舉例而言,視訊編碼器20可使用RD成本分析以判定當前區塊之MVP。
在一些實例中,視訊編碼器20排序MVP候選者之清單中的複數個NA-SMVP候選者。在此等實例中,對於該複數個NA-SMVP候選者中之每一各別NA-SMVP候選者,各別NA-SMVP候選者對應於 複數個不鄰近區塊中之各別不鄰近區塊且各別NA-SMVP指定各別不鄰近區塊之運動向量。該複數個不鄰近區塊包括第一不鄰近區塊。此外,在此實例中,視訊編碼器20可根據對應不鄰近區塊距當前區塊之距離次序清單中之複數個NA-SMVP候選者。距離可在L1或L2意義上。
在一些實例中,視訊編碼器20判定第一複數個 NA-SMVP候選者。對於第一複數個NA-SMVP候選者中之每一各別 NA-SMVP候選者,各別NA-SMVP候選者對應於複數個不鄰近區塊中之各別不鄰近區塊。各別NA-SMVP指定各別不鄰近區塊之運動 向量。第一複數個不鄰近區塊包括第一不鄰近區塊。在此實例中,視訊編碼器20可將第二複數個NA-SMVP候選者包括在清單中,第二 複數個NA-SMVP候選者包含第一複數個NA-SMVP候選者中之非重複NA-SMVP候選者。以此方式,視訊編碼器20可執行自清單移除重複NA-SMVP候選者的修剪程序。第二複數個NA-SMVP候選者可根據藉由該第一複數個NA-SMVP候選者中之NA-SMVP候選者指定藉由該第二複數個NA-SMVP候選者中之NA-SMVP候選者指定之運動向量的一頻率在清單中排序。
在一些實例中,MVP候選者之清單為全域運動向量候選者清單。全域運動向量候選者清單包含指定在當前圖像中並在當前區塊之前經編碼的每一區塊之運動向量的MVP候選者。在此等實例中,視訊寫碼器可自全域運動向量候選者清單中之MVP候選者判定不鄰近區塊之運動向量。
此外,在一些實例中,視訊編碼器20將複數個不鄰近MVP候選者儲存在FIFO緩衝器中。該複數個不鄰近MVP候選者包括指定不鄰近區塊之運動向量的不鄰近MVP候選者。在此等實例中,視訊編碼器20更新FIFO緩衝器以自FIFO緩衝器移除較早添加之不鄰近MVP候選者並添加MVP候選者至FIFO緩衝器。
在一些實例中,視訊編碼器20將修剪程序應用於清單。修剪程序適應於當前區塊之區塊大小。舉例而言,可應用完整運動修剪程序或部分運動修剪程序,如在本發明中別處所描述。
視訊編碼器20亦可判定當前區塊之運動向量(2604)。在一些實例中,諸如在使用合併模式的情況下,當前區塊之運動向量等於MVP之運動向量。在一些實例中,諸如當使用AMVP時,當前區塊之運動向量等於MVP之運動向量加在位元串流中發信之MVD。
另外,視訊編碼器20可基於當前區塊之運動 向量判定預測性區塊(2606)。視訊編碼器20可基於預測性區塊產生殘 餘樣本值(2608)。視訊編碼器20可根據在本發明中別處提供的實例中之任一者判定預測性區塊並產生殘餘樣本值。
圖27為說明根據本發明之一或多個技術的用於解碼視訊資料之視訊解碼器30的實例操作之流程圖。在圖27的實例中,視訊解碼器30可判定視訊資料之當前圖像之不鄰近區塊之運動向量(2700)。不鄰近區塊不鄰近於當前圖像之當前區塊。在一些實例中,不鄰近區塊為界定區塊相對於當前區塊之一位置之一固定圖案的一模板中之區塊。
在一些實例中,MVP候選者之清單為全域運動向量候選者清單。全域運動向量候選者清單包含指定在當前圖像中並在當前區塊之前經編碼的每一區塊之運動向量的MVP候選者。在此等實例中,視訊寫碼器可自全域運動向量候選者清單中之MVP候選者判定不鄰近區塊之運動向量。
此外,在一些實例中,視訊解碼器30將複數個不鄰近MVP候選者儲存於FIFO緩衝器中。該複數個不鄰近MVP候選者包括指定不鄰近區塊之運動向量的不鄰近MVP候選者。在此等實例中,視訊編碼器20更新FIFO緩衝器以自FIFO緩衝器移除較早添加之不鄰近 MVP候選者並添加MVP候選者至FIFO緩衝器。
此外,視訊解碼器30可基於不鄰近區塊之運動向量判定當前區塊之MVP(2702)。在一些實例中,當前區塊之MVP可在仿射模式、非仿射模式,或經運動補償之預測的另一模式中。在一個實例中,作為判定當前區塊之MVP之部分,視訊解碼器30可部分地基於不鄰近區塊之運動向量產生MVP候選者之清單。在此實例中,MVP候選者之清單包括指定不鄰近區塊之運動向量的MVP候選者。此外,在此實例中,視訊解碼器30可自MVP候選者之清單中的 MVP候選者當中判定當前區塊之MVP。舉例而言,視訊解碼器30可使用速率失真分析以識別MVP候選者之清單中的最佳MVP。
在一些實例中,不鄰近區塊為第一不鄰近區塊且視訊解碼器30排序清單中之複數個NA-SMVP候選者。換言之,視訊解碼器30根據特定次序將複數個NA-SMVP候選者插入至清單中。在此等實例中,對於複數個NA-SMVP候選者中之每一各別NA-SMVP候選者,各別NA-SMVP候選者對應於複數個不鄰近區塊中之各別不鄰近區塊。各別NA-SMVP指定各別不鄰近區塊之運動向量。在一些實例中,視訊解碼器30根據對應不鄰近區塊距當前區塊之距離(例如依據L1或L2)在清單中排序複數個NA- SMVP候選者。在一些實例中,視訊解碼器30根據在本發明中別處提供的實例中之任一者排序複數個NA-SMVP候選者。
在一些實例中,不鄰近區塊為第一不鄰近區塊且視訊解碼器30進一步判定第一複數個NA-SMVP候選者。舉例而言,在此等實例中,對於第一複數個NA-SMVP候選者中之每一各別NA-SMVP候選者,該各別NA-SMVP 候選者對應於複數個不鄰近區塊之各別不鄰近區塊。各別NA-SMVP指定各別不鄰近區塊之運動 向量。第一複數個不鄰近區塊包括第一不鄰近區塊。此外,在此等實例中,視訊解碼器30可排序清單中之第二複數個NA-SMVP候選者。換言之,視訊解碼器30可根據特定次序在清單中包括第二複數個 NA-SMVP候選者。第二複數個NA-SMVP候選者包含第一複數個NA-SMVP候選者中之非重複NA-SMVP候選者。在一些實例中,第二複數個NA-SMVP候選者係根據藉由該第一複數個NA-SMVP候選者中之NA-SMVP候選者指定藉由該第二複數個NA-SMVP候選者中之該等NA-SMVP候選者指定之運動向量的一頻率在清單中排序。
在一些實例中,視訊解碼器30可將修剪程序應用於清單。在一些此等實例中,修剪程序適應於當前區塊之區塊大小。在一些實例中,視訊解碼器30將完整運動修剪程序應用於NA-SMVP及其他合併候選者,如在本發明中別處所描述。在一些實例中,視訊解碼器 30僅僅將部分運動修剪程序應用於NA-SMVP及其他合併候選者,如在本發明中別處所描述。
另外,視訊解碼器30可基於當前區塊之MVP判定當前區塊之運動向量(2704)。在一些實例中,若MVP候選者之清單為合併候選者清單,則視訊解碼器30可判定當前區塊之MVP,使得當前區塊之MVP指定MVP候選者之清單中的MVP候選者之運動向量。在一些實例中,若MVP候選者之清單為AMVP候選者清單,則視訊解碼器30可判定當前區塊之MVP,使得當前區塊之MVP的運動向量等於MVP候選者之清單中的MVP候選者之運動向量加MVD。
視訊解碼器30亦可基於當前區塊之運動向量判定預測性區塊(2706)。舉例而言,視訊解碼器30可基於在藉由運動向量指示之位置處的參考圖像之樣本判定預測性區塊,如在本發明中別處詳細地描述。視訊解碼器30接著可基於預測性區塊重構當前圖像之樣本值 (2708)。舉例而言,視訊解碼器30可藉由添加預測性區塊中之樣本值至殘餘樣本值重構當前圖像之樣本值。
圖28為說明根據本發明之技術的用於使用FRUC運動 向量候選者判定NA-SMVP的實例操作之流程圖。在圖28的實例中,視訊寫碼器(例如視訊編碼器20或視訊解碼器30)可判定CU層級圖框速率向上轉換(FRUC) 運動向量候選者之集合(2800)。另外,視訊寫碼器可自CU層級FRUC運動向量候選者之集合選擇CU層級FRUC運動向量候選者(2802)。視訊寫碼器可至少部分地藉由執行自所選擇 CU層級FRUC運動向量候選者開始之本端搜尋判定CU層級運動向量(2804)。此外,視訊寫碼器可運用FRUC子CU層級運動向量候選者之集合在子CU層級處改進CU層級運動向量(2806)。根據本發明之技術,CU層級FRUC運動向量候選者之集合及FRUC子CU層級運動 向 量候選者之集合中的至少一者包括指定圖26及圖27之不鄰近區塊之運動向量的NA-SMVP。FRUC程序可以其他方式與在本發明中別處提供的實例一致。
圖29為說明根據本發明之一或多個技術的將合成候選者包括於當前區塊之MVP候選者之清單中的視訊編碼器20之實例操作的流程圖。在圖29的實例中,視訊編碼器20可判定用於視訊資料之當前圖像之當前區塊的MVP候選者之清單(2900)。MVP候選者之清單包括雙向預測MVP候選者及合成單向預測MVP候選者。此外,在圖29的實例中及根據本發明之技術,作為判定MVP候選者之清單之部分,視訊編碼器20基於藉由雙向預測MVP候選者指定之運動 向量產生合成單向預測MVP 候選者(2902)。在一個實例中,視訊編碼器20藉由根據預定義次序將可用雙向預測MV候選者分裂成兩個獨立單向預測候選者而產生合成單向預測候選者。在此實例中,視訊編碼器20接著可將產生之合成單向預測候選者插入至候選者清單中。在一些實例中,當整數MVD或四個明度樣本MVD啟用時,視訊編碼器20可藉由將可用MV候選者捨入或截斷成整數MV或四個明度樣本MV候選者而產生合成整數或四個明度樣本MV候選者。在此等實例中,視訊編碼器20將合成整數MV候選者或4明度樣本MV候選者插入至候選者清單中。
此外,在圖29的實例中,視訊編碼器20可基於MVP候選者之清單中之所選擇MVP候選者之運動向量判定當前區塊之 MVP(2904)。另外,視訊編碼器20可判定當前區塊之運動向量(2906)。在一些實例中,諸如在使用合併模式的情況下,當前區塊之運動向量等於MVP之運動向量。在一些實例中,諸如當使用AMVP時,當前區塊之運動向量等於MVP之運動向量加在位元串流中發信之MVD。
視訊編碼器20亦可基於當前區塊之運動向量判定預測性區塊(2908)。此外,視訊編碼器20可基於預測性區塊產生殘餘樣本值(2910)。視訊編碼器20可根據在本發明中別處提供的實例中之任一者判定預測性區塊並產生殘餘樣本值。
圖30為說明根據本發明之一或多個技術的將合成候選者包括於當前區塊之MVP候選者之清單中的視訊解碼器30之實例操作的流程圖。在圖30的實例中,視訊解碼器30可判定用於視訊資料之當前圖像之當前區塊的MVP候選者之清單(3000)。MVP候選者之清單包括雙向預測MVP 候選者及合成單向預測MVP候選者。此外,在圖30的實例中及根據本發明之技術,作為判定MVP候選者之清單之部分,視訊解碼器30基於藉由雙向預測MVP候選者指定之運動向量產生合成單向預測MVP候選者(3002)。在一個實例中,視訊解碼器30藉由根據預定義次序將可用雙向預測MV候選者分裂成兩個獨立單 向預測候選者產生合成單向預測候選者。在此實例中,視訊解碼器30接著可將產生之合成單向預測候選者插入至候選者清單中。在一些實例中,當整數MVD或四個明度樣本MVD啟用時,視訊解碼器30藉由將可用MV候選者捨入或截斷成整數MV或四個明度樣本MV候選者而產生合成整數或四個明度樣本MV候選者。在此等實例中,視訊解碼器30將合成整數MV候選者或4個明度樣本MV候選者插入至候選者清單中。
在圖30的實例中,視訊解碼器30接著可基於MVP候選者之清單中之所選擇MVP候選者之運動向量判定當前區塊之MVP(3004)。另外,視訊解碼器30基於當前區塊之MVP判定當前區塊之運動向量(3006)。視訊解碼器30可基於當前區塊之運動向量判定預測性區塊(3008)。此外,視訊解碼器30可基於預測性區塊重構當前圖像之樣本值(3010)。視訊解碼器30可根據在本發明中別處提供的實例中之任一者選擇MVP候選者,判定運動向量,判定預測性區塊,並重構當前圖像之值。
圖31為說明根據本發明之技術的用於編碼視訊資料之視訊編碼器20的實例操作之流程圖。在圖31的實例中,視訊編碼器20判定用於視訊資料之當前圖像之當前區塊的MVP候選者之清單(3100)。視訊編碼器20可根據在本發明中別處提供之實例中之任一者判定MVP 候選者的清單。另外,根據本發明之技術,視訊編碼器20藉由將清單中之 MVP候選者捨入或截斷至整數解析度或4明度樣本解析度而判定合成 MVP候選者(3102)。視訊編碼器20接著可將合成MVP候選者插入於MVP 候選者之清單中(3104)。
視訊編碼器20接著可基於MVP候選者之清單中之所選擇MVP候選者之運動向量判定當前區塊之運動向量預測子(MVP)(3106)。舉例而言,視訊編碼器20可使用速率失真測試以選擇用於當前區塊之MVP。此外,視訊編碼器20可判定當前區塊之運動向量(3108)。在一些實例中,諸如在使用合併模式的情況下,當前區塊之運動向量等於MVP之運動向量。在一些實例中,諸如當使用AMVP時,當前區塊之運動向量等於MVP之運動向量加在位元串流中發信之MVD。
視訊編碼器20可基於當前區塊之運動向量判定預測性區塊(3110)。接下來,視訊編碼器20可基於預測性區塊產生殘餘樣本值(3112)。視訊編碼器20可根據在本發明中別處提供的實例中之任一者判定預測性區塊並產生殘餘樣本值。
圖32為說明根據本發明之技術的用於解碼視訊資料之視訊解碼器30之實例操作的流程圖。在圖32的實例中,視訊解碼器30判定用於視訊資料之當前圖像之當前區塊的MVP候選者之清單(3200)。視訊解碼器30可根據在本發明中別處提供的實例中之任一者判定MVP候選者之清單。另外,根據本發明之技術,視訊解碼器30可藉由將清單中之MVP候選者捨入或截斷至整數解析度或4明度樣本解析度判定合成MVP候選者(3202)。視訊解碼器30接著可將合成MVP候選者插入於MVP候選者之清單中(3204)。
隨後,視訊解碼器30可基於MVP候選者之清單中之所選擇MVP候選者之運動向量判定當前區塊之MVP(3206)。另外,視訊解碼器30可基於當前區塊之MVP判定當前區塊之運動向量(3208)。視訊解碼器30亦可基於當前區塊之運動向量判定預測性區塊(3210)。此外,視訊解碼器30可基於預測性區塊重構當前圖像之樣本值(3212)。視訊解碼器30可根據在本發明中別處提供的實例中之任一者選擇MVP候選者,判定運動向量,判定預測性區塊,並重構當前圖像之值。
圖33為說明根據本發明之技術的用於編碼視訊資料之視訊編碼器20的實例操作之流程圖。在圖33的實例中,視訊編碼器20可判定用於視訊資料之當前圖像之當前區塊的MVP候選者之清單(3300)。一般而言,視訊編碼器20可根據在本發明中別處提供的實例中之任一者判定MVP候選者之清單。然而,根據本發明之技術,MVP候選者之清單包括複數個TMVP候選者。MVP候選者之清單中的每一各別 MVP候選者指定各別運動向量。該複數個TMVP候選者中之各別TMVP候選者指定一或多個參考圖像(例如單一參考圖像、複數個參考圖像等)中之一或多個區塊的運動向量。
在一些實例中,該複數個TMVP候選者包括指定與當前圖像中之位置(例如,鄰近於當前區塊之位置、並不鄰近於當前區塊之位置)同置的參考區塊之運動向量的兩個或大於兩個TMVP候選者。在此等實例中,參考區塊為一或多個參考圖像之區塊。
在一些實例中,視訊編碼器20將修剪程序應用於MVP候選者之清單。舉例而言,視訊編碼器 20 可將修剪程序應用於MVP候選者之清單以移除MVP候選者之清單中的所有或一些相同MVP候選者。
此外,在圖33的實例中,視訊編碼器20可基於MVP候選者之清單中之所選擇MVP候選者之運動向量判定當前區塊之 MVP(3302)。舉例而言,視訊編碼器20可使用速率失真測試以判定當前區塊之MVP。視訊編碼器20亦可判定當前區塊之運動向量(3304)。在一些實例中,諸如在使用合併模式的情況下,當前區塊之運動向量等於MVP之運動向量。在一些實例中,諸如當使用AMVP時,當前區塊之運動向量等於MVP之運動向量加在位元串流中發信之MVD。
此外,視訊編碼器20可使用當前區塊之運動向量以判定預測性區塊(3306)。另外,視訊編碼器20可基於預測性區塊產生殘餘樣本值(3308)。視訊編碼器20可根據在本發明中別處提供的實例中之任一者判定預測性區塊並產生殘餘樣本值。
圖34為說明根據本發明之一或多個實例的用於解碼視訊資料之視訊解碼器30的實例操作之流程圖。在圖34的實例中,視訊解碼器30可判定用於視訊資料之當前圖像之當前區塊的MVP候選者之清單(3400)。一般而言,視訊解碼器30可根據在本發明中別處提供的實例中之任一者判定MVP候選者之清單。然而,根據本發明之技術,MVP候選者之清單包括複數個TMVP候選者。MVP候選者之清單中的每一各別MVP候選者指定各別運動向量。該複數個TMVP候選者中之各別TMVP候選者指定一或多個參考圖像(例如單一參考圖像、複數個參考圖像等)中之一或多個區塊的運動向量。
在一個實例中,該複數個TMVP候選者包括指定與當前圖像中之位置同置的參考區塊之運動向量的兩個或大於兩個TMVP候選者。在此實例中,參考區塊為一或多個參考圖像(例如單一參考圖像、複數個參考圖像等)之區塊。在此實例之一些情況下,該等位置鄰近於當前區塊。在此實例之一些情況下,該等位置不鄰近於當前區塊。
在一些實例中,視訊解碼器30可將修剪程序應用於MVP候選者之清單。舉例而言,視訊解碼器30可將修剪程序應用於MVP候選者之清單以移除MVP候選者之清單中的所有或一些相同MVP候選者。
此外,在圖34的實例中,視訊解碼器30可基於MVP候選者之清單中之所選擇MVP候選者之運動向量判定當前區塊之 MVP(3402)。視訊解碼器30可基於當前區塊之MVP判定當前區塊之運動向量(3404)。另外,視訊解碼器30可基於當前區塊之運動向量判定預測性區塊(3406)。視訊解碼器30可基於預測性區塊重構當前圖像之樣本值(3408)。視訊解碼器30可根據在本發明中別處提供的實例中之任一者選擇MVP候選者,判定運動向量,判定預測性區塊,並重構當前圖像之值。
圖35為說明根據本發明之技術的用於編碼視訊資料之視訊編碼器20之實例操作的流程圖。在圖35的實例中,視訊編碼器20可判定複數個最可能模式(MPM)(3500)。該複數個MPM中之每一各別MPM指定各別區塊之各別框內預測模式。在圖35的實例中,該複數個MPM包括指定視訊資料之當前圖像之不鄰近區塊之框內預測模式的特定MPM。不鄰近區塊不鄰近於當前圖像之當前區塊。在一些實例中,不鄰近區塊為界定不鄰近區塊相對於當前區塊之位置的固定圖案的模板中之區塊。在其他實例中,不鄰近區塊為在當前區塊之特定距離內的區塊。可 根據在本發明中別處提供的實例中之任一者判定不鄰近區塊。
在一些實例中,作為判定該複數個MPM之部分,視訊編碼器20可判定MPM之排序清單。在此等實例中,基於不鄰近區塊之 MPM係根據藉由複數個不鄰近區塊中之不鄰近區塊指定框內預測模式的頻率在清單中排序。在其他實例中,基於不鄰近區塊之MPM不根據此頻率在清單中排序。
在一些實例中,為判定該複數個MPM,視訊編碼器20可判定包含指定在當前圖像中且在當前區塊之前編碼的每一區塊之運動資訊之MPM的全域MPM清單。在此等實例中,視訊編碼器20可自全域運動向量候選者清單中之MPM判定MPM。在一些實例中,視訊編碼器20可在FIFO緩衝器中儲存複數個不鄰近MPM。在此等實例中,該複數個不鄰近MPM包括指定不鄰近區塊之框內預測模式的不鄰近MPM。此外,在此等實例中,視訊編碼器20可更新FIFO緩衝器以自FIFO緩衝器中移除較早添加之不鄰近MPM且可添加一MPM至FIFO緩衝器。該複數個MPM可包括FIFO緩衝器中之MPM。
此外,在圖35的實例中,視訊編碼器20可基於藉由複數個MPM中之MPM指定的框內預測模式產生預測性區塊(3502)。另外,視訊編碼器20可基於預測性區塊產生殘餘樣本值(3504)。視訊編碼器20可根據在本發明中別處提供的實例中之任一者判定預測性區塊並產生殘餘樣本值。
圖36係說明根據本發明之技術的用於解碼視訊資料之視訊解碼器30之實例操作的流程圖。在圖36的實例中,視訊解碼器30可判定複數個MPM(3600)。該複數個MPM中之每一各別MPM指定各別區塊之各別框內預測模式。根據本發明之技術,該複數個MPM包括指定視訊資料之當前圖像之不鄰近區塊之框內預測模式的特定 MPM。不鄰近區塊不鄰近於當前圖像之當前區塊。在一些實例中,不鄰近區塊為界定不鄰近區塊相對於當前區塊之位置的固定圖案的模板中之區塊。在其他實例中,不鄰近區塊距當前區塊固定距離。可根據在本發明中別處提供的實例中之任一者判定不鄰近區塊。
在一些實例中,作為判定該複數個MPM之部分,視訊解碼器30可判定MPM之排序清單。在此等實例中,基於不鄰近區塊之 MPM係根據藉由複數個不鄰近區塊中之不鄰近區塊指定框內預測模式的頻率在清單中排序。在其他實例中,基於不鄰近區塊之 MPM不根據此頻率在清單中排序。
在一些實例中,該複數個MPM為包含指定在當前圖像中且在當前區塊之前編碼的每一區塊之運動資訊的MPM之全域MPM清單。在此等實例中,視訊解碼器30可自全域運動向量候選者清單中之MPM判定一MPM。在一些實例中,視訊解碼器30可在先進先出 (FIFO)緩衝器中儲存複數個不鄰近MPM。在此等實例中,該複數個不鄰近MPM包括指定不鄰近區塊之框內預測模式的不鄰近MPM。此外,在此等實例中,視訊解碼器30可更新FIFO緩衝器以自FIFO緩衝器中移除較早添加之不鄰近MPM並添加一MPM至FIFO緩衝器。該複 數個MPM可包括FIFO緩衝器中之MPM。
此外,在圖36的實例中,視訊解碼器30可基於藉由複數個MPM中之MPM指定的框內預測模式產生預測性區塊(3602)。另外,視訊解碼器30可基於預測性區塊重構當前圖像之樣本值(3604)。視訊解碼器30可根據在本發明中別處提供的技術中之任一者產生預測性區塊 並重構樣本值。
本發明之技術可應用於支援多種多媒體應用中之任一者的視訊寫碼,諸如,空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(諸如,經由HTTP之動態自適應串流(DASH))、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上的數位視訊之解碼或其他應用。
在本發明中,諸如「第一」、「第二」、「第三」等之序數術語未必為次序內位置之指示符,而是可僅僅用以區分同一事物之不同個例。
應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可以不同序列被 執行、可被添加、合併或完全省去(例如,並非所有所描述動作或事件為實踐該等技術所必要)。此外,在某些實例中,可例如經由多執行緒處理、中斷處理或多個處理器同時而非順序執行動作或事件。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則該等功能可作為一或多個指令或程式碼而在電腦可讀媒體上儲存或傳輸,且由基於硬體之處理單元執行。 電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體(其包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體)。以此方式,電腦可讀媒體通常 可對應於(1)非暫時性之有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可藉由一或多個電腦或一或多個處理電路存取以擷取指令、程式碼及/ 或資料結構以用於實施本發明中描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉助於實例且非限制,此類電腦可讀媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存裝置、磁碟儲存器或其他磁性儲存裝置、快閃記憶體、快取記憶體或可用於儲存呈指令或資料結構形式之所要程式碼且可由電腦存取之任何其他媒體。 而且,任何連接被恰當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術,自網站、伺服器或其他遠端源來傳輸指令,則同軸纜線、光纖纜線、雙絞線、 DSL或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為係關於非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟碟及 Blu-ray光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各者的組合亦應包括於電腦可讀媒體之範疇內。
本發明中所描述之功能可藉由固定功能及/或可程式化處理電路執行。舉例而言,指令可藉由固定功能及/或可程式化處理電路執行。此處理電路可包括一或多個處理器,諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路 (ASIC)、場可程式化邏輯陣列(FPGA) 或其他等效整合或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指上述結構或適合於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,本文所描述之功能可經提供於經組態以供編碼及解碼或 併入於經組合編碼解碼器中之專用硬體及/或軟體模組內。此外,該等技術可完全實施於一或多個電路或邏輯元件中。處理電路可以各種方式耦接至其他組件。舉例而言,處理電路可經由內部裝置互連件、有線或無線網路連接或另一通信媒體耦接至其他組件。
本發明之技術可實施於多種裝置或設備中,包括無線手機、積體電路(IC)或IC集合(例如晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之裝置的功能態樣,但未必要求由不同硬體單元來實現。確切地說,如上文所描述,各種單元可與合適的軟體及/ 或韌體一起組合在編碼解碼器硬體單元中或由互操作硬體單元之集合提供,硬件單元包括如上文所描述之一或多個處理器。
各種實例已予以描述。此等及其他實例在以下申請專利範圍之範疇內。
10:系統 12:源裝置 14:目的地裝置 16:電腦可讀媒體 18:視訊源 19:儲存媒體 20:視訊編碼器 22:輸出介面 26:輸入介面 28:儲存媒體 30:視訊解碼器 32:顯示裝置 100:預測處理單元 101:視訊資料記憶體 102:殘餘產生單元 104:變換處理單元 106:量化單元 108:反量化單元 110:反變換處理單元 112:重構單元 114:濾波器單元 116:經解碼圖像緩衝器 118:熵編碼單元 120:框間預測處理單元 126:框內預測處理單元 150:熵解碼單元 151:視訊資料記憶體 152:預測處理單元 154:反量化單元 156:反變換處理單元 158:重構單元 160:濾波器單元 162:經解碼圖像緩衝器 164:運動補償單元 166:框內預測處理單元 500:圖像 502:圖像 504:圖像 600:當前區塊 602:當前圖像 604:第一運動向量(MV0) 606:第二運動向量(MV1) 608:參考區塊 610:list0參考圖像 612:參考區塊 614:list1參考圖像 616:預測性區塊 618:區塊 620:區塊 622:運動向量(MV0') 624:運動向量(MV1') 700:當前寫碼單元(CU) 702:當前圖像 704:運動源圖像/參考圖像 706:對應區塊 708:時間向量 900:當前仿射區塊 902:左上方控制點 904:右上方控制點 906:左下方控制點 1000:當前仿射區塊 1002:左上方控制點 1004:右上方控制點 1200:寫碼單元(CU) 1500:不鄰近區塊 1502:當前區塊 1504:鄰近非經重構區塊 1506:不鄰近非經重構區塊 1600:當前區塊 1700:親代區塊 1702:當前區塊 1800:當前寫碼樹型單元(CTU) 1802:當前寫碼單元(CU):(curr) 1804:位置NA 1806:位置NA' 1850:寫碼樹型單元(CTU) 1852:當前寫碼單元(CU):(curr) 1854:位置NA 1856:經修改位置NA' 1900:當前寫碼樹型單元(CTU) 1902:當前寫碼單元(CU):(curr) 1950:寫碼樹型單元(CTU) 1952:當前寫碼單元(CU):(curr) 2000:當前區塊 2100:當前區塊 2200:當前區塊 2600:步驟 2602:步驟 2064:步驟 2606:步驟 2608:步驟 2700:步驟 2702:步驟 2704:步驟 2706:步驟 2708:步驟 2800:步驟 2802:步驟 2804:步驟 2806:步驟 2900:步驟 2902:步驟 2904:步驟 2906:步驟 2908:步驟 2910:步驟 3000:步驟 3002:步驟 3004:步驟 3006:步驟 3008:步驟 3010:步驟 3100:步驟 3102:步驟 3104:步驟 3106:步驟 3108:步驟 3110:步驟 3112:步驟 3200:步驟 3202:步驟 3204:步驟 3206:步驟 3208:步驟 3210:步驟 3212:步驟 3300:步驟 3302:步驟 3304:步驟 3306:步驟 3308:步驟 3400:步驟 3402:步驟 3404:步驟 3406:步驟 3408:步驟 3500:步驟 3502:步驟 3504:步驟 3600:步驟 3602:步驟 3604:步驟
圖1為說明可使用本發明中所描述之一或多個技術之一實例視訊編碼及解碼系統的方塊圖。
圖2為用於合併/跳過模式之空間及時間相鄰運動向量候選者的實例。
圖3為雙向匹配之實例。
圖4為模板匹配之實例。
圖5為圖框速率向上轉換中單側運動估計之實例。
圖6為基於雙向模板匹配之解碼器側運動向量改進的實例。
圖7為用於寫碼單元之進階時間運動向量預測運動預測的實例。
圖8為具有四個子區塊之一個寫碼單元及其相鄰區塊的實例。
圖9為用於當前仿射區塊之實例簡化仿射運動模型之方塊圖。
圖10為用於當前仿射區塊之簡化仿射運動模型之實例。
圖11為運動補償預測運動向量場之實例。
圖12為儲存之運動向量場的實例。
圖13為用於AF_INTER之運動向量預測的實例。
圖14A為說明用於AF_MERGE之候選者區塊的選擇次序之方塊圖。
圖14B為說明在左下方候選者區塊在仿射模式中寫碼的情況下用於AF_MERGE之候選者的方塊圖。
圖15為說明根據本發明之技術之實例不鄰近區塊的方塊圖。
圖16為說明根據本發明之技術之不鄰近區塊的選擇的實例之方塊圖。
圖17為說明基於親代區塊之不鄰近區塊的選擇之實例的方塊圖。
圖18A為說明根據本發明之技術的不鄰近區塊之位置修改之實例的方塊圖。
圖18B為說明根據本發明之技術的不鄰近區塊之位置修改之實例的方塊圖。
圖19A為說明根據本發明之技術的用於修改不鄰近區塊之臨限值之實例的方塊圖。
圖19B為說明根據本發明之技術的用於修改不鄰近區塊之臨限值之實例的方塊圖。
圖20為說明根據本發明之技術的不鄰近區塊之選擇的實例之方塊圖。
圖21為說明根據本發明之技術的不鄰近區塊之選擇的實例之方塊圖。
圖22為說明根據本發明之技術的不鄰近區塊之選擇的實例之方塊圖。
圖23為說明根據本發明之技術的基於親代區塊之不鄰近區塊的選擇之實例的方塊圖。
圖24為可實施本發明中所描述之一或多個技術的一實例視訊編碼器的方塊圖。
圖25為說明可實施本發明中所描述之一或多個技術的一實例視訊解碼器的方塊圖。
圖26為說明根據本發明之一或多個技術的用以編碼視訊資料之視訊編碼器的實例操作之流程圖。
圖27為說明根據本發明之一或多個技術的用於解碼視訊資料之視訊解碼器的實例操作之流程圖。
圖28為說明根據本發明之技術的用於使用圖框速率向上轉換(FRUC)運動向量候選者判定NA-SMVP之實例操作的流程圖。
圖29為說明根據本發明之一或多個技術的將合成候選者包括於用於當前區塊之MVP候選者之清單中的視訊編碼器之實例操作的流程圖。
圖30為說明根據本發明之一或多個技術的將合成候選者包括於用於當前區塊之MVP候選者之清單中的視訊解碼器之實例操作的流程圖。
圖31為說明根據本發明之技術的用於編碼視訊資料之視訊編碼器之實例操作的流程圖。
圖32為說明根據本發明之技術的用於解碼視訊資料之視訊解碼器之實例操作的流程圖。
圖33為說明根據本發明之技術的用於編碼視訊資料之視訊編碼器之實例操作的流程圖。
圖34為說明根據本發明之技術的用於解碼視訊資料之視訊解碼器之實例操作的流程圖。
圖35為說明根據本發明之技術的用於編碼視訊資料之視訊編碼器之實例操作的流程圖。
圖36為說明根據本發明之技術的用於解碼視訊資料之視訊解碼器之實例操作的流程圖。
2700:步驟
2702:步驟
2704:步驟
2706:步驟
2708:步驟

Claims (14)

  1. 一種解碼之方法,包含: 藉由一視訊解碼器產生一先進先出(FIFO)運動向量預測子(MVP)候選者清單緩衝器,其中產生該FIFO MVP候選者清單緩衝器包含: 藉由該視訊解碼器判定在一當前圖像之一當前區塊之前經解碼的該當前圖像之一區塊之運動資訊,其中該區塊之該運動資訊包含一運動向量及一參考索引;及 藉由該視訊解碼器更新該FIFO MVP候選者清單緩衝器以自該FIFO MVP候選者清單緩衝器移除一較早添加之MVP候選者並將該區塊之該運動資訊作為一MVP候選者添加至該FIFO MVP候選者清單緩衝器; 藉由該視訊解碼器自該MVP候選者清單緩衝器中之該複數個MVP 候選者判定該當前區塊之一MVP,其中在該MVP候選者清單緩衝器中之該複數個MVP 候選者包含不鄰近於該當前區塊之該當前圖像之至少一不鄰近區塊之運動資訊; 藉由該視訊解碼器基於該當前區塊之該MVP 判定該當前區塊之一運動向量; 藉由該視訊解碼器基於該當前區塊之該運動向量判定一預測性區塊;及 藉由該視訊解碼器基於該預測性區塊重構該當前圖像之該當前區塊之樣本值。
  2. 如請求項1之方法,其中該當前區塊之該MVP係在仿射模式中。
  3. 如請求項1之方法,其中判定該當前區塊之該運動向量包含: 藉由該視訊解碼器判定該當前區塊之該運動向量,使得該當前區塊之該運動向量指定該當前區塊之該MVP之一運動向量或使得該當前區塊之該運動向量等於該當前區塊之該 MVP 之運動資訊之一運動向量加一運動向量差(MVD)。
  4. 如請求項1之方法,其進一步包含: 藉由該視訊解碼器判定寫碼單元(CU)層級圖框速率向上轉換(FRUC)運動向量候選者之一集合; 藉由該視訊解碼器自CU層級FRUC運動向量候選者之該集合選擇一CU層級FRUC運動向量候選者; 藉由該視訊解碼器至少部分地藉由執行自一所選擇CU層級FRUC運動向量候選者開始之一本端搜尋判定一CU層級運動向量;及 藉由該視訊解碼器運用FRUC子CU層級運動向量候選者之一集合在一子CU層級處改進該CU層級運動向量, 其中,CU層級FRUC運動向量候選者之該集合及FRUC子CU層級運動向量候選者之該集合中的至少一者包括指定該不鄰近區塊之該運動 向量的一不鄰近空間運動向量預測子(NA-SMVP)。
  5. 一種編碼之方法,包含: 藉由一視訊編碼器產生一先進先出(FIFO)運動向量預測子(MVP)候選者清單緩衝器,其中產生該FIFO MVP候選者清單緩衝器包含: 藉由該視訊編碼器判定在一當前圖像之一當前區塊之前經解碼的該當前圖像之一區塊之運動資訊,其中該區塊之該運動資訊包含一運動向量及一參考索引;及 藉由該視訊編碼器更新該FIFO MVP候選者清單緩衝器以自該FIFO MVP候選者清單緩衝器移除一較早添加之MVP候選者並將該區塊之該運動資訊作為一MVP候選者添加至該FIFO MVP候選者清單緩衝器; 藉由該視訊編碼器自該MVP候選者清單緩衝器中之該複數個MVP 候選者判定該當前區塊之一MVP,其中在該MVP候選者清單緩衝器中之該複數個MVP 候選者包含不鄰近於該當前區塊之該當前圖像之至少一不鄰近區塊之運動資訊; 藉由該視訊編碼器基於該當前區塊之該MVP 判定該當前區塊之一運動向量; 藉由該視訊編碼器基於該當前區塊之該運動向量判定一預測性區塊;及 藉由該視訊編碼器基於該預測性區塊產生殘餘樣本值。
  6. 如請求項5之方法,其中該當前區塊之該MVP係在仿射模式中。
  7. 如請求項5之方法,進一步包含: 藉由該視訊編碼器判定寫碼單元(CU)層級圖框速率向上轉換(FRUC)運動向量候選者之一集合; 藉由該視訊編碼器自CU層級FRUC運動向量候選者之該集合選擇一CU層級FRUC運動向量候選者; 藉由該視訊編碼器至少部分地藉由執行自一所選擇CU層級FRUC運動向量候選者開始之一本端搜尋判定一CU層級運動向量;及 藉由該視訊編碼器運用FRUC子CU層級運動向量候選者之一集合在一子CU層級處改進該CU層級運動向量, 其中,CU層級FRUC運動向量候選者之該集合及FRUC子CU層級運動向量候選者之該集合中的至少一者包括指定該不鄰近區塊之該運動向量的一不鄰近空間運動向量預測子(NA-SMVP)。
  8. 一種用於解碼之設備,該設備包含: 一或多個儲存媒體,其經組態以儲存視訊資料;及 一或多個處理器,實現於電路中,該一或多個處理器經組態以: 產生一先進先出(FIFO)運動向量預測子(MVP)候選者清單緩衝器,其中該一或多個儲存媒體經組態以儲存該FIFO MVP候選者清單緩衝器且該一或多個處理器,作為產生該FIFO MVP候選者清單緩衝器之部分,經組態以: 判定在一當前圖像之一當前區塊之前經解碼的該當前圖像之一區塊之運動資訊,其中該區塊之該運動資訊包含一運動向量及一參考索引;及 更新該FIFO MVP候選者清單緩衝器以自該FIFO MVP候選者清單緩衝器移除一較早添加之MVP候選者並將該區塊之該運動資訊作為一MVP候選者添加至該FIFO MVP候選者清單緩衝器; 自該MVP候選者清單緩衝器中之該複數個MVP候選者判定該當前區塊之一MVP,其中在該MVP候選者清單緩衝器中之該複數個MVP候選者包含不鄰近於該當前區塊之該當前圖像之至少一不鄰近區塊之運動資訊; 基於該當前區塊之該MVP判定該當前區塊之一運動向量; 基於該當前區塊之該運動向量判定一預測性區塊;及 基於該預測性區塊重構該當前圖像之該當前區塊之樣本值。
  9. 如請求項8之設備,其中該當前區塊之該MVP係在仿射模式中。
  10. 如請求項8之設備,其中該一或多個處理器,作為判定該當前區塊之該運動向量之部分,經進一步組態以: 判定該當前區塊之該運動向量,使得該當前區塊之該運動向量指定該當前區塊之該MVP之一運動向量或使得該當前區塊之該運動向量等於該當前區塊之該 MVP 之運動資訊之一運動向量加一運動向量差(MVD)。
  11. 如請求項8之設備,其中該一或多個處理器經進一步組態以: 藉由該視訊解碼器判定寫碼單元(CU)層級圖框速率向上轉換(FRUC)運動向量候選者之一集合; 藉由該視訊解碼器自CU層級FRUC運動向量候選者之該集合選擇一CU層級FRUC運動向量候選者; 藉由該視訊解碼器至少部分地藉由執行自一所選擇CU層級FRUC運動向量候選者開始之一本端搜尋判定一CU層級運動向量;及 藉由該視訊解碼器運用FRUC子CU層級運動向量候選者之一集合在一子CU層級處改進該CU層級運動向量, 其中,CU層級FRUC運動向量候選者之該集合及FRUC子CU層級運動向量候選者之該集合中的至少一者包括指定該不鄰近區塊之該運動 向量的一不鄰近空間運動向量預測子(NA-SMVP)。
  12. 一種用於編碼之設備,該設備包含: 一或多個儲存媒體,其經組態以儲存視訊資料;及 一或多個處理器,實現於電路中,該一或多個處理器經組態以: 判定在一當前圖像之一當前區塊之前經解碼的該當前圖像之一區塊之運動資訊,其中該區塊之該運動資訊包含一運動向量及一參考索引;及 更新該FIFO MVP候選者清單緩衝器以自該FIFO MVP候選者清單緩衝器移除一較早添加之MVP候選者並將該區塊之該運動資訊作為一MVP候選者添加至該FIFO MVP候選者清單緩衝器; 自該MVP候選者清單緩衝器中之該複數個MVP候選者判定該當前區塊之一MVP,其中在該MVP候選者清單緩衝器中之該複數個MVP候選者包含不鄰近於該當前區塊之該當前圖像之至少一不鄰近區塊之運動資訊; 基於該當前區塊之該MVP判定該當前區塊之一運動向量; 基於該當前區塊之該運動向量判定一預測性區塊;及 基於該預測性區塊產生殘餘樣本值。
  13. 如請求項12之設備,其中該當前區塊之該MVP係在仿射模式中。
  14. 如請求項12之設備,其中該一或多個處理器經進一步組態以: 判定寫碼單元(CU)層級圖框速率向上轉換(FRUC)運動向量候選者之一集合; 自CU層級FRUC運動向量候選者之該集合選擇一CU層級FRUC運動向量候選者; 至少部分地藉由執行自一所選擇CU層級FRUC運動向量候選者開始之一本端搜尋判定一CU層級運動向量;及 運用FRUC子CU層級運動向量候選者之一集合在一子CU層級處改進該CU層級運動向量, 其中,CU層級FRUC運動向量候選者之該集合及FRUC子CU層級運動向量候選者之該集合中的至少一者包括指定該不鄰近區塊之該運動向量的一不鄰近空間運動向量預測子(NA-SMVP)。
TW112126787A 2017-06-13 2018-06-12 運動向量預測 TWI859984B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762519007P 2017-06-13 2017-06-13
US62/519,007 2017-06-13
US16/003,269 2018-06-08
US16/003,269 US10602180B2 (en) 2017-06-13 2018-06-08 Motion vector prediction

Publications (2)

Publication Number Publication Date
TW202344060A true TW202344060A (zh) 2023-11-01
TWI859984B TWI859984B (zh) 2024-10-21

Family

ID=

Also Published As

Publication number Publication date
PL3639519T3 (pl) 2023-11-27
CL2019003677A1 (es) 2020-07-10
US20200221116A1 (en) 2020-07-09
CN118381934A (zh) 2024-07-23
KR20240074911A (ko) 2024-05-28
US12096023B2 (en) 2024-09-17
US20220070486A1 (en) 2022-03-03
US11689740B2 (en) 2023-06-27
BR112019025566A2 (pt) 2020-06-23
JP7343398B2 (ja) 2023-09-12
EP3639519A1 (en) 2020-04-22
EP3639519C0 (en) 2023-08-16
CN118748721A (zh) 2024-10-08
TWI812564B (zh) 2023-08-11
US11218723B2 (en) 2022-01-04
JP2020523853A (ja) 2020-08-06
CN110754086B (zh) 2024-08-02
US10602180B2 (en) 2020-03-24
US20180359483A1 (en) 2018-12-13
US20230276069A1 (en) 2023-08-31
CA3063173A1 (en) 2018-12-20
JP7536973B2 (ja) 2024-08-20
AU2018283967B2 (en) 2023-04-06
TW202318875A (zh) 2023-05-01
EP3639519B1 (en) 2023-08-16
KR102669354B1 (ko) 2024-05-24
JP2023166487A (ja) 2023-11-21
TWI791025B (zh) 2023-02-01
KR20200017406A (ko) 2020-02-18
EP4277279A2 (en) 2023-11-15
AU2023204311A1 (en) 2023-07-27
EP4277279A3 (en) 2024-01-17
CO2019013930A2 (es) 2020-01-17
CN110754086A (zh) 2020-02-04
AU2018283967A1 (en) 2019-12-05
ES2954447T3 (es) 2023-11-22
TW201904299A (zh) 2019-01-16
WO2018231700A1 (en) 2018-12-20

Similar Documents

Publication Publication Date Title
TWI812564B (zh) 運動向量預測
US11363288B2 (en) Motion vector generation for affine motion model for video coding
US10863193B2 (en) Buffer restriction during motion vector prediction for video coding
US11172229B2 (en) Affine motion compensation with low bandwidth
JP2022172260A (ja) 1つまたは複数のルックアップテーブルを使用して、以前コーディングされた動き情報を順に記憶させてそれらを後続のブロックのコードに使用する概念
TW202002649A (zh) 廣義運動向量差解析度
TW201817237A (zh) 在視頻寫碼中用於仿射運動模型之運動向量預測
US20190208211A1 (en) Generated affine motion vectors
CN110771163A (zh) 视频译码中的帧间预测与帧内预测的组合
CN110677650B (zh) 降低非相邻Merge设计的复杂度
TWI859984B (zh) 運動向量預測