TW201347547A - 用於並行熵編碼的方法及裝置以及用於並行熵解碼的方法及裝置以及非暫時性電腦可讀記錄媒體 - Google Patents
用於並行熵編碼的方法及裝置以及用於並行熵解碼的方法及裝置以及非暫時性電腦可讀記錄媒體 Download PDFInfo
- Publication number
- TW201347547A TW201347547A TW102102238A TW102102238A TW201347547A TW 201347547 A TW201347547 A TW 201347547A TW 102102238 A TW102102238 A TW 102102238A TW 102102238 A TW102102238 A TW 102102238A TW 201347547 A TW201347547 A TW 201347547A
- Authority
- TW
- Taiwan
- Prior art keywords
- block
- column
- entropy
- code
- unit
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供一種藉由使用多個處理器來執行並行熵編碼及並行熵解碼之方法。所述方法包含:對來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的第一列區塊順序地執行熵編碼;將第二列區塊之最前面區塊之初始熵寫碼機率資訊判定為由第一列區塊之固定位置之區塊更新之熵寫碼機率資訊;基於初始熵寫碼機率資訊對第二列區塊之串行配置之區塊順序地執行熵編碼;以及在熵編碼完成至第一列區塊之最後一個區塊之後,初始化第一列區塊之熵編碼位元串之內部狀態資訊。
Description
本發明是關於用於視訊編碼及解碼之熵編碼及熵解碼。
由於已開發且供應用於再生及儲存高解析度或高品質視訊內容之硬體,故已增加了對用於有效地編碼或解碼高解析度或高品質視訊內容之視訊編碼解碼器之需求。根據習知視訊編碼解碼器,根據基於具有預定大小之巨集區塊有限編碼方法來編碼視訊。
藉由使用頻率變換而將空間域之影像資料變換成頻率之係數。視訊編碼解碼器將影像分裂成各自具有預定大小之區塊以便快速地執行頻率變換,對區塊中之每一者執行DCT變換,且以區塊為單位來編碼頻率係數。頻域之係數可比空間域之影像資料更容易壓縮。詳言之,由於空間域之影像像素值是經由視訊編碼解碼器之框間預測或框內預測而表示為預測誤差,故當對預測誤差執行頻率變換時,可將大量資料變換成零(0)。視訊編碼解碼器藉由用具有較小大小之資料來替換連續重複地產生之資料,以
減少資料之量。
執行熵編碼以便壓縮藉由視訊編碼產生之符號之位元串。基於算術寫碼之熵編碼最近已得到廣泛使用。為了執行基於算術寫碼之熵編碼,將符號數位化為位元串,且對位元串執行基於上下文之算術寫碼。
本發明提供一種藉由使用多個處理器以並行方式執行用於視訊編碼及解碼的基於算術寫碼之熵編碼及解碼之方法。
根據本發明之一態樣,提供一種用於視訊編碼之熵編碼方法,熵編碼方法包含:對來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的串行配置於水平方向上之第一列區塊中之區塊順序地執行熵編碼;將安置於第一列區塊下而鄰近於第一列區塊之第二列區塊的最前面區塊之初始熵寫碼機率資訊判定為由第一列區塊之固定位置之區塊更新之熵寫碼機率資訊,基於經判定的初始熵寫碼機率資訊對第二列區塊之最前面區塊執行熵編碼,且對第二列區塊之串行配置之區塊順序地執行熵編碼;以及在熵編碼完成至第一列區塊之最後一個區塊之後,初始化第一列區塊之熵編碼位元串之內部狀態資訊。
根據本發明之一實施例之熵編碼裝置及熵解碼裝置可藉由以下操作來簡化並行熵編碼及並行熵解碼且將效能降級減至最
小:判定待參考之最大寫碼單元(largest coding unit,LCU),以便在最接近的固定位置處判定每一列LCU之最前面LCU之初始碼機率資訊,及在LCU列之最後一個LCU中初始化緩衝器之內部狀態資訊。
10‧‧‧熵編碼裝置
11‧‧‧熵編碼方法
12‧‧‧第一熵編碼器
14‧‧‧第二熵編碼器
20‧‧‧熵解碼裝置
21‧‧‧熵解碼方法
22‧‧‧接收器
24‧‧‧第一熵解碼器
26‧‧‧第二熵解碼器
30、50、60‧‧‧影像
31、315、325、335、620、630、640、710‧‧‧寫碼單元
32‧‧‧常規寫碼次序
33‧‧‧波前寫碼次序
100‧‧‧視訊編碼裝置
110‧‧‧最大寫碼單元分裂器
120‧‧‧寫碼單元判定器
129、179、229、259、339、419、5129、5229、6149、6249‧‧‧最後碼機率資訊
130‧‧‧輸出單元
181、211、261、311、321、341、411、421、5211、5311、6211、6311‧‧‧初始碼機率資訊
200‧‧‧視訊解碼裝置
210‧‧‧接收器
220‧‧‧影像資料及編碼資訊擷取器
230‧‧‧影像資料解碼器
310、320、330‧‧‧視訊資料
400‧‧‧影像編碼器
405‧‧‧當前圖框
410、550‧‧‧框內預測器
420‧‧‧運動估計器
425、560‧‧‧運動補償器
430‧‧‧變換器
440‧‧‧量化器
450‧‧‧熵編碼器
455、505‧‧‧位元串流
460、530‧‧‧反量化器
470、540‧‧‧反變換器
490‧‧‧迴路濾波單元
495、585‧‧‧參考圖框
500‧‧‧影像解碼器
510‧‧‧剖析器
520‧‧‧熵解碼器
570‧‧‧解區塊單元
580‧‧‧迴路濾波單元
595‧‧‧經恢復圖框
600‧‧‧階層式結構
610‧‧‧寫碼單元/分割區
612、614、616、622、624、626、632、634、636、642、644、646、802、804、806、808‧‧‧分割區
712、722、732、742、752、762、772‧‧‧第二最大寫碼單元
719、729、739、749、759、769‧‧‧最後一個最大寫碼單元
720、1070、1342、1352、1354‧‧‧變換單元
721、751、761、771、781、L31、L611、L621、L631‧‧‧最前面最大寫碼單元
731、741、1300、L11、L12、L17、L18、L21、L22、L26、L32、L34、L42、L511、L521、L522、L531‧‧‧最大寫碼單元
800、810、820‧‧‧資訊
812‧‧‧框內模式
814‧‧‧框間模式
816‧‧‧跳躍模式
822‧‧‧第一框內變換單元
824‧‧‧第二框內變換單元
826‧‧‧第一框間變換單元
828‧‧‧第二框間變換單元
900‧‧‧當前最大寫碼單元
910‧‧‧預測單元
912、914、916、918、942、944、946、948、992、994、996、998、1322、1324、1326、1328、1332、1334、1336、1338‧‧‧分割區類型
920、950、970‧‧‧操作
930、960、980、1010、1012、1016、1018、1020、1022、1024、1026、1028、1030、1032、1040、1042、1044、1046、1048、1050、1052、1054、1302、1304、1306、1312、1314、1316、1318‧‧‧寫碼單元
940、990、1060‧‧‧預測單元
999‧‧‧資料單元
1014‧‧‧寫碼單元/編碼單元
11000‧‧‧內容供應系統
11100‧‧‧網際網路
11200‧‧‧網際網路服務提供者
11300‧‧‧串流伺服器
11400‧‧‧通信網路
11700、11800、11900、12000‧‧‧無線基地台
12100‧‧‧電腦
12200‧‧‧個人數位助理
12300‧‧‧視訊攝影機
12500‧‧‧行動電話
12510‧‧‧內部天線
12520‧‧‧顯示螢幕
12530、12600‧‧‧相機
12540‧‧‧操作面板
12550‧‧‧麥克風
12560‧‧‧槽
12570、12820‧‧‧儲存媒體
12580‧‧‧揚聲器
12610‧‧‧通信電路
12620‧‧‧液晶顯示器控制器
12630‧‧‧相機介面
12640‧‧‧操作輸入控制器
12650‧‧‧聲音處理器
12660‧‧‧調變/解調變單元
12670‧‧‧記錄/讀取單元
12680‧‧‧多工器/解多工器
12690‧‧‧影像解碼單元
12700‧‧‧電力供應電路
12710‧‧‧中央控制器
12720‧‧‧影像編碼單元
12730‧‧‧同步匯流排
12810‧‧‧有線電視接收器
12830‧‧‧再生裝置
12840‧‧‧監視器
12850‧‧‧有線電視天線
12860‧‧‧家用天線
12870‧‧‧機上盒
12880‧‧‧有線電視監視器
12890‧‧‧廣播台
12900‧‧‧廣播衛星
12910‧‧‧天線
12920‧‧‧汽車
12930‧‧‧汽車導航系統
12950‧‧‧硬碟記錄器
12960‧‧‧數位影音光碟
12970‧‧‧安全數位卡
14000‧‧‧雲端計算伺服器
14100‧‧‧使用者資料庫
14200‧‧‧計算資源
14300‧‧‧桌上型個人電腦
14400‧‧‧智慧有線電視
14500‧‧‧智慧型手機
14600‧‧‧筆記型電腦
14700‧‧‧攜帶型多媒體播放器
14800‧‧‧平板個人電腦
26000‧‧‧光碟
26700‧‧‧電腦系統
26800‧‧‧光碟機
C71、C72、C73、C74、C75、C76‧‧‧厚塊
CU_0‧‧‧當前寫碼單元
L25、L33、L41‧‧‧左邊最大寫碼單元
L512‧‧‧第二最大寫碼單元
L614、L624‧‧‧第四最大寫碼單元
Se‧‧‧扇區
S13、S15、S17、S23、S25、S27、S29‧‧‧操作
Tr‧‧‧同心播放軌
圖1A為說明根據本發明之一實施例之熵編碼裝置的方塊圖。
圖1B為說明由圖1之熵編碼裝置執行之熵編碼方法的流程圖。
圖2A為說明根據本發明之一實施例之熵解碼裝置的方塊圖。
圖2B為說明由圖2A之熵解碼裝置執行之熵解碼方法的流程圖。
圖3為用於解釋區塊之常規寫碼次序及波前寫碼次序的圖。
圖4為根據本發明之一實施例,用於解釋波前寫碼次序及判定熵寫碼機率資訊之方法的圖。
圖5及圖6為說明從屬執行緒之同步距離與延遲時間之間的關係的圖。
圖7為根據本發明之一實施例,用於解釋執行簡化的並行熵編碼/解碼之程序的圖。
圖8為根據本發明之一實施例之基於根據樹狀結構之寫碼單元之視訊編碼裝置的方塊圖。
圖9為根據本發明之一實施例之基於根據樹狀結構之寫碼單元之視訊解碼裝置的方塊圖。
圖10為用於根據本發明之一實施例解釋寫碼單元之概念的圖。
圖11為根據本發明之一實施例之基於寫碼單元之影像編碼器的方塊圖。
圖12為根據本發明之一實施例之基於寫碼單元之影像解碼器的方塊圖。
圖13為根據本發明之一實施例說明根據深度之較深寫碼單元及分割區的圖。
圖14為用於根據本發明之一實施例解釋寫碼單元與變換單元之間的關係的圖。
圖15為根據本發明之一實施例,用於解釋對應於寫碼深度之寫碼單元之編碼資訊的圖。
圖16為根據本發明之一實施例的根據深度之較深寫碼單元的圖。
圖17至圖19為根據本發明之一實施例,用於解釋寫碼單元、預測單元及變換單元之間的關係的圖。
圖20為根據表1之編碼模式資訊,用於解釋寫碼單元、預測單元及變換單元之間的關係的圖。
圖21為根據本發明之一實施例的儲存有程式之光碟之實體結構的圖。
圖22為用於藉由使用光碟來記錄及讀取程式之光碟機的圖。
圖23為用於提供內容分佈服務之內容供應系統之總體結構的圖。
圖24及圖25分別為根據本發明之一實施例的應用了視訊編
碼方法及視訊解碼方法之行動電話之外部結構及內部結構的圖。
圖26為根據本發明之一實施例的應用了通信系統之數位廣播系統的圖。
圖27為說明根據本發明之一實施例的使用視訊編碼裝置及視訊解碼裝置之雲端計算系統之網路結構的圖。
根據本發明之一實施例的用於視訊編碼之熵編碼方法
根據本發明之一態樣,提供一種用於視訊編碼之熵編碼方法,所述熵編碼方法包含:對來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的串行配置於水平方向上之第一列區塊中的區塊順序地執行熵編碼;將安置於所述第一列區塊下而鄰近於所述第一列區塊之第二列區塊的最前面區塊之初始熵寫碼機率資訊判定為由所述第一列區塊之固定位置之區塊更新之熵寫碼機率資訊,基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵編碼,且對所述第二列區塊之所述串行配置之區塊順序地執行熵編碼;以及在所述熵編碼完成至所述第一列區塊之最後一個區塊之後,初始化所述第一列區塊之熵編碼位元串之內部狀態資訊。
對所述第二列區塊之所述串行配置之區塊之順序地執行熵編碼的步驟可包含:為了判定所述第二列區塊之最前面區塊之初始熵寫碼機率資訊,參考由所述第一列區塊的位於所述第二列區塊之所述最前面區塊之右上側處之第二區塊更新之熵寫碼機率資訊,且為了判定待參考之區塊以便判定所述第二列區塊之所述
最前面區塊之所述初始熵寫碼機率資訊,跳過關於所述第一列區塊與所述第二列區塊之間的上下文同步發生在包含所述影像之圖片中的分析。
對所述第二列區塊之所述串行配置之區塊之順序地執行熵編碼的步驟可包含,在獲得基於所述第一列區塊之所述第二區塊之符號更新之熵寫碼機率資訊之後,開始自所述第二列區塊之所述最前面區塊起執行熵編碼,其中所述熵編碼方法進一步包含,在獲得由第二列區塊之第二區塊更新之熵編碼機率資訊之後,開始自安置於所述第二列區塊下而鄰近於所述第二列區塊之第三列區塊的最前面區塊起對所述第三列區塊執行熵編碼。
初始化所述第一列區塊之所述熵編碼位元串的所述內部狀態資訊的步驟可包含:在儲存所述第一列區塊之所述熵編碼位元串之緩衝器中,將指示儲存接觸所述影像之邊界之所述最後一個區塊之碼的位置的偏移資訊及指示碼間隔之範圍的範圍資訊初始化至預設值;以及基於所述經初始化之內部狀態資訊對第四列區塊執行熵編碼,所述第四列區塊與所述第一列區塊屬於同一執行緒且在所述第一列區塊之後處理,其中為了初始化所述內部狀態資訊,在包含所述影像之所述圖片中,不可能在對每一列區塊之最後一個區塊執行熵編碼之後選擇是否初始化所述熵編碼位元串之所述內部狀態資訊。
所述影像可為藉由在水平方向上分裂圖片而產生之切片區段(slice segment)中之一者或藉由在水平方向及垂直方向上分裂圖片而產生之圖塊中之一者,且影像之區塊可為各自包含具樹狀結構之寫碼單元的最大寫碼單元(largest coding unit,LCU),
且所述第一列區塊及所述第二列區塊中之每一者可為串行配置於水平方向上之LCU之群組。
根據本發明之另一態樣,提供一種用於視訊解碼之熵解碼方法,所述熵解碼方法包含:自接收之位元串流擷取第一列區塊及第二列區塊,第一列區塊及第二列區塊各自包含來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的串行配置於水平方向上之區塊之位元串;藉由對所述第一列區塊執行熵解碼而順序地恢復所述第一列區塊之區塊之符號;將所述第二列區塊之最前面區塊之初始熵寫碼機率資訊判定為由所述第一列區塊之固定位置之區塊更新之熵寫碼機率資訊,基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵解碼,且順序地恢復所述第二列區塊之區塊之符號;以及在使所執行之所述熵解碼完成至所述第一列之最後一個區塊之後,初始化所述第一列區塊之位元串之內部狀態資訊。
順序地恢復所述第二列區塊之所述區塊之所述符號的步驟可包含:為了判定所述第二列區塊之最前面區塊之初始熵寫碼機率資訊,參考由所述第一列區塊的位於所述第二列區塊之所述最前面區塊之右上側處之第二區塊更新之熵寫碼機率資訊,且為了判定待參考之區塊以便判定所述第二列區塊之所述最前面區塊之所述初始熵寫碼機率資訊,不剖析來自所述位元串流的關於所述第一列區塊與所述第二列區塊之間的上下文同步發生在包含所述影像之圖片中的資訊。
順序地恢復所述第二列區塊之所述區塊之所述符號的步驟可包含,在獲得基於所述第一列區塊之所述第二區塊之符號更
新之熵寫碼機率資訊之後,開始自所述第二列區塊之所述最前面區塊起執行熵解碼,其中所述熵解碼方法進一步包含,在獲得由所述第二列區塊之第二區塊更新之熵寫碼機率資訊之後,開始自安置於所述第二列區塊下而鄰近於所述第二列區塊之第三列區塊的最前面區塊起對所述第三列區塊執行熵解碼。
初始化所述第一列區塊之所述位元串之所述內部狀態資訊的步驟可包含:在儲存所述第一列區塊之所述位元串之緩衝器中,將指示儲存接觸所述影像之邊界之所述最後一個區塊之碼的位置的偏移資訊及指示碼間隔之範圍的範圍資訊初始化至預設值;以及基於所述經初始化之內部狀態資訊對下一位元串執行熵解碼,所述下一位元串與所述第一列區塊屬於同一執行緒且在所述第一列區塊之所述位元串之後處理,且恢復第四列區塊之區塊,其中為了初始化所述內部狀態資訊,在包含所述影像之圖片中,在對每一列區塊之最後一個區塊執行之熵解碼之後,不剖析來自所述位元串流的關於所述內部狀態資訊是否經初始化之資訊。
所述影像可為藉由在水平方向上分裂圖片而產生之切片區段中之一者或藉由在水平方向及垂直方向上分裂圖片而產生之圖塊中之一者,且影像之區塊可為各自包含具樹狀結構之寫碼單元的LCU,且所述第一列區塊及所述第二列區塊中之每一者可為串行配置於水平方向上之LCU之群組。
當所述熵解碼方法是藉由兩個或兩個以上處理核心執行時,所述第一列區塊之所述區塊之所述符號之所述順序恢復可包含,藉由使用第一處理核心,藉由使用基於所述第一列區塊之最
前面區塊之符號更新之熵寫碼機率資訊而自所述第一列區塊之第二區塊起執行熵解碼,所述第二列區塊之所述區塊之所述符號之所述順序恢復包含,藉由使用第二處理核心,緊接在獲得基於所述第一列區塊之所述第二區塊之符號更新之熵寫碼機率資訊之後,開始藉由使用所述獲得之熵寫碼機率資訊自所述第二列區塊之所述最前面區塊起對所述第二列區塊執行熵解碼,且所述第二處理核心對所述第二列區塊執行之熵解碼操作被從所述第一處理核心對所述第一列區塊執行之熵解碼操作延遲與獲得基於所述第一列區塊之所述第二區塊之所述符號更新之熵寫碼機率資訊所耗用之時間差不多的時間。
當所述熵解碼方法是藉由使用一個處理核心執行時,所述熵解碼方法可包含:藉由使用第一處理核心,藉由使用第一處理核心對所述第一列區塊之區塊順序地執行熵解碼來恢復所述第一列區塊之符號;藉由使用所述第一處理核心,在所述熵解碼完成至所述第一列區塊之最後一個區塊之後,初始化所述第一列區塊之位元串之內部狀態資訊;藉由使用所述第一處理核心,將所述第二列區塊之所述最前面區塊之初始熵寫碼機率資訊判定為由所述第一列區塊之第二區塊之符號更新之熵寫碼機率資訊,且藉由基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵解碼而順序地恢復所述第二列區塊之區塊之符號;藉由使用所述第一處理核心,在使所述熵解碼完成至所述第二列區塊之最後一個區塊之後,初始化所述第二列區塊之位元串之內部狀態資訊;以及藉由使用所述第一處理核心,將安置於所述第二列區塊下而鄰近於所述第二列區塊之第三列區塊之最前面
區塊的初始熵寫碼機率資訊判定為由所述第二列區塊之第二區塊之符號更新之熵寫碼機率資訊,藉由使用所述第一列區塊之所述位元串之所述經初始化之內部狀態資訊及所述經判定之初始熵寫碼機率資訊而對所述第三列區塊之所述最前面區塊執行熵解碼,且順序地恢復所述第三列區塊之區塊之符號。
根據本發明之另一態樣,提供一種用於視訊編碼之熵編
碼裝置,所述熵編碼裝置包含:第一熵編碼器,其對來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的串行配置於水平方向上之第一列區塊之區塊順序地執行熵編碼;以及第二熵編碼器,其將安置於所述第一列區塊下而鄰近於所述第一列區塊之第二列區塊的最前面區塊之初始熵寫碼機率資訊判定為由所述第一列區塊之固定位置之區塊更新之熵寫碼機率資訊,基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵編碼,且對所述第二列區塊之串行配置之區塊順序地執行熵編碼,其中在所述熵編碼完成至所述第一列區塊之最後一個區塊之後,所述第一熵編碼器初始化所述第一列區塊之熵編碼位元串之內部狀態資訊。
根據本發明之另一態樣,提供一種用於視訊解碼之熵解
碼裝置,所述熵解碼裝置包含:接收器,其自接收之位元串流擷取第一列區塊及第二列區塊,所述第一列區塊及所述第二列區塊各自包含來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的串行配置於水平方向上之區塊之位元串;第一熵解碼器,其對所述第一列區塊執行熵解碼且順序地恢復所述第一列區塊之區塊之符號;以及第二熵解碼器,其將所述第二列區塊之最
前面區塊之初始熵寫碼機率資訊判定為由所述第一列區塊之固定位置之區塊更新之熵寫碼機率資訊;基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵解碼,且順序地恢復所述第二列區塊之區塊之符號,其中在所述熵解碼完成至所述第一列區塊之最後一個區塊之後,所述第一熵解碼器初始化所述第一列區塊之位元串之內部狀態資訊。
根據本發明之另一態樣,提供一種非暫時性電腦可讀記錄媒體,其用於執行所述方法。
用於本發明之模式
將參看圖1A至圖7來解釋根據本發明之一實施例的用於視訊編碼之熵編碼裝置及用於視訊解碼之熵解碼裝置以及其熵編碼方法及熵解碼方法。又,將參看圖8至圖20來解釋根據本發明之一實施例的基於具樹狀結構之寫碼單元的使用熵編碼方法之視訊編碼裝置及使用熵解碼方法之視訊解碼裝置,以及其視訊編碼方法及視訊解碼方法。將參看圖21至圖27來解釋視訊編碼方法及視訊解碼方法可應用至的各種實施例。在下文中,術語「影像」可指代靜態影像、移動影像或視訊本身。
將參看圖1A至圖7來解釋根據本發明之一實施例的熵編碼裝置及熵編碼方法以及熵解碼裝置及熵解碼方法。
圖1A為說明根據本發明之一實施例之熵編碼裝置10的方塊圖。
熵編碼裝置10包含第一熵編碼器12及第二熵編碼器14。
熵編碼裝置10接收藉由以區塊為單位對構成視訊之多個影像中之每一者編碼而產生之符號。可藉由以區塊為單位對空間
域之視訊資料執行框內預測/框間預測、變換及量化而產生所述符號。
為了解釋便利起見,將詳細地解釋用於為資料單元之「區
塊」的視訊編碼技術或熵編碼技術。然而,根據本發明之各種實施例之視訊編碼技術不限於用於「區塊」之視訊編碼技術,且可應用於各種資料單元。
為了有效地編碼影像,在將影像分裂成各自具有預定大
小之區塊之後對影像進行編碼。所述區塊中之每一者可具有正方形形狀、矩形形狀或任意幾何形狀,且不限於具有預定大小之資料單元。根據一實施例之區塊可為根據樹狀結構之寫碼單元中的最大寫碼單元(largest coding unit,LCU)、寫碼單元、預測單元或變換單元。將參看圖8至圖20解釋基於根據樹狀結構之寫碼單元的視訊編碼/解碼方法。
又,術語「影像」可指代圖片、藉由在水平方向上分裂
圖片而產生之切片區塊中之一者,或藉由在水平方向及垂直方向上分裂圖片而產生之圖塊中之一者。
第一熵編碼器12對來自影像之區塊中的串行配置於水平
方向上之第一列區塊中的區塊順序地執行熵編碼。第二熵編碼器14對安置於所述第一列區塊下而鄰近於所述第一列區塊之第二列區塊之區塊順序地執行熵編碼。
當區塊中之每一者為來自根據樹狀結構的寫碼單元中之
LCU時,所述第一列區塊及所述第二列區塊中之每一者可為串行配置於水平方向上之LCU之群組。
根據本發明之一實施例之熵編碼可包含將符號轉換為位
元串之數位化程序,及對位元串執行基於上下文之算術寫碼之算術寫碼程序。上下文自適應性二進位算術寫碼(context adaptive binary arithmetic coding,CABAC)被廣泛用作為執行基於上下文之算術寫碼之算術寫碼方法。根據基於上下文之算術編碼/解碼,符號位元串之每一位元可為上下文之每一位元子(bin),且每一位元之位置可映射至位元子索引。位元串之長度(亦即,位元子之長度)可根據符號值之大小而改變。為了執行基於上下文之算術編碼/解碼,上下文模型化用於判定符號之上下文是必需的。
為了執行上下文模型化,需要針對符號位元串之位元之每一個位置(亦即,針對每一個位元子索引)更新上下文。此處,術語「上下文模型化」指代分析每一位元具有0或1之機率之程序。可針對每一個區塊重複地執行藉由反映透過分析迄今為止新區塊之符號之每一位元在上下文上之機率所獲得之結果來更新上下文之程序。可提供展示每一位元子之機率之機率表,以作為關於上下文模型化之結果之資訊。根據一實施例之熵寫碼機率資訊可為關於上下文模型化之結果之資訊。
因此,一旦獲得上下文模型化資訊(亦即,熵寫碼機率資訊),就可藉由基於熵寫碼機率資訊之上下文將碼分配給自區塊符號二進位化之位元串之每一位元來執行熵編碼。
因此,將參看圖1B詳細地解釋由第一熵編碼器12及第二熵編碼器執行以獲得熵寫碼機率資訊以便以區塊為單位執行熵編碼之方法。
圖1B為說明由圖1A之熵編碼裝置10執行之熵編碼方法11的流程圖。
在操作S13中,第一熵編碼器12對串行地配置於水平方向上之第一列區塊之區塊順序地執行熵編碼。可將來自第一列區塊之區塊中的將首先被處理之區塊之初始熵寫碼機率資訊判定為預設機率資訊。第一熵編碼器12可藉由使用基於第一列區塊之最前面區塊之符號更新之熵寫碼機率資訊而對第一列區塊之第二區塊執行熵編碼。
在操作S15中,第二熵編碼器14可將第二列區塊之最前面區塊之初始熵寫碼機率資訊判定為由第一列區塊之固定位置之區塊更新之熵寫碼機率資訊。第二熵編碼器14可基於初始熵寫碼機率資訊對第二列區塊之最前面區塊執行熵編碼。自最前面區塊起,第二熵編碼器14可對第二列區塊之串行配置之區塊順序地執行熵編碼。
為了獲得第二列區塊之最前面區塊之初始熵寫碼機率資訊所參考的固定位置之區塊可為位於第二列區塊之最前面區塊之右上側處之區塊。因此,為了判定第二列區塊之最前面區塊之初始熵寫碼機率資訊,第二熵編碼器14可參考由第一列區塊的位於第二列區塊之最前面區塊之右上側之第二區塊更新之熵寫碼機率資訊。
為了判定待參考之區塊以便判定第二列區塊之最前面區塊之初始熵寫碼機率資訊,第二熵編碼器14可跳過關於所述第一列區塊與所述第二列區塊之間的上下文同步發生的分析。可不對圖片之區塊之所有列執行判定所述第一列區塊與所述第二列區塊之間的上下文同步發生的程序。
又,由於第二熵編碼器14可判定待參考之區塊以便在固
定位置而非可變位置處獲得第二列區塊之最前面區塊之初始熵寫碼機率資訊,所以不需要自各種區塊中選擇參考區塊之程序。
在獲得基於第一列區塊之第二區塊之符號更新之熵寫碼機率資訊之後,第二熵編碼器14可開始自第二列區塊之最前面區塊起執行熵編碼。
同樣地,為了對安置於第二列區塊下而鄰近於第二列區塊之第三列區塊執行熵編碼,熵編碼裝置10可在獲得由第二列區塊之第二區塊更新之熵寫碼機率資訊之後,開始自第三列區塊之最前面區塊起對第三列區塊之區塊執行熵編碼。
因此,針對第二列區塊之熵編碼操作可從針對第一列區塊之熵編碼操作延遲與獲得基於第一列區塊之第二區塊之符號更新之熵寫碼機率資訊所耗用之時間一樣多的時間。
在操作S17中,在對第一列區塊之區塊之熵編碼完成至第一列區塊之最後一個區塊之後,第一熵編碼器12初始化所述第一列區塊之熵編碼位元串之內部狀態資訊。又,在對第二列區塊之區塊之熵編碼完成至第二列區塊之最後一個區塊之後,第二熵編碼器14可初始化第二列區塊之熵編碼位元串之內部狀態資訊。
當位元串是藉由對第一列區塊執行熵編碼而產生時,第一熵編碼器12將位元串儲存於緩衝器中。根據一實施例的熵編碼位元串之內部狀態資訊可包含指示儲存鄰近於影像之邊界之最後一個區塊之碼的位置的偏移資訊及指示碼間隔之範圍的範圍資訊。第一熵編碼器12可將第一列區塊之位元串之偏移資訊及範圍資訊初始化為預設值。
可將處理核心一次處理之資料單元稱為執行緒
(thread)。在根據一實施例之波前並行處理方法(wavefront parallel processing method)中,可將每一列區塊作為一個執行緒來進行處理。舉例而言,當以並行方式執行對第一列區塊、第二列區塊及第三列區塊之熵編碼時,第一列區塊可對應於第一執行緒,第二列區塊可對應於第二執行緒,且第三列區塊可對應於第三執行緒。當多執行緒處理方法限於3個執行緒時,在第三列區塊下彼此順序地鄰近之第四列區塊、第五列區塊及第六列區塊可分別對應於第一執行緒、第二執行緒及第三執行緒。
可在第一列區塊之後對對應於第一執行緒之第四列區塊進行熵編碼,可在第二列區塊之後對第五列區塊進行熵編碼,且可在第三列區塊之後對第六列區塊進行熵編碼。
因此,為了根據第一執行緒在第一列區塊之後對第四列區塊執行熵編碼,第一熵編碼器12可基於在第一列區塊之最後一個區塊之編碼之後經初始化之內部狀態資訊對第四列區塊之最前面區塊執行熵編碼。
詳言之,為了初始化內部狀態資訊,根據一實施例之第一熵編碼器12不判定在包含影像之圖片之每一列區塊之最後一個區塊之熵編碼之後經熵編碼的位元串之內部狀態資訊。
又,為了根據第二執行緒在第二列區塊之後對第五列區塊執行熵編碼,第二熵編碼器14可基於在第二列區塊之最後一個區塊之編碼之後,經初始化之內部狀態資訊對第五列區塊之最前面區塊執行熵編碼。
同樣地,由於位元串緩衝器之內部狀態資訊是在每一列區塊之最後一個區塊經熵編碼之後被初始化,故不需要判定初始
化之可能性。
將參看圖2A及圖2B詳細地解釋自位元串恢復區塊符號之方法,如參看圖1A及圖1B所描述,所述位元串經熵編碼以按並行方式處理區塊列。
圖2A為說明根據本發明之一實施例之熵解碼裝置2的方塊圖。
熵解碼裝置20包含接收器22、第一熵解碼器24及第二熵解碼器26。
接收器22接收包含一視訊之寫碼資料之一位元串流。所述位元串流可包含藉由對構成所述視訊之影像中之每一者之區塊符號進行熵編碼而產生之位元串。
將詳細地解釋用於為資料單元之「區塊」的視訊解碼技術或熵解碼技術。如參看圖1A所描述,「區塊」可應用於基於樹狀結構之寫碼單元的各種資料單元。「影像」可為圖片、切片區段及圖塊中之一者。
接收器22可自接收之位元串流擷取包含影像區塊之經編碼位元串的第一列區塊及第二列區塊,且可將所述第一列區塊及第二列區塊分別輸出至第一熵解碼器24及第二熵解碼器26。
第一熵解碼器24可藉由對所述第一列區塊執行熵解碼而順序地恢復所述第一列區塊之區塊之符號。
第二熵解碼器26可藉由對所述第二列區塊執行熵解碼而順序地恢復所述第二列區塊之區塊之符號。
由第一熵解碼器24及第二熵解碼器24恢復之區塊可為所述第一列區塊及所述第二列區塊的在水平方向上串行地配置之
LCU之群組。
針對每一區塊,可藉由以區塊為單位由熵解碼裝置20對恢復的區塊符號執行反量化、反變換及框內預測/運動補償來恢復空間域之視訊資料。
將參看圖2B詳細地解釋由第一熵解碼器24及第二熵解碼器26執行以獲得熵寫碼機率資訊以便以區塊為單位執行熵解碼之方法。
圖2B為說明由圖2A之熵解碼裝置20執行之熵解碼方法21的流程圖。
在操作S23中,接收器22自位元串流擷取第一列區塊及第二列區塊。在操作S25中,第一熵解碼器24可藉由對所述第一列區塊執行熵解碼而順序地恢復所述第一列區塊之區塊之符號。
在操作S27中,第二熵解碼器26可將所述第二列區塊之最前面區塊之初始熵寫碼機率資訊判定為由所述第一列區塊之固定位置之區塊更新之熵寫碼機率資訊。
為了判定所述第二列區塊之最前面區塊之初始熵寫碼機率資訊,第二熵解碼器26可參考由所述第一列區塊的位於所述第二列區塊之所述最前面區塊之右上側處之第二區塊更新之熵寫碼機率資訊。
為了判定待參考之區塊以便判定第二列區塊之最前面區塊之初始熵寫碼機率資訊,第二熵解碼器26可跳過而不剖析關於對第二列區塊之熵編碼從對第一列區塊之熵編碼延遲多久的資訊。第二熵解碼器26不判定第一列區塊與第二列區塊之間的上下文同步何時發生。
又,由於第二熵解碼器26可判定待參考之區塊以便在固定位置而非可變位置處獲得第二列區塊之最前面區塊之初始熵寫碼機率資訊,所以不需要自各種區塊中選擇參考區塊之操作。
第二熵解碼器26可基於經判定的初始熵寫碼機率資訊對第二列區塊之最前面區塊執行熵解碼。第二熵解碼器26可基於藉由剖析第二列區塊之最前面區塊而獲得之結果對第二區塊執行熵解碼。以此方式,可順序地恢復第二列區塊之區塊符號。
又,由於在獲得基於第一列區塊之第二區塊之符號更新之熵寫碼機率資訊之後,第二熵解碼器26開始自第二列區塊之最前面區塊起對第二列區塊之區塊執行熵解碼,故第二列區塊之熵解碼操作可被延遲,直至獲得由第一列區塊之第二區塊更新之熵寫碼機率資訊為止。
同樣地,在獲得由第二列區塊之第二區塊更新之熵寫碼機率資訊之後,熵解碼裝置20可開始對安置於第二列區塊下而鄰近於第二列區塊之第三列區塊執行熵解碼。
在操作S27中,在對第一列區塊之區塊之熵解碼完成至第一列區塊之最後一個區塊之後,第一熵解碼器24可初始化第一列區塊之位元串之內部狀態資訊。
在所述熵解碼完成至所述第一列區塊之最後一個區塊之後,可將儲存第一列區塊之最後一個區塊之碼的緩衝器之偏移資訊及範圍資訊(偏移資訊及範圍資訊為第一列區塊之位元串之內部狀態資訊)初始化為預設值。
第一熵解碼器24可藉由基於初始化的內部狀態資訊對屬於第一執行緒且在第一列區塊之後的下一位元串執行熵解碼來恢
復第四列區塊之區塊。
在此情況下,在包含影像之圖片中,不剖析來自位元串流的關於位元串之內部狀態資訊是否在對每一列區塊之最後一個區塊進行熵解碼之後受到初始化之資訊。因此,第一熵解碼器24不需要判定是否在第一列區塊之最後一個區塊中初始化了內部狀態資訊。
由於位元串流含有經熵編碼而以並行方式加以處理之位元串,故可藉由使用兩個或兩個以上程序對位元串流執行熵解碼。
當熵解碼裝置20包含兩個處理核心時,對第一列區塊執行熵解碼之第一熵解碼器24及對第二列區塊執行熵解碼之第二熵解碼器26可藉由使用不同處理核心而操作。
舉例而言,在第一處理核心的控制下,在剖析了第一列區塊之最前面區塊之符號之後,第一熵解碼器24可基於第一列區塊之最前面區塊之符號來更新熵寫碼機率資訊,且可藉由使用經更新之熵寫碼機率資訊自第一列區塊之第二區塊起執行熵解碼。第一熵解碼器24可恢復第一列區塊之第二區塊之符號,且接著可基於經恢復符號再次更新熵寫碼機率資訊。
同時,在第二處理核心的控制下,緊接在接收到基於第一列區塊之第二區塊之符號更新之熵寫碼機率資訊之後,第二熵解碼器26可藉由使用所獲得之熵寫碼機率資訊對第二列區塊之最前面區塊執行熵解碼。
由於第一處理核心及第二處理核心可同時地個別操作,故可以並行方式執行對第一列區塊之熵解碼及對第二列區塊之熵解碼。然而,第二處理核心對第二列區塊之熵解碼操作被從如上
所述的第一處理核心對第一列區塊之熵解碼操作延遲與獲得基於第一列區塊之第二區塊之符號更新之熵寫碼機率資訊所耗用之時間一樣多的時間。
又,當熵解碼裝置20僅包含一個處理核心時,所述一個處理核心可執行第一熵解碼器24及第二熵解碼器26兩者之操作。在此情況下,由於第一熵解碼器24及第二熵解碼器26不可同時操作,故在所述一個處理核心的控制下,第一熵解碼器24可對第一列區塊之區塊順序地執行熵解碼,且在熵解碼完成至第一列區塊之最後一個區塊之後,第一熵解碼器24可初始第一列區塊之內部狀態資訊。
接下來,在所述一個處理核心的控制下,第二熵解碼器26可藉由將第二列區塊之最前面區塊之初始熵寫碼機率資訊判定為由第一列區塊之第二區塊之符號更新之熵寫碼機率資訊而對第二列區塊之最前面區塊執行熵解碼,且順序地恢復第二列區塊之區塊之符號。在熵解碼在所述一個處理核心的控制下完成至第二列區塊之最後一個區塊之後,可初始化第二列區塊之位元串之內部狀態資訊。
接下來,在所述一個處理核心的控制下,第一熵解碼器24可將安置於第二列區塊下而鄰近於第二列區塊之第三列區塊的最前面區塊之初始熵寫碼機率資訊判定為由第二列區塊之第二區塊之符號更新之熵寫碼機率資訊,且藉由使用第二列區塊之位元串之經初始化之內部狀態資訊及經判定之熵寫碼機率資訊而對第三列區塊之最前面區塊執行熵解碼。因此,在所述一個處理核心的控制下,亦可順序地恢復第三列區塊之區塊之符號。
因此,即使當使用一個處理核心時,熵解碼裝置20亦可藉由對經編碼而以並行方式處理之區塊之所有列順序地執行熵解碼來恢復區塊符號。
將參看圖3至圖7詳細地解釋根據本發明之一實施例的用於熵編碼及熵解碼之並行處理結構。
圖3為用於解釋區塊之常規寫碼次序及波前寫碼次序的圖。
將影像30分裂成各自具有預定大小之多個區塊。所述區塊中之每一者為LCU,且LCU包含根據樹狀結構之寫碼單元31。根據一實施例之視訊編碼裝置及視訊解碼裝置可針對每一個LCU獨立地執行框內估計(框內預測)/運動估計(運動補償)、變換(反變換)、量化(反量化)、迴路內濾波、樣本適應性偏移(sample adaptive offset,SAO)補償。
在視訊編碼裝置中,構成每一LCU之具樹狀結構之寫碼單元31可根據步階將LCU分裂成子區塊、對子區塊中之每一者執行框內估計(框內預測)/運動估計(運動補償)、變換(反變換)或量化(反量化),且判定具有最高寫碼效率之子區塊。子區塊之大小可根據為了獲得子區塊而將LCU分裂多少次而改變。即使在一個LCU中,由於所述一個LCU中之區域之特性根據空間位置而改變,故區域中的具有最高寫碼效率之子區塊之大小可被個別地判定而不同於其他區域之子區塊之大小。
可將最終判定之子區塊稱為寫碼單元。因此,由於一個LCU包含具有各種大小且藉由使LCU分裂不同次數而獲得之寫碼單元,故可將LCU稱為根據樹狀結構之寫碼單元31。
又,由於每一LCU被個別地編碼,故構成每一LCU之寫碼單元31之樹狀結構可被個別地判定而不同於其他LCU之寫碼單元之樹狀結構。
將參看圖8至圖20來解釋由視訊編碼裝置執行以根據步階將LCU編碼至子域中且最終根據樹狀結構判定寫碼單元31的程序,及由視訊解碼裝置執行以根據LCU之樹狀結構讀取寫碼單元31、針對每一個寫碼單元執行解碼且恢復LCU之影像資料的程序。
常規寫碼次序32及波前寫碼次序33指代藉以編碼/解碼LCU之次序。可按常規寫碼次序32或波前寫碼次序33對每一個LCU執行熵編碼。
可按與藉以對LCU執行熵編碼之次序相同的次序對LCU執行熵解碼。亦即,當藉由按常規寫碼次序32對LCU執行熵編碼來輸出位元串流時,可按常規寫碼次序32自位元串流順序地剖析LCU以便執行熵解碼。相同情況適用於波前寫碼次序33。
常規寫碼次序32及波前寫碼次序33中之每一者為藉以對由28個LCU(包含串行配置於水平方向上之7個LCU及串行配置於垂直方向上之4個LCU)構成之影像執行熵編碼的次序。每一LCU中所寫之數字表明寫碼次序,且數字越小,寫碼次序越早,且數字越大,寫碼次序越遲。
在常規寫碼次序32中,自為LCU之最上部列的LCU之第一列之最左邊LCU起,對水平方向上之第一列LCU之LCU順序地執行編碼。在對第一列LCU之最右邊LCU執行編碼之後,自安置於第一列LCU下而鄰近於第一列LCU之第二列LCU之最
左邊LCU起,對第二列LCU之LCU順序地執行編碼。以此方式,可對為LCU之最低列之第四列LCU之最右邊LCU執行編碼。又,由於逐個地對所述28個LCU順序地執行編碼,故可在順序地執行總共28次編碼操作之後完成熵編碼。
在波前寫碼次序33中,針對每一列LCU以自最左邊LCU
至最右邊LCU之方式對配置於水平方向上之LCU順序地執行編碼,此事實與常規寫碼次序32中之事實相同。然而,在波前寫碼次序33中,可對多個LCU列執行並行熵編碼。亦即,藉由使用第一執行緒執行對第一列LCU之熵編碼,藉由使用第二執行緒執行對第二列LCU之熵編碼,藉由使用第三執行緒執行對第三列LCU之熵編碼,且藉由使用第四執行緒執行對第四列LCU之熵編碼。
然而,一般並行處理次序與波前寫碼次序33的彼此不同
之處在於:執行緒之間存在時間間隔。亦即,(i)首先自第一列LCU之最前面LCU起藉由使用第一執行緒執行熵編碼。(ii)當藉由使用第一執行緒對第一列LCU之第二LCU執行熵編碼時,可藉由使用第二執行緒自第二列LCU之最前面LCU起開始執行熵編碼。(iii)當藉由使用第一執行緒對第一列LCU之第三LCU執行熵編碼時,可藉由使用第二執行緒對第二列LCU之第二LCU執行熵編碼,且可藉由使用第三執行緒自第三列LCU之最前面LCU起開始執行熵編碼。(iv)當藉由使用第一執行緒對第一列LCU之第四LCU執行熵編碼時,可藉由使用第二執行緒對第二列LCU之第三LCU執行熵編碼,可藉由使用第三執行緒對第三列LCU之第二LCU執行熵編碼,且可藉由使用第四執行緒自第四列
LCU之最前面LCU起開始執行熵編碼。
由於熵編碼在執行緒之間具有時間間隔的情況下開始,故在執行緒之間可存在在熵編碼結束於每一LCU列之最後一個LCU處的時間方面的差異。結果,由於必須針對每一執行緒對7個LCU執行熵編碼,且在執行緒之間以一個LCU之時間間隔開始及結束熵編碼,故在對包含4列LCU之28個LCU執行總共10次編碼操作之後,熵編碼可完成。
熵編碼裝置10及熵解碼裝置20中之每一者可以波前寫碼次序33執行熵編碼及熵解碼。將參看圖4詳細地解釋以波前寫碼次序進行之熵編碼方法及熵解碼方法。
圖4為用於解釋波前寫碼次序及根據本發明之一實施例之判定熵寫碼機率資訊之方法的圖。
熵編碼裝置10可藉由以波前寫碼次序對LCU列執行並行熵編碼而獲得位元串流。又,熵解碼裝置20可藉由順序地剖析來自位元串流的以波前寫碼次序排列之LCU而對LCU列執行並行熵解碼。
詳言之,當熵編碼裝置10之處理核心為多核心處理器時,由於處理核心可藉由使用不同執行緒來執行熵編碼,故可同時對多個LCU列執行熵編碼。又,在波前寫碼次序中,熵編碼裝置10之處理核心可以多個時間間隔同時對不同LCU列執行熵編碼。
又,當熵解碼裝置20包含多核心處理器時,由於自位元串流剖析得的LCU列可根據執行緒加以劃分且處理核心以多個時間間隔使用執行緒,故可以多個時間間隔對不同LCU列執行熵解
碼。
鄰近於當前LCU之相鄰LCU可變成在編碼當前LCU之程序期間執行的各種操作中之參考LCU。舉例而言,可自鄰近於當前區塊之相鄰區塊中選擇用於框內預測之參考區塊、用於運動向量預測之參考區塊、用於合併LCU之參考區塊及用於符號預測(諸如SAO參數預測)之參考區塊。
波前寫碼次序之優點在於,即使當藉由使用其他執行緒來處理位於當前LCU之上面之相鄰LCU及位於當前LCU之右上側之相鄰LCU(所述相鄰LCU變成編碼當前LCU之程序期間所需要之參考區塊)時,所述相鄰LCU仍可早於當前LCU進行編碼。參看圖4,由於使用第一執行緒之編碼之執行比使用第二執行緒之編碼早2個LCU,故當對第二執行緒之LCU L21執行編碼時,對第一執行緒之LCU L11及L12之編碼已完成。因此,可參考LCU L11及L12之符號以便編碼LCU L21。
因此,雖然熵編碼裝置10及熵解碼裝置20藉由使用獨立執行緒而以波前寫碼次序處理LCU,但由於熵編碼裝置10及熵解碼裝置20可獲得編碼/解碼期間所需的相鄰區塊列之參考區塊之資訊,所以熵編碼裝置10及熵解碼裝置20可有效地執行並行編碼/解碼。
由於熵編碼裝置10及熵解碼裝置20對每一個LCU之符號執行算術編碼/解碼,故符號碼機率資訊是必需的。又,由於熵編碼裝置10及熵解碼裝置20基於上下文執行算術編碼/解碼,故可針對每一個LCU更新符號碼機率資訊。
熵編碼裝置10及熵解碼裝置20可獲得每一個LCU之初
始碼機率資訊,且可根據當前LCU之符號之機率來更新初始碼機率資訊。
舉例而言,可自由剛剛編碼之LCU更新之最後碼機率資訊獲得當前LCU之初始碼機率資訊。詳言之,可將LCU L18之初始碼機率資訊181判定為左邊LCU L17之最後碼機率資訊179。同樣地,可將LCU L26之初始碼機率資訊261判定為左邊LCU L25之最後碼機率資訊259,可將LCU L34之初始碼機率資訊341判定為左邊LCU L33之最後碼機率資訊339,且可將LCU L42之初始碼機率資訊421判定為左邊LCU L41之最後碼機率資訊419。
又,熵編碼裝置10及熵解碼裝置20可將第一列之最前面LCU L11之初始碼機率資訊判定為預設碼機率資訊。可將自第二列起之其他列之最前面LCU之初始碼機率資訊判定為相鄰LCU中之具有最大量的上下文資訊之LCU之碼機率資訊。
因此,熵編碼裝置10及熵解碼裝置20可將當前列之最前面LCU之初始碼機率資訊判定為位於所述最前面LCU之右上側處之LCU(亦即,上部列之第二LCU)之最後碼機率資訊。
詳言之,可將第二列之最前面LCU L21之初始碼機率資訊211判定為位於最前面LCU L21之右上側處之LCU L12之最後碼機率資訊129。同樣地,可將第三列之最前面LCU L31之初始碼機率資訊311判定為位於最前面LCU L31之右上側處之LCU L22之最後碼機率資訊229,且可將第四列之最前面LCU L41之初始碼機率資訊411判定為位於最前面LCU L41之右上側處之LCU L32之最後碼機率資訊329。
因此,為了平穩地獲得每一列LCU之最前面LCU之初
始碼機率資訊,熵編碼裝置10及熵解碼裝置20可根據每一執行緒之第二LCU之符號來更新碼機率資訊且將最後碼機率資訊儲存於緩衝器中。
為了獲得用於算術編碼/解碼之基於上下文之碼機率資訊,熵編碼裝置10及熵解碼裝置20必須參考由獨立執行緒處理之LCU之碼機率資訊。由於已按波前寫碼次序儲存了碼機率資訊,故熵編碼裝置10及熵解碼裝置20可容易地獲得碼機率資訊。又,可自相鄰LCU中獲得具有最大量的上下文資訊之碼機率資訊。
圖5及圖6為說明從屬執行緒之同步距離與延遲時間之間的關係的圖。
根據相關技術,為了以波前次序執行並行處理,可調整相鄰LCU之間的延遲時間。此與判定初始碼與用於對當前LCU執行熵編碼/解碼之機率資訊同步之LCU之最後碼機率資訊的問題或判定LCU之當前列與LCU之上部列之間的上下文同步發生的問題有關。此是因為,當前LCU之熵編碼/解碼被延遲,直至在將被參考之LCU中判定了最後碼機率資訊為止。
將當前LCU與將被參考之LCU之間的水平距離稱為「同步距離」。
圖5說明同步距離為1之情況。可將當前列之最前面LCU之初始碼機率資訊判定為位於最前面LCU之右上側處之第二LCU之最後碼機率資訊。因此,當將第一執行緒之最前面LCU L511設定為預設碼機率資訊時,可將第二執行緒之最前面LCU L521之初始碼機率資訊5211判定為第一執行緒之第二LCU L512之最後碼機率資訊5129,且可將第三執行緒之最前面LCU L531之初
始碼機率資訊5311判定為第二執行緒之第二LCU L522之最後碼機率資訊5229。
圖6為說明同步距離為3之情況的圖。可將當前列之最前面LCU之初始碼機率資訊判定為上部列之第四LCU之最後碼機率資訊。因此,當將第一執行緒之最前面LCU L611之初始碼機率資訊設定為預設碼機率資訊時,可將第二執行緒之最前面LCU L621之初始碼機率資訊6211判定為第一執行緒之第四LCU L614之最後碼機率資訊6149,且可將第三執行緒之最前面LCU L631之初始碼機率資訊6311判定為第二執行緒之第四LCU L624之最後碼機率資訊6249。
由於圖5之同步距離較短,故獲得具有LCU之較少更新上下文之碼機率資訊。然而,由於每一列LCU之延遲時間較短,故對整個影像50執行熵編碼或熵解碼所耗用之時間亦被縮短。
由於圖6之同步距離較長,且因此可藉由使用具有LCU之較多更新上下文之碼機率資訊來執行熵編碼或熵解碼,故熵編碼及解碼效能可能極佳。然而,由於對LCU執行之處理開始之時間之間存在巨大差異,故對整個影像60執行熵編碼或熵解碼所耗用之時間變得較長。
又,根據相關技術,存在藉由直接選擇可提供具有最高熵編碼效能之碼機率資訊之LCU來調整同步距離之方法。在此情況下,由於必須額外地執行判定同步距離是否可變之操作,以及當判定同步距離可變時,藉由透過使用相鄰LCU之碼機率資訊來比較熵編碼效能而判定具有最高效能之參考區塊之操作,故計算之量大大增加。
根據相關技術,關於同步距離是否可變之資訊必須在被添加至影像額外資訊(諸如序列參數集(sequence parameter set,SPS)、圖片參數集(picture parameter set,PPS)或切片區段標頭)之後加以傳輸。解碼器可藉由剖析來自影像額外資訊(諸如SPS、PPS、APS或切片區段標頭)的關於同步距離之資訊來檢查同步距離。在檢查同步距離之後,為了獲得LCU列之最前面LCU之初始碼機率資訊,可針對每一個當前LCU列將與最前面LCU間隔開所述同步距離之LCU之最後碼機率資訊儲存於緩衝器中。
然而,執行並行熵編碼或並行熵解碼以便藉由針對多列LCU同時使用多個執行緒來減少處理時間。因此,總處理時間隨著執行緒之間的時間差增加而增加並不可取。
此外,即使熵編碼效能或熵解碼效能歸因於具有LCU之許多更新上下文之碼機率資訊而得到改良,所述改良仍可能為微不足道的。
因此,熵編碼裝置10及熵解碼裝置20可藉由將同步距離固定為1而針對每一列LCU使最前面LCU之初始碼機率資訊同步於位於所述最前面LCU之右上側處之LCU之最後碼機率資訊(如圖5所示)。亦即,由於可不考慮是否調整同步距離而直接判定為了獲得初始碼機率資訊將要參考之區塊,故判定初始碼機率資訊所需之程序可簡化且處理時間可減少。
又,熵編碼裝置10不需要將關於同步距離之資訊添加至SPS、PPS、APS或切片區段標頭及傳輸資訊,且熵解碼裝置20不需要剖析並讀取來自SPS、PPS、APS或切片區段標頭之關於同步距離的資訊。
因此,由於在鄰近LCU列之間僅有與在執行緒之間處理一個LCU所耗用之時間一樣多的延遲時間,故預期將歸因於並行熵編碼或並行熵解碼而減少之處理時間可得以進一步減少。
圖7為用於解釋根據本發明之一實施例的執行簡化的並行熵編碼/解碼之程序的圖。
圖7說明熵編碼裝置10藉由使用兩個執行緒(亦即,第一執行緒及第二執行緒)來執行並行熵編碼的情況。藉由使用第一執行緒編碼第一列、第三列、第五列及第七列,且藉由使用第二執行緒編碼第二列、第四列、第六列及第八列。
由於用於判定每一LCU列之最前面LCU之初始碼機率資訊之同步距離被固定為1,故熵編碼裝置10可針對每一列LCU藉由參考位於最前面LCU之右上側處之LCU之最後碼機率資訊來判定最前面LCU之初始碼機率資訊。
亦即,可將第二列之最前面LCU 721之初始碼機率資訊判定為第一列之第二LCU 712之最後碼機率資訊;可將第三列之最前面LCU 731之初始碼機率資訊判定為第二列之第二LCU 722之最後碼機率資訊;可將第四列之最前面LCU 741之初始碼機率資訊判定為第三列之第二LCU 732之最後碼機率資訊;可將第五列之最前面LCU 751之初始碼機率資訊判定為第四列之第二LCU 742之最後碼機率資訊;可將第六列之最前面LCU 761之初始碼機率資訊判定為第五列之第二LCU 752之最後碼機率資訊;可將第七列之最前面LCU 771之初始碼機率資訊判定為
第六列之第二LCU 762之最後碼機率資訊;且可將第八列之最前面LCU 781之初始碼機率資訊判定為第七列之第二LCU 772之最後碼機率資訊。
經由每一列LCU之熵編碼所產生之寫碼資料可以厚塊為資料單元輸出。由於影像特性及符號根據LCU列改變,故針對各別列LCU產生之厚塊C71、C72、C73、C74、C75及C76可互不相同。因此,在儲存針對每一列LCU產生之寫碼資料之緩衝器中,厚塊之位置及大小可互不相同。
當藉由使用多核心處理器(或出於其他原因)獨立地使用第一執行緒及第二執行緒時,在根據第一執行緒之第一列產生厚塊C71之後,可根據第三列產生厚塊C73。在根據第二執行緒之第二列產生厚塊C72之後,可根據第四列產生厚塊C74。以此方式,當藉由使用獨立的處理核心處理第一執行緒及第二執行緒時,可將藉由使用第一執行緒產生之厚塊C71、C73、C75、……串行地儲存於第一緩衝器中,且可將藉由使用第二執行緒產生之厚塊C72、C74、C76、……串行地儲存於第二緩衝器中。
然而,當藉由使用單核心處理器(或出於其他原因)交替地使用第一執行緒及第二執行緒時,可以如下次序處理多個列:第一列、第二列、第三列、第四列、第五列、第六列及第七列。在此情況下,可以如下次序將厚塊儲存於緩衝器中:厚塊C71、厚塊C72、厚塊C73、厚塊C74、厚塊C75及厚塊C76。因此,當切換第一執行緒及第二執行緒時,在每一列LCU之最後一個LCU之處理完成之後,指示儲存於每一緩衝器中之資料之位置的偏移資訊及指示資料之儲存範圍的範圍資訊是必需的,以作為用於判
定儲存於每一緩衝器中之每一厚塊之位置的資訊。根據相關技術,偏移資訊及緩衝器資訊是儲存作為緩衝器之內部狀態資訊。
然而,即使當緩衝器偏移資訊及緩衝器之範圍資訊是作為緩衝器之內部狀態資訊而剖析得到時,仍可能難以規定用以實際上分離每一列LCU的所產生資料之邊界,且因此不同執行緒之LCU列之資料可能彼此重疊。
根據相關技術,存在針對每一個序列、圖片或切片區段判定是否在LCU列之最後一個LCU中初始化緩衝器之內部狀態資訊之方法。然而,在此情況下,由於「關於是否在LCU列之最後一個LCU中初始化緩衝器之內部狀態資訊的資訊」必須在被添加至SPS、PPS、APS或切片區段標頭之後加以傳輸,故待傳輸之位元增加。又,諸如以下各者之額外程序可能增加:為了熵解碼之目的剖析來自SPS、PPS、APS或切片區段標頭之「關於是否在LCU列之最後一個LCU中初始化緩衝器之內部狀態資訊的資訊」之操作及根據剖析之結果而判定是否初始化緩衝器之內部狀態資訊之操作。
因此,熵編碼裝置10可基於每一列LCU之獨立內部狀態資訊產生獨立厚塊,以便消除對緩衝器之內部狀態資訊之依賴性。為此目的,假設藉由使用第一執行緒及第二執行緒對LCU列執行熵編碼,在處理各別LCU列之最後一個LCU 719、729、739、749、759及769之後,可初始化當前緩衝器內部狀態資訊。因此,可再次基於所有LCU列之最前面LCU中的具預設值之內部狀態資訊來執行熵編碼。
同樣地,假設熵解碼裝置20藉由透過使用第一執行緒及
第二執行緒來執行熵解碼而恢復LCU列,在處理了LCU列之最後一個LCU 719、729、739、749、759及769之後,可將當前緩衝器內部狀態資訊初始化為預設值。
又,熵編碼裝置10不需要將「關於是否在LCU列之最
後一個LCU中初始化緩衝器之內部狀態資訊的資訊」添加至SPS、PPS、APS或切片區段標頭及傳輸所述關於是否在LCU列之最後一個LCU中初始化緩衝器之內部狀態資訊的資訊,且熵解碼裝置20不需要剖析並讀取來自SPS、PPS、APS或切片區塊標頭的「關於是否在LCU列之最後一個LCU中初始化緩衝器之內部狀態資訊的資訊」。
因此,熵編碼裝置10及熵解碼裝置20可藉由以下操作
來簡化並行熵編碼及並行熵解碼,同時將熵編碼/解碼效能降級減至最小:(i)判定待參考之LCU以便在最接近的固定位置處判定每一列LCU之最前面LCU之初始碼機率資訊,及(ii)在LCU列之最後一個LCU中初始化緩衝器之內部狀態資訊。
在熵編碼裝置10及熵解碼裝置20中,視訊資料所分裂
成之區塊為LCU,且LCU中之每一者被分裂成具樹狀結構之寫碼單元(如上所述)。將參看圖8至圖20來解釋根據一實施例的基於LCU及具樹狀結構之寫碼單元之視訊編碼方法及裝置及視訊解碼方法及裝置。
圖8為根據本發明之一實施例之基於根據樹狀結構之寫碼單元之視訊編碼裝置100的方塊圖。
涉及基於根據樹狀結構之寫碼單元之視訊預測的視訊編碼裝置100包含LCU分裂器110、寫碼單元判定器120及輸出單
元130。
LCU分裂器110可基於LCU來分裂當前圖片,LCU是影像之當前圖片之具有最大大小之寫碼單元。若當前圖片大於LCU,則可將當前圖片之影像資料分裂成至少一LCU。根據本發明之一實施例之LCU可為具有32×32、64×64、128×128、256×256等之大小的資料單元,其中資料單元之形狀是寬度及長度為2的平方之正方形。
根據一實施例之寫碼單元可以最大大小及深度為特徵。
深度表明自LCU空間分裂寫碼單元之次數,且隨著深度變深,根據深度之較深寫碼單元可自LCU分裂為最小寫碼單元。LCU之深度為最高深度且最小寫碼單元之深度為最低深度。由於對應於每一深度之寫碼單元之大小隨LCU之深度變深而減小,故對應於較高深度之寫碼單元可包含對應於較低深度之多個寫碼單元。
如上所述,根據寫碼單元之最大大小將當前圖片之影像資料分裂成多個LCU,且所述LCU中之每一者可包含根據深度分裂成之較深寫碼單元。由於根據本發明之一實施例之LCU是根據深度來分裂,故包含於LCU中的空間域之影像資料可根據深度按階層加以分類。
寫碼單元之最大深度及最大大小可被預定,所述兩者限制了按階層分裂LCU之高度及寬度的總次數。
寫碼單元判定器120編碼藉由根據深度分裂LCU之區域所獲得之至少一分裂區域,且根據至少一分裂區域來判定用以輸出最終編碼之影像資料的深度。換言之,寫碼單元判定器120藉由根據深度、根據當前圖片之LCU來編碼較深寫碼單元中之影像
資料及選擇具有最少編碼錯誤之深度而判定寫碼深度。將經判定之寫碼深度及根據經判定之寫碼深度之經編碼影像資料輸出至輸出單元130。
基於對應於等於或低於最大深度之至少一深度之較深寫碼單元來編碼LCU中之影像資料,且基於較深寫碼單元中之每一者來比較編碼影像資料之結果。在比較較深寫碼單元之編碼錯誤之後,可選擇具有最少編碼錯誤之深度。可為每一LCU選擇至少一寫碼深度。
隨著寫碼單元被根據深度按階層分裂,且隨著寫碼單元
之數目增加,LCU之大小被分裂。又,即使寫碼單元在一個LCU中對應於相同深度,仍藉由分別量測每一寫碼單元之影像資料之編碼錯誤來判定是否將對應於相同深度之寫碼單元中之每一者分裂至較低深度。因此,即使當影像資料包含於一個LCU中時,編碼錯誤仍可根據所述一個LCU中之區域而不同,且因此,寫碼深度可根據影像資料中之區域而不同。因此,在一個LCU中可判定一或多個寫碼深度,且可根據至少一寫碼深度之寫碼單元來劃分LCU之影像資料。
因此,寫碼單元判定器120可判定包含於LCU中之具有
樹狀結構之寫碼單元。根據本發明之一實施例的「具有樹狀結構之寫碼單元」包含來自包含於LCU中之所有較深寫碼單元中的對應於被判定為寫碼深度之深度之寫碼單元。可在LCU之同一區域中根據深度按階層判定一寫碼深度之寫碼單元,且可在不同區域中獨立地判定一寫碼深度之寫碼單元。類似地,當前區域中之寫碼深度可根據另一區域中之寫碼深度獨立地判定。
根據本發明之一實施例之最大深度為與自LCU分裂至最小寫碼單元之次數有關之索引。根據本發明之一實施例之第一最大深度可表明自LCU至最小寫碼單元之總分裂次數。根據本發明之一實施例之第二最大深度可表明自LCU至最小寫碼單元之深度層級之總數。舉例而言,當LCU之深度為0時,可將LCU分裂一次成的寫碼單元之深度設定為1,且可將LCU分裂兩次成的寫碼單元之深度設定為2。此處,若最小寫碼單元為LCU分裂四次所得的寫碼單元,則存在5個深度層級:深度0、1、2、3及4,且因此,可將第一最大深度設定為4,且可將第二最大深度設定為5。
可根據LCU來執行預測編碼及變換。亦根據LCU,基於根據等於最大深度之深度或小於最大深度之深度的較深寫碼單元來執行預測編碼及變換。
由於較深寫碼單元之數目每當LCU根據深度分裂時增加,故對隨深度變深所產生之所有較深寫碼單元執行包含預測編碼及變換。為了描述便利起見,在LCU中,現將基於當前深度之寫碼單元來描述預測編碼及變換。
視訊編碼裝置100可以不同方式選擇用於編碼影像資料之資料單元之大小或形狀。為了編碼影像資料,執行諸如預測編碼、變換及熵編碼之操作,且此時,可將相同資料單元用於所有操作,或可將不同資料單元用於每一操作。
舉例而言,視訊編碼裝置100不僅可選擇用於編碼影像資料之寫碼單元,而且可選擇不同於寫碼單元之資料單元以便對寫碼單元中之影像資料執行預測編碼。
為了在LCU中執行預測編碼,可基於對應於寫碼深度之
寫碼單元(亦即,基於不再分裂為對應於較低深度之寫碼單元的寫碼單元)來執行預測編碼。在下文中,現將不再分裂且變為用於預測編碼之基本單元之寫碼單元稱為「預測單元」。藉由分裂預測單元獲得之分割區(partition)可包含藉由分裂預測單元之高度及寬度中之至少一者而獲得之預測單元或資料單元。分割區為寫碼單元之預測單元被分裂所在之資料單元,且預測單元可為大小與寫碼單元相同之分割區。
舉例而言,當2N×2N(其中N為正整數)之寫碼單元不再被分裂且變為2N×2N之預測單元時,分割區之大小可為2N×2N、2N×N、N×2N或N×N。分割區類型之實例包括藉由以對稱方式分裂預測單元之高度或寬度而獲得的對稱分割區、藉由以不對稱方式分裂預測單元之高度或寬度(諸如1:n或n:1)而獲得的分割區、藉由按幾何形狀分裂預測單元而獲得的分割區,及具有任意形狀之分割區
預測單元之預測模式可為框內模式、框間模式及跳躍模式中之至少一者。舉例而言,可對2N×2N、2N×N、N×2N或N×N之分割區執行框內模式或框間模式。又,跳躍模式可僅對2N×2N之分割區執行。對寫碼單元中之一個預測單元獨立地執行編碼,藉此選擇具有最少編碼錯誤之預測模式。
視訊編碼裝置100亦可不僅基於用於編碼影像資料之寫碼單元,而且基於不同於寫碼單元之資料單元而對寫碼單元中之影像資料執行變換。為了在寫碼單元中執行變換,可基於大小小於或等於寫碼單元之資料單元來執行變換。舉例而言,用於變換
之資料單元可包含用於框內模式之資料單元及用於框間模式之資料單元。
寫碼單元中之變換單元可按類似於根據樹狀結構之寫碼單元的方式遞歸地分裂成較小大小之區域。因此,可根據具有根據變換深度之樹狀結構之變換單元來劃分寫碼單元中之殘餘資料。
亦可在變換單元中設定變換深度,其指示藉由分裂寫碼單元之高度及寬度以達到變換單元的分裂之次數。舉例而言,在2N×2N之當前寫碼單元中,在變換單元之大小為2N×2N時,變換深度可為0,在變換單元之大小為N×N時,變換深度可為1,且在變換單元之大小為N/2×N/2時,變換深度可為2。換言之,可根據變換深度來設定具有樹狀結構之變換單元。
根據對應於寫碼深度之寫碼單元之編碼資訊不僅需要關於寫碼深度的資訊,而且需要關於與預測編碼及變換有關之資訊的資訊。因此,寫碼單元判定器120不僅判定具有最少編碼錯誤之寫碼深度,而且判定預測單元中之分割區類型、根據預測單元之預測模式及用於變換之變換單元之大小。
稍後將參看圖10至圖20詳細地描述根據本發明之實施例的根據LCU中之樹狀結構之寫碼單元及判定預測單元/分割區及變換單元之方法。
寫碼單元判定器120可藉由使用基於拉格朗日乘數之速率-失真最佳化來量測根據深度之較深寫碼單元之編碼錯誤。
輸出單元130在位元串流中輸出基於由寫碼單元判定器120判定之至少一寫碼深度所編碼的LCU之影像資料,及關於根
據寫碼深度之編碼模式的資訊。
可藉由編碼影像之殘餘資料來獲得經編碼影像資料。
關於根據寫碼深度之編碼模式的資訊可包含關於寫碼深度、關於預測單元中之分割區類型、預測模式及變換單元之大小的資訊。
可藉由根據深度使用分裂資訊而定義關於寫碼深度之資訊,其指示是否對具較低深度而非當前深度之寫碼單元執行編碼。若當前寫碼單元之當前深度為寫碼深度,則編碼並輸出當前寫碼單元中之影像資料,且因此,分裂資訊可被定義為不將當前寫碼單元分裂至較低深度。或者,若當前寫碼單元之當前深度不為寫碼深度,則對具較低深度之寫碼單元執行編碼,且因此,分裂資訊可被定義以分裂當前寫碼單元從而獲得較低深度之寫碼單元。
若當前深度並非寫碼深度,則對寫碼單元執行編碼,所述寫碼單元為分裂成較低深度之寫碼單元。由於在當前深度之一個寫碼單元中存在較低深度之至少一寫碼單元,故對較低深度之每一寫碼單元重複地執行編碼,且因此,可以遞歸方式對具有相同深度之寫碼單元執行編碼。
由於具有樹狀結構之寫碼單元是針對一個LCU而判定,且關於至少一編碼模式之資訊是針對一寫碼深度之寫碼單元而判定,故可針對一個LCU判定關於至少一編碼模式之資訊。又,因為影像資料是根據深度按階層分裂,故LCU之影像資料之寫碼深度可根據位置而不同,且因此,可針對影像資料來設定關於寫碼深度及編碼模式之資訊。
因此,輸出單元130可將關於對應寫碼深度及編碼模式之編碼資訊指派給包含於LCU中之寫碼單元、預測單元及最小單元中之至少一者。
根據本發明之一實施例之最小單元為藉由將構成最低深度之最小寫碼單元分裂成4個而獲得之正方形資料單元。或者,根據一實施例之最小單元可為可包含於所有包含於LCU中之寫碼單元、預測單元、分割單元及變換單元中的最大正方形資料單元。
舉例而言,可將由輸出單元130輸出之編碼資訊分類為根據較深寫碼單元之編碼資訊及根據預測單元之編碼資訊。根據較深寫碼單元之編碼資訊可包含關於預測模式及關於分割區之大小的資訊。根據預測單元之編碼資訊可包含關於框間模式之估計方向、關於框間模式之參考影像索引、關於運動向量、關於框內模式之色度分量及關於框內模式之內插方法的資訊。
可將關於根據圖片、切片或GOP界定之寫碼單元之最大大小的資訊及關於最大深度之資訊插入至位元串流之標頭、序列參數集或圖片參數集中。
亦可經由位元串流之標頭、序列參數集或圖片參數集來輸出關於相對於當前視訊所准許之變換單元之最大大小的資訊及關於變換單元之最小大小的資訊。輸出單元130可編碼並輸出與預測有關之參考資訊、預測資訊及切片類型資訊。
在視訊編碼裝置100中,較深寫碼單元可為藉由將在上一個層中的具較高深度之寫碼單元之高度或寬度除以二所獲得之寫碼單元。換言之,當具當前深度之寫碼單元之大小為2N×2N時,具較低深度之寫碼單元之大小為N×N。又,大小為2N×2N的具有
當前深度之寫碼單元可包含最多4個具有較低深度之寫碼單元。
因此,視訊編碼裝置100可藉由基於LCU之大小及考慮當前圖片之特性所判定之最大深度來針對每一LCU判定具有最佳形狀及最佳大小之寫碼單元而形成具有樹狀結構之寫碼單元。又,由於可藉由使用各種預測模式及變換中之任一者來對每一LCU執行編碼,故可考慮到具各種影像大小之寫碼單元之特性來判定最佳編碼模式。
因此,若以習知巨集區塊來編碼具有高解析度或大資料量之影像,則每個圖片之巨集區塊之數目過度增加。因此,針對每一巨集區塊所產生之壓縮資訊之份數增加,且因此,難以傳輸壓縮資訊,且資料壓縮效率降低。然而,藉由使用視訊編碼裝置100,影像壓縮效率可增加,因為當在考慮影像之大小之同時增加寫碼單元之最大大小時,在考慮影像之特性之同時調整寫碼單元。
視訊編碼裝置100針對每一個LCU判定具樹狀結構之寫碼單元,且由於針對每一個編碼單元執行編碼而產生符號。熵編碼裝置10可對每一個LCU之符號執行熵編碼。詳言之,針對藉由分裂圖片所產生之每一個圖塊或切片區段,熵編碼裝置10可根據包含串行配置於水平方向上之LCU之LCU列對每一LCU執行熵編碼。又,熵編碼裝置10可同時對兩列或兩列以上之LCU執行並行熵編碼。
第一熵編碼器12對串行地配置於水平方向上之第一列LCU之LCU順序地執行熵編碼。可將第一列LCU之LCU中的將首先予以處理之LCU之初始熵寫碼機率資訊判定為預設機率資訊。
可藉由使用基於第一列LCU之最前面LCU之符號更新之熵寫碼機率資訊對第一列LCU之第二LCU執行熵編碼。
第二熵編碼器14可將第二列LCU之最前面LCU之初始熵寫碼機率資訊判定為由第一列LCU之固定位置之LCU更新之熵寫碼機率資訊。第二熵編碼器14可基於初始熵寫碼機率資訊對第二列LCU之最前面LCU執行熵編碼。自最前面LCU起,第二熵編碼器14可對第二列LCU之串行配置之LCU順序地執行熵編碼。
同樣地,在獲得由第二列LCU之第二LCU更新之熵寫碼機率資訊之後,熵編碼裝置10可開始對安置於第二列LCU下而鄰近於第二列LCU之第三列LCU執行熵編碼。
在使熵編碼完成至第一列LCU之最後一個LCU之後,第一熵編碼器12初始化第一列LCU之熵編碼位元串之內部狀態資訊。在使熵編碼完成至第二列LCU之最後一個LCU之後,第二熵編碼器14亦可初始化第二列LCU之熵編碼位元串之內部狀態資訊。
圖9為根據本發明之一實施例之基於具有樹狀結構之寫碼單元之視訊解碼裝置200的方塊圖。
涉及基於具有樹狀結構之寫碼單元之視訊預測的視訊解碼裝置200包含接收器210、影像資料及編碼資訊擷取器220及影像資料解碼器230。
用於視訊解碼裝置200之解碼操作的各種術語(諸如寫碼單元、深度、預測單元、變換單元及關於各種編碼模式之資訊)之定義與參考圖8及視訊編碼裝置100所描述之術語的定義相同。
接收器210接收並剖析經編碼視訊之位元串流。影像資料及編碼資訊擷取器220自經剖析位元串流擷取每一寫碼單元之經編碼影像資料,其中寫碼單元具有根據每一LCU之樹狀結構,且影像資料及編碼資訊擷取器220將擷取之影像資料輸出至影像資料解碼器230。影像資料及編碼資訊擷取器220可自關於當前圖片之標頭、序列參數集或圖片參數集擷取關於當前圖片之寫碼單元之最大大小的資訊。
又,影像資料及編碼資訊擷取器220自經剖析位元串流擷取關於具有根據每一LCU之樹狀結構之寫碼單元之寫碼深度及編碼模式的資訊。將關於寫碼深度及編碼模式的所擷取資訊輸出至影像資料解碼器230。換言之,將位元串流中之影像資料分裂成LCU,使得影像資料解碼器230解碼每一LCU之影像資料。
可將關於根據LCU之寫碼深度及編碼模式的資訊設定為關於對應於寫碼深度之至少一寫碼單元之資訊,且關於編碼模式之資訊可包含關於對應於寫碼深度之對應寫碼單元之分割區類型、關於預測模式及變換單元之大小的資訊。又,可擷取根據深度之分裂資訊,以作為關於寫碼深度之資訊。
由影像資料及編碼資訊擷取器220擷取的關於根據每一LCU之寫碼深度及編碼模式之資訊是經判定以在編碼器(諸如視訊編碼裝置100)根據根據每一LCU之深度重複地執行每一較深寫碼單元之編碼時產生最小編碼錯誤的關於寫碼深度及編碼模式之資訊。因此,視訊解碼裝置200可藉由根據產生最小編碼錯誤的寫碼深度及編碼模式解碼影像資料來恢復影像。
由於關於寫碼深度及編碼模式之編碼資訊可指派給對應
寫碼單元、預測單元及最小單元中之預定資料單元,故影像資料及編碼資訊擷取器220可根據預定資料單元來擷取關於寫碼深度及編碼模式之資訊。若根據預定資料單元來記錄關於對應LCU之寫碼深度及編碼模式之資訊,則被指派了關於寫碼深度及編碼模式之相同資訊的預定資料單元可被推斷為包含於同一LCU中之資料單元。
影像資料解碼器230藉由基於根據LCU之關於寫碼深度及編碼模式之資訊來解碼每一LCU中之影像資料而恢復當前圖片。換言之,影像資料解碼器230可基於包含於每一LCU中的具有樹狀結構之寫碼單元中之每一寫碼單元的關於分割區類型、預測模式及變換單元之所擷取資訊來解碼經編碼影像資料。解碼程序可包含包含框內預測及運動補償之預測,及反變換。
基於關於根據寫碼深度之寫碼單元之預測單元的分割區類型及預測模式的資訊,影像資料解碼器230可根據每一寫碼單元之分割區及預測模式來執行框內預測或運動補償。
另外,影像資料解碼器230可讀取關於根據每一寫碼單元之樹狀結構之變換單元的資訊,以便基於每一寫碼單元之變換單元執行反變換以用於每一LCU之反變換。經由反變換,可恢復寫碼單元之空間區域之像素值。
影像資料解碼器230可藉由使用根據深度之分裂資訊來判定當前LCU之寫碼深度。若分裂資訊指示影像資料在當前深度上不再被分裂,則當前深度即為寫碼深度。因此,影像資料解碼器230可藉由使用對應於寫碼深度之每一寫碼單元的關於預測單元之分割區類型、預測模式及變換單元之大小之資訊來解碼當前
LCU中之經編碼資料。
換言之,可藉由觀察為寫碼單元、預測單元及最小單元中之預定資料單元指派之編碼資訊集合來收集含有包含相同分裂資訊之編碼資訊的資料單元,且可將收集之資料單元視為待由影像資料解碼器230以相同編碼模式解碼的一個資料單元。因而,可藉由獲得關於每一寫碼單元之編碼模式之資訊來解碼當前寫碼單元。
接收器210可包含圖2A之熵解碼裝置20。熵解碼裝置20可剖析來自接收之位元串流的多個LCU列。
當接收器22自位元串流擷取第一列LCU及第二列LCU時,第一熵解碼器24可藉由對第一列LCU執行熵解碼而順序地恢復第一列LCU之LCU之符號。
第二熵解碼器26可將第二列LCU之最前面LCU之初始熵寫碼機率資訊判定為由第一列LCU之固定位置之LCU更新之熵寫碼機率資訊。
第二熵解碼器26可基於經判定的初始熵寫碼機率資訊對第二列區塊之最前面LCU執行熵解碼。第二熵解碼器26可基於剖析第二列LCU之最前面LCU之結果對第二LCU執行熵解碼。以此方式,可順序地恢復第二列LCU之LCU符號。
同樣地,在獲得由第二列LCU之第二LCU更新之熵寫碼機率資訊之後,熵解碼裝置20可開始對安置於第二列LCU下而鄰近於第二列LCU之第三列LCU執行熵解碼。
在使熵解碼完成至第一列LCU之最後一個LCU之後,第一熵解碼器24可初始化第一列LCU之位元串之內部狀態資訊。
因此,熵解碼裝置20可藉由同時對兩列或兩列以上LCU執行並行熵解碼來恢復LCU之符號。
因此,視訊解碼裝置200可獲得關於在針對每一LCU以遞歸方式執行編碼時產生最小編碼錯誤之至少一寫碼單元的資訊,且可使用所述資訊解碼當前圖片。換言之,可解碼經判定為每一LCU中之最佳寫碼單元的具有樹狀結構之寫碼單元。
因此,即使影像資料具有高解析度及大量資料,仍可藉由使用寫碼單元之大小及編碼模式來有效地解碼及恢復影像資料,寫碼單元之大小及編碼模式是藉由使用自編碼器接收之關於最佳編碼模式之資訊而根據影像資料之特性以自適應方式判定。
圖10為用於根據本發明之一實施例解釋寫碼單元之概念的圖。
寫碼單元之大小可藉由寬度×高度來表示,且可為64×64、32×32、16×16及8×8。64×64之寫碼單元可分裂成64×64、64×32、32×64或32×32之分割區,且32×32之寫碼單元可分裂成32×32、32×16、16×32或16×16之分割區,16×16之寫碼單元可分裂成16×16、16×8、8×16或8×8之分割區,且8×8之寫碼單元可分裂成8×8、8×4、4×8或4×4之分割區。
在視訊資料310中,解析度為1920×1080,寫碼單元之最大大小為64,且最大深度為2。在視訊資料320中,解析度為1920×1080,寫碼單元之最大大小為64,且最大深度為3。在視訊資料330中,解析度為352×288,寫碼單元之最大大小為16,且最大深度為1。圖10中所展示之最大深度表明自LCU至最小解碼單元之總分裂次數。
若解析度較高或資料量較大,則寫碼單元之最大大小可
較大以便不僅使編碼效率增加,而且準確地反映影像之特性。因此,解析度大於視訊資料330之視訊資料310及320之寫碼單元之最大大小可為64。
由於視訊資料310之最大深度為2,故視訊資料310之寫
碼單元315可包含長軸大小為64之LCU及長軸大小為32及16之寫碼單元,這是因為藉由使LCU分裂兩次而使深度加深至兩個層。由於視訊資料330之最大深度為1,故視訊資料330之寫碼單元335可包含長軸大小為16之LCU及長軸大小為8之寫碼單元,這是因為藉由使LCU分裂一次而使深度加深至一個層。
由於視訊資料320之最大深度為3,故視訊資料320之寫
碼單元325可包含長軸大小為64之LCU及長軸大小為32、16及8之寫碼單元,這是因為藉由使LCU分裂三次而使深度加深至三個層。隨著深度加深,可精確地表述詳細資訊。
圖11為根據本發明之一實施例之基於寫碼單元之影像編
碼器400的方塊圖。
影像編碼器400執行視訊編碼裝置100之寫碼單元判定
器120之操作以編碼影像資料。換言之,框內預測器410對來自當前圖框405中的處於框內模式之寫碼單元執行框內預測,且運動估計器420及運動補償器425藉由使用當前圖框405及參考圖框495而分別對來自當前圖框405中的處於框間模式之寫碼單元執行框間估計及運動補償。
自框內預測器410、運動估計器420及運動補償器425
輸出之資料是經由變換器430及量化器440輸出作為經量化的變
換係數。經由反量化器460及反變換器470將經量化的變換係數恢復作為空間域中之資料,且空間域中之經恢復資料在經由解區塊單元480及迴路濾波單元490後處理之後被輸出作為參考圖框495。經量化變換係數可經由熵編碼器450輸出作為位元串流455。
為了將影像編碼器400應用於視訊編碼裝置100中,影像編碼器400之所有元件(亦即,框內預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反量化器460、反變換器470、解區塊單元480及迴路濾波單元490)在考慮每一LCU之最大深度之同時基於具有樹狀結構之寫碼單元中之每一寫碼單元來執行操作。
具體言之,框內預測器410、運動估計器420及運動補償器425在考慮當前LCU之最大大小及最大深度之同時,判定來自具有樹狀結構之寫碼單元中之每一寫碼單元之分割區及預測模式,且變換器430判定來自具有樹狀結構之寫碼單元中之每一寫碼單元中的變換單元之大小。
詳言之,熵編碼器450可對應於熵編碼裝置10。
圖12為根據本發明之一實施例之基於寫碼單元之影像解碼器500的方塊圖。
剖析器510剖析來自位元串流505之待解碼的經編碼影像資料及解碼所需的關於編碼之資訊。經編碼影像資料是經由熵解碼器520及反量化器530而輸出作為經反量化之資料,且經反量化之資料是經由反變換器540而恢復為空間域中之影像資料。
框內預測器550相對於空間域中之影像資料對處於框內模式之寫碼單元執行框內預測,且運動補償器560藉由使用參考
圖框585而對處於框間模式之寫碼單元執行運動補償。
通過框內預測器550及運動補償器560的空間域中之影像資料可在經由解區塊單元570及迴路濾波單元580後處理之後被輸出作為經恢復圖框595。又,經由解區塊單元570及迴路濾波單元580後處理之影像資料可被輸出以作為參考圖框585。
為了在視訊解碼裝置200之影像資料解碼器230中解碼影像資料,影像解碼器500可執行在剖析器510之後執行的操作。
為了將影像解碼器500應用於視訊解碼裝置200中,影像解碼器500之所有元件(亦即,剖析器510、熵解碼器520、反量化器530、反變換器540、框內預測器550、運動補償器560、解區塊單元570及迴路濾波單元580)基於每一LCU之具有樹狀結構之寫碼單元來執行操作。
具體言之,框內預測550及運動補償器560基於具有樹狀結構之寫碼單元中之每一者之分割區及預測模式來執行操作,且反變換器540基於每一寫碼單元之變換單元之大小來執行操作。詳言之,熵解碼器520可對應於熵解碼裝置20。
圖13為說明根據本發明之一實施例的根據深度之較深寫
碼單元及分割區的圖。
視訊編碼裝置100及視訊解碼裝置200使用階層式寫碼
單元以便考慮影像之特性。寫碼單元之最大高度、最大寬度及最大深度可根據影像之特性而以自適應方式判定,或可由使用者不同地設定。可根據寫碼單元之預定最大大小來判定根據深度之較深寫碼單元之大小。
在寫碼單元之階層式結構600中,根據本發明之一實施
例,寫碼單元之最大高度及最大寬度各自為4,且最大深度為4。在此情況下,最大深度指代寫碼單元自LCU分裂為最小寫碼單元之總次數。由於深度沿著階層式結構600之垂直軸線加深,故較深寫碼單元之高度及寬度各自被分裂。又,沿著階層式結構600之水平軸線展示了為每一較深寫碼單元之預測編碼之基礎的預測單元及分割區。
換言之,寫碼單元610為階層式結構600中之LCU,其中深度為0且大小(高度乘以寬度)為64×64。深度沿著垂直軸線加深,且寫碼單元620具有大小32×32及深度1、寫碼單元630具有大小16×16及深度2且寫碼單元640具有大小8×8及深度3。大小為4×4且深度為3之寫碼單元640為最小寫碼單元。
根據每一深度沿著水平軸線來配置寫碼單元之預測單元及分割區。換言之,若大小為64×64且深度為0之寫碼單元610為預測單元,則可將預測單元分裂成包含於編碼單元610中之分割區,亦即,大小為64×64之分割區610、大小為64×32之分割區612、大小為32×64之分割區614或大小為32×32之分割區616。
類似地,可將大小為32×32且深度為1之寫碼單元620之預測單元分裂成包含於寫碼單元620中之分割區,亦即,大小為32×32之分割區620、大小為32×16之分割區622、大小為16×32之分割區624及大小為16×16之分割區626。
類似地,可將大小為16×16且深度為2之寫碼單元630之預測單元分裂成包含於寫碼單元630中之分割區,亦即,包含於寫碼單元630中之大小為16×16之分割區、大小為16×8之分割區632、大小為8×16之分割區634及大小為8×8之分割區636。
類似地,可將大小為8×8且深度為3之寫碼單元640之預測單元分裂成包含於寫碼單元640中之分割區,亦即,包含於寫碼單元640中之大小為8×8之分割區、大小為8×4之分割區642、大小為4×8之分割區644及大小為4×4之分割區646。
為了判定構成LCU 610之寫碼單元之至少一寫碼深度,視訊編碼裝置100之寫碼單元判定器120執行包含於LCU 610中之對應於每一深度之寫碼單元的編碼。
包含相同範圍中及相同大小的資料之根據深度的較深寫碼單元之數目隨著深度加深而增加。舉例而言,需要對應於深度2之四個寫碼單元以涵蓋包含於對應於深度1之一個寫碼單元中之資料。因此,為了比較同一資料根據多個深度之編碼結果,各自編碼對應於深度1之一個寫碼單元及對應於深度2之四個寫碼單元。
為了針對多個深度中之當前深度執行編碼,可藉由沿著階層式結構600之水平軸線針對對應於當前深度之寫碼單元中之每一預測單元執行編碼而為當前深度選擇最少編碼錯誤。或者,可藉由隨著深度沿著階層式結構600之垂直軸線加深而對每一深度執行編碼,比較根據多個深度之最少編碼錯誤來搜尋最小編碼錯誤。可選擇寫碼單元610中之具有最小編碼錯誤之深度及分割區作為寫碼單元610之寫碼深度及分割區類型。
圖14為用於根據本發明之一實施例解釋寫碼單元710與變換單元720之間的關係的圖。
視訊編碼裝置100或視訊解碼裝置200針對每一LCU根據具有小於或等於LCU之大小之寫碼單元來編碼或解碼影像。可
基於不大於對應寫碼單元之資料單元來選擇編碼期間之用於變換之變換單元之大小。
舉例而言,在視訊編碼裝置100或視訊解碼裝置200中,若寫碼單元710之大小為64×64,則可藉由使用大小為32×32之變換單元720來執行變換。
又,可藉由對大小為32×32、16×16、8×8及4×4之小於64×64之變換單元中之每一者執行變換來編碼大小為64×64之寫碼單元710的資料,且接著可選擇具有最少寫碼錯誤之變換單元。
圖15為用於根據本發明之一實施例描述對應於寫碼深度之寫碼單元之編碼資訊的圖。
視訊編碼裝置100之輸出單元130可編碼並傳輸對應於寫碼深度之每一寫碼單元之關於分割區類型之資訊800、關於預測模式之資訊810及關於變換單元之大小之資訊820,以作為關於編碼模式之資訊。
資訊800指示關於藉由分裂當前寫碼單元之預測單元而獲得之分割區之形狀的資訊,其中分割區為用於預測編碼當前寫碼單元的資料單元。舉例而言,可將大小為2N×2N之當前寫碼單元CU_0分裂成大小為2N×2N之分割區802、大小為2N×N之分割區804、大小為N×2N之分割區806及大小為N×N之分割區808中之任一者。此處,設定關於分割區類型之資訊800以指示大小為2N×N之分割區804、大小為N×2N之分割區806及大小為N×N之分割區808中之一者。
資訊810指示每一分割區之預測模式。舉例而言,資訊810可指示對由資訊800指示之分割區執行之預測編碼之模式,亦
即,框內模式812、框間模式814或跳躍模式816。
詳言之,視訊編碼裝置100及視訊解碼裝置200可根據框內模式812之預測單元之框內預測方向或預測類型來判定框內模式類型。
根據根據框內模式類型之框內預測,可藉由參考鄰近於當前預測單元之相鄰預測單元之符號來判定當前預測單元之符號。因此,可將關於所參考符號之方向之資訊表示為框內模式類型。
框內模式類型之實例可包含平面模式類型、水平模式類型、垂直模式類型及DC模式類型。根據平面模式類型,將當前預測單元之像素值預測為在特定方向上具有分級(gradation)之值。根據水平模式類型,將當前預測單元之像素值預測為位於當前預測單元之水平方向上之相鄰像素值。根據垂直模式類型,將當前預測單元之像素值預測為位於當前預測單元之垂直方向上之相鄰像素值。根據DC模式類型,將當前預測單元之像素值預測為基於鄰近於當前預測單元之相鄰像素值而判定之DC值。
又,可將框內模式類型表示為指示預測方向之特定角度之值。又,可將色度分量之預測單元之框內模式類型判定為與亮度分量之相同預測單元之框內模式類型相同。
然而,在當前預測單元之相鄰預測單元為不可存取之資料或並非框內模式之預測單元時,視訊編碼裝置100及視訊解碼裝置200可將當前預測單元之框內模式類型判定為預設模式類型。
可將預設模式類型設定為框內模式類型中的具有高出現機率之模式類型。詳言之,可將DC模式類型或平面模式類型判定
為預設模式類型。然而,當將預設模式類型設定為特定類型且接著分析整個影像之預測單元中的具有最高出現機率之類型時,經設定為預設模式類型之特定類型之出現機率傾向於為最高的。
根據DC模式類型之框內預測之優點在於,預測值是藉由使用簡單計算來判定的。平面模式類型之優點在於,影像品質得到改良。然而,相比於根據DC模式類型之框內預測,根據平面模式類型之框內預測需要過於複雜之計算。詳言之,當與根據DC模式類型之框內預測之計算量相比時,根據平面模式類型之框內預測之計算量隨著預測單元之大小增加而增加。相對照地,在根據DC模式類型之框內預測中,在人工影像(諸如畫面內容)之均勻區域中,框內預測之編碼效率可得到極大改良。
因此,視訊編碼裝置100及視訊解碼裝置200可將DC模式類型判定為框內模式類型之預設模式類型。因此,當判定框內模式類型以便對當前預測單元執行框內預測且當前預測單元之相鄰預測單元為不可存取之資料或並非框內模式之預測單元時,視訊編碼裝置100及視訊解碼裝置200可將當前預測單元之框內模式類型判定為作為預設模式類型之DC模式類型。
資訊820指示當對當前寫碼單元執行變換時所基於的變換單元。舉例而言,變換單元可為第一框內變換單元822、第二框內變換單元824、第一框間變換單元826或第二框間變換單元828。
視訊解碼裝置200之影像資料及編碼資訊擷取器220可根據每一較深寫碼單元擷取資訊800、810及820且將所述資訊用於解碼。
圖16為根據本發明之一實施例的根據深度之較深寫碼單
元的圖。
分裂資訊可用以指示深度之變化。分裂資訊指示當前深度之寫碼單元是否被分裂成較低深度之寫碼單元。
用於預測編碼深度為0且大小為2N_0×2N_0之寫碼單元900之預測單元910可包含以下分割區:大小為2N_0×2N_0之分割區類型912,大小為2N_0×N_0之分割區類型914,大小為N_0×2N_0之分割區類型916,及大小為N_0×N_0之分割區類型918。圖9僅說明藉由以對稱方式分裂預測單元910獲得之分割區類型912至918,但分割區類型不限於此,且預測單元910之分割區可包含不對稱分割區、具有預定形狀之分割區及具有幾何形狀之分割區。
根據每一分割區類型,對大小為2N_0×2N_0的一個分割
區、大小為2N_0×N_0的兩個分割區、大小為N_0×2N_0的兩個分割區及大小為N_0×N_0的四個分割區重複地執行預測編碼。可對大小為2N_0×2N_0、N_0×2N_0、2N_0×N_0及N_0×N_0之分割區執行框內模式及框間模式之預測編碼。僅對大小為2N_0×2N_0之分割區執行跳躍模式之預測編碼。
若編碼錯誤在分割區類型912至916中之一者中最小,
則預測單元910可不分裂成較低深度。
若編碼錯誤在分割區類型918中最小,則將深度自0變
至1以分裂分割區類型918(在操作920中),且對深度為2且大小為N_0×N_0之寫碼單元930重複地執行編碼以搜尋最小編碼錯誤。
用於預測編碼深度為1且大小為2N_1×2N_1(=N_0×N_0)
之寫碼單元930之預測單元940可包含以下分割區:大小為2N_1×2N_1之分割區類型942,大小為2N_1×N_1之分割區類型944,大小為N_1×2N_1之分割區類型946,及大小為N_1×N_1之分割區類型948。
若編碼錯誤在分割區類型948中最小,則使深度自1變至2以分裂分割區類型948(在操作950中),且對深度為2且大小為N_2×N_2之寫碼單元960重複地執行編碼以搜尋最小編碼錯誤。
當最大深度為d時,可執行根據每一深度之分裂操作,直至深度變為d-1,且可編碼分裂資訊,直至深度為0至d-2中之一者。換言之,當在操作970中分裂對應於深度d-2之寫碼單元之後執行編碼直至深度d-1時,用於預測編碼深度為d-1且大小為2N_(d-1)×2N_(d-1)之寫碼單元980之預測單元990可包含以下分割區:大小為2N_(d-1)×2N_(d-1)之分割區類型992,大小為2N_(d-1)×N_(d-1)之分割區類型994,大小為N_(d-1)×2N_(d-1)之分割區類型996,及大小為N_(d-1)×N_(d-1)之分割區類型998。
可對來自分割區類型992至998中的大小為2N_(d-1)×2N_(d-1)的一個分割區、大小為2N_(d-1)×N_(d-1)的兩個分割區、大小為N_(d-1)×2N_(d-1)的兩個分割區、大小為N_(d-1)×N_(d-1)的四個分割區重複地執行預測編碼,以搜尋具有最小編碼錯誤之分割區類型。
即使當分割區類型998具有最小編碼錯誤時,由於最大深度為d,故深度為d-1之寫碼單元CU_(d-1)仍不再分裂至較低深度,且構成當前LCU 900之寫碼單元的寫碼深度經判定為d-1且
當前LCU 900之分割區類型可被判定為N_(d-1)×N_(d-1)。又,由於最大深度為d且最低深度為d-1之最小寫碼單元980不再被分裂至較低深度,故不設定最小寫碼單元980之分裂資訊。
資料單元999可為當前LCU之「最小單元」。根據本發
明之一實施例之最小單元可為藉由將最小寫碼單元980分裂成四份所獲得之正方形資料單元。藉由重複地執行編碼,視訊編碼裝置100可藉由根據寫碼單元900之深度來比較編碼錯誤而選擇具有最少編碼錯誤之深度以判定寫碼深度,且設定對應分割區類型及預測模式以作為所述寫碼深度之編碼模式。
因而,在所有深度1至d中比較根據深度之最小編碼錯
誤,且可判定具有最少編碼錯誤之深度以作為寫碼深度。可編碼並傳輸寫碼深度、預測單元之分割區類型及預測模式以作為關於編碼模式之資訊。又,由於寫碼單元是自深度0分裂至寫碼深度,故僅將寫碼深度之分裂資訊設定為0,且將除寫碼深度外的深度的分裂資訊設定為1。
視訊解碼裝置200之影像資料及編碼資訊擷取器220可
擷取並使用關於寫碼單元900之寫碼深度及預測單元之資訊來解碼分割區912。視訊解碼裝置200可藉由使用根據深度的分裂資訊而將分裂資訊為0之深度判定為寫碼深度,且將關於對應深度之編碼模式之資訊用於解碼。
圖17至圖19為用於根據本發明之一實施例解釋寫碼單元1010、預測單元1060及變換單元1070之間的關係的圖。
寫碼單元1010為LCU中之具有樹狀結構之寫碼單元,其對應於由視訊編碼裝置100判定之寫碼深度。預測單元1060為
寫碼單元1010中之每一者之預測單元之分割區,且變換單元1070為寫碼單元1010中之每一者之變換單元。
當在寫碼單元1010中LCU之深度為0時,寫碼單元1012及1054之深度為1,寫碼單元1014、1016、1018、1028、1050及1052之深度為2,寫碼單元1020、1022、1024、1026、1030、1032及1048之深度為3,且寫碼單元1040、1042、1044及1046之深度為4。
在預測單元1060中,一些編碼單元1014、1016、1022、1032、1048、1050、1052及1054是藉由分裂編碼單元1010中之寫碼單元而獲得。換言之,寫碼單元1014、1022、1050及1054中之分割區類型具有2N×N之大小,寫碼單元1016、1048及1052中之分割區類型具有N×2N之大小,且寫碼單元1032之分割區類型具有N×N之大小。寫碼單元1010之預測單元及分割區小於或等於每一寫碼單元。
以小於寫碼單元1052之資料單元對變換單元1070中之寫碼單元1052之影像資料執行變換或反變換。又,變換單元1070中之寫碼單元1014、1016、1022、1032、1048、1050及1052在大小及形狀方面不同於預測單元1060中之寫碼單元。換言之,視訊編碼裝置100及視訊解碼裝置200可個別地對同一寫碼單元中之資料單元執行框內預測、運動估計、運動補償、變換及反變換。
因此,對LCU之每一區域中的具有階層結構之寫碼單元中之每一者遞歸地執行編碼以判定最佳寫碼單元,且因此,可獲得具有遞歸樹狀結構之寫碼單元。編碼資訊可包含關於寫碼單元之分裂資訊、關於分割區類型之資訊、關於預測模式之資訊及關
於變換單元之大小之資訊。表1展示可由視訊編碼裝置100及視訊解碼裝置200設定之編碼資訊。
視訊編碼裝置100之輸出單元130可輸出關於具有樹狀結構之寫碼單元之編碼資訊,且視訊解碼裝置200之影像資料及編碼資訊擷取器220可自接收之位元串流擷取關於具有樹狀結構之寫碼單元之編碼資訊。
分裂資訊指示當前寫碼單元是否被分裂成具較低深度之寫碼單元。若當前深度d之分裂資訊為0,則當前寫碼單元不再分裂成較低深度所在之深度為寫碼深度,且因此,可針對所述寫碼深度定義關於分割區類型、預測模式及變換單元之大小的資訊。
若根據分裂資訊,當前寫碼單元被進一步分裂,則獨立地對具較低深度之四個經分裂寫碼單元執行編碼。
預測模式可為框內模式、框間模式及跳躍模式中之一者。可在所有分割區類型中定義框內模式及框間模式,且僅在大小為2N×2N之分割區類型中定義跳躍模式。
關於分割區類型之資訊可指示大小為2N×2N、2N×N、N×2N及N×N之對稱分割區類型(所述對稱分割區類型是藉由對稱地分裂預測單元之高度或寬度而獲得),及大小為2N×nU、2N×nD、nL×2N及nR×2N之不對稱分割區類型(所述不對稱分割區類型是藉由不對稱地分裂預測單元之高度或寬度而獲得)。大小為2N×nU及2N×nD之不對稱分割區類型可分別藉由按1:3及3:1分裂預測單元之高度而獲得,且大小為nL×2N及nR×2N之不對稱分割區類型可分別藉由按1:3及3:1分裂預測單元之寬度而獲得。
變換單元之大小可設定為框內模式中之兩個類型及框間模式中之兩個類型。換言之,若變換單元之分裂資訊為0,則變換單元之大小可為2N×2N,其為當前寫碼單元之大小。若變換單元之分裂資訊為1,則可藉由分裂當前寫碼單元而獲得變換單元。又,若大小為2N×2N之當前寫碼單元之分割區類型為對稱分割區類型,則變換單元之大小可為N×N,且若當前寫碼單元之分割區類型為不對稱分割區類型,則變換單元之大小可為N/2×N/2。
關於具有樹狀結構之寫碼單元之編碼資訊可包含對應於寫碼深度之寫碼單元、預測單元及最小單元中之至少一者。對應於寫碼深度之寫碼單元可包含含有相同編碼資訊之預測單元及最小單元中之至少一者。
因此,藉由比較鄰近資料單元之編碼資訊來判定鄰近資料單元是否包含於對應於寫碼深度之同一寫碼單元中。又,藉由使用資料單元之編碼資訊判定對應於寫碼深度之對應寫碼單元,且因此可判定LCU中之寫碼深度的分佈。
因此,若當前寫碼單元是基於鄰近資料單元之編碼資訊來預測的,則可直接參考及使用鄰近於當前寫碼單元之較深寫碼單元中之資料單元之編碼資訊。
或者,若當前寫碼單元是基於鄰近資料單元之編碼資訊來預測的,則使用所述資料單元之經編碼資訊來搜尋鄰近於當前寫碼單元之資料單元,且可參考搜尋到之鄰近寫碼單元來預測當前寫碼單元。
圖20為用於根據表1之編碼模式資訊解釋寫碼單元、預測單元及變換單元之間的關係的圖。
LCU 1300包含具多個寫碼深度之寫碼單元1302、1304、1306、1312、1314、1316及1318。此處,由於寫碼單元1318為一寫碼深度之寫碼單元,故分裂資訊可設定為0。可將關於大小為2N×2N之寫碼單元1318之分割區類型之資訊設定為大小為2N×2N之分割區類型1322、大小為2N×N之分割區類型1324、大小為N×2N之分割區類型1326、大小為N×N之分割區類型1328、大小為2N×nU之分割區類型1332、大小為2N×nD之分割區類型1334、大小為nL×2N之分割區類型1336及大小為nR×2N之分割區類型1338中之一者。
變換單元之分裂資訊(TU大小旗標)為一類型之變換索引。可根據寫碼單元之預測單元類型或分割區類型而改變對應於
變換索引的變換單元之大小。
舉例而言,當分割區類型經設定為對稱(亦即,分割區類型1322、1324、1326或1328)時,若變換單元之TU大小旗標為0,則設定具有2N×2N之大小之變換單元1342,且若TU大小旗標為1,則設定具有N×N之大小之變換單元1344。
當分割區類型經設定為不對稱(亦即,分割區類型1332、1334、1336或1338)時,若TU大小旗標為0,則設定具有2N×2N之大小之變換單元1352,且若TU大小旗標為1,則設定具有N/2×N/2之大小之變換單元1354。
參看圖20,TU大小旗標為具有0或1的值之旗標,但TU大小旗標不限於1位元,且當TU大小旗標自0開始增加時,變換單元可在階層上分裂從而具有樹狀結構。變換單元之分裂資訊(TU大小旗標)可為變換索引之實例。
在此情況下,根據根據本發明之一實施例,可藉由將變換單元之TU大小旗標與變換單元之最大大小及最小大小一起使用來表示已實際使用之變換單元之大小。視訊編碼裝置100能夠編碼最大變換單元大小資訊、最小變換單元大小資訊及最大TU大小旗標。可將編碼最大變換單元大小資訊、最小變換單元大小資訊及最大TU大小旗標之結果插入至SPS中。視訊解碼裝置200可藉由使用最大變換單元大小資訊、最小變換單元大小資訊及最大TU大小旗標來解碼視訊。
舉例而言,(a)若當前寫碼單元之大小為64×64且最大變換單元大小為32×32,則變換單元之大小(a-1)在TU大小旗標為0時可為32×32,(a-2)在TU大小旗標為1時可為16×16,
且(a-3)在TU大小旗標為2時可為8×8。
作為另一實例,(b)若當前寫碼單元之大小為32×32且最大變換單元大小為32×32,則(b-1)變換單元之大小在TU大小旗標為0時可為32×32。此處,不可將TU大小旗標設定為除0之外之值,因為變換單元之大小不能小於32×32。
作為另一實例,(c)若當前寫碼單元之大小為64×64且最大TU大小旗標為1,則TU大小旗標可為0或1。此處,不可將TU大小旗標設定為除0或1之外之值。
因此,若定義:最大TU大小旗標為「MaxTransformSizeIndex」,最小變換單元大小為「MinTransformSize」,且變換單元大小在TU大小旗標為0時為「RootTuSize」,則可藉由方程式(1)來定義可在當前寫碼單元中判定之當前最小變換單元大小「CurrMinTuSize」:CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)).........(1)
與可在當前寫碼單元中判定之當前最小變換單元大小「CurrMinTuSize」相比,TU大小旗標為0時的變換單元大小「RootTuSize」可表明可在系統中選擇之最大變換單元大小。在方程式(1)中,「RootTuSize/(2^MaxTransformSizeIndex)」表明當變換單元大小「RootTuSize」(當TU大小旗標為0時)被分裂對應於最大TU大小旗標之次數時的變換單元大小,且「MinTransformSize」表明最小變換大小。因此,「RootTuSize/(2^MaxTransformSizeIndex)」及「MinTransformSize」中之較小值可為可在當前寫碼單元中判定之當前最小變換單元大
小「CurrMinTuSize」。
根據根據本發明之一實施例,最大變換單元大小RootTuSize可根據預測模式之類型而改變。
舉例而言,若當前預測模式為框間模式,則可藉由使用下文之方程式(2)來判定「RootTuSize」。在方程式(2)中,「MaxTransformSize」表明最大變換單元大小,且「PUSize」表明當前預測單元大小。
RootTuSize=min(MaxTransformSize,PUSize).........(2)亦即,若當前預測模式為框間模式,則當TU大小旗標為0時,變換單元大小「RootTuSize」可為最大變換單元大小及當前預測單元大小中之較小值。
若當前分割單元之預測模式為框內模式,則可藉由使用下文之方程式(3)來判定「RootTuSize」。在方程式(3)中,「PartitionSize」表明當前分割單元之大小。
RootTuSize=min(MaxTransformSize,PartitionSize).........(3)
亦即,若當前預測模式為框內模式,則當TU大小旗標為0時,變換單元大小「RootTuSize」可為最大變換單元大小及當前分割單元之大小中之較小值。
然而,根據分割單元中之預測模式之類型而改變之當前最大變換單元大小「RootTuSize」僅為實例,且本發明不限於此。
根據如參看圖8至圖20所描述的基於具有樹狀結構之寫碼單元的視訊編碼方法,針對樹狀結構之寫碼單元中之每一者編碼空間區域之影像資料。根據基於具有樹狀結構之寫碼單元的視訊解碼方法,針對每一LCU執行解碼以恢復空間區域之影像資
料。因此,可恢復圖片及為圖片序列之視訊。所恢復的視訊可由再生裝置再生、儲存於儲存媒體中或經由網路傳輸。
根據本發明之實施例可被撰寫為電腦程式,且可使用電腦可讀記錄媒體實施於執行程式之通用數位電腦中。電腦可讀記錄媒體之實例包含磁性儲存媒體(例如,ROM、軟碟、硬碟等)及光學記錄媒體(例如,CD-ROM或DVD)。
雖然已參考本發明之例示性實施例特定展示並描述了本發明,但一般熟習此項技術者將理解,在不脫離由以下申請專利範圍界定的根據本發明之精神及範疇之情況下,可在本文中做出形式及細節之各種變化。
為了描述方便起見,將參看圖1A至圖20所描述之框間預測方法及視訊編碼方法共同稱為「根據本發明之視訊編碼方法」。另外,將參看圖1A至圖20所描述之運動補償方法及視訊解碼方法稱為「根據本發明之視訊解碼方法」。
又,將已參看圖1A至圖20描述之視訊編碼裝置(其包含框間預測裝置10、視訊編碼裝置40、視訊編碼裝置100或影像編碼器400)稱為「根據本發明之視訊編碼裝置」。另外,將已參看圖1A至圖20描述之視訊解碼裝置(其包含運動補償裝置20、視訊解碼裝置50、視訊解碼裝置200或影像解碼器500)稱為「根據本發明之視訊解碼裝置」。
現將詳細描述根據本發明之一實施例的儲存程式之電腦可讀記錄媒體,例如光碟26000。
圖21為根據本發明之一實施例的儲存有程式之光碟26000之實體結構的圖。作為儲存媒體之光碟26000可為硬碟機、
光碟-唯讀記憶體(compact disc-read only memory,CD-ROM)光碟、藍光光碟或數位影音光碟(digital versatile disc,DVD)。光碟26000包含多個同心播放軌Tr,其在光碟26000之圓周方向上各自被劃分成特定數目個扇區Se。在光碟26000之特定區域中,可指派並儲存執行上文所描述之視訊編碼方法及視訊解碼方法之程式。
現將參看圖20來描述使用儲存媒體體現之電腦系統,所述儲存媒體儲存用於執行如上所述之視訊編碼方法及視訊解碼方法之程式。
圖22為用於藉由使用光碟26000來記錄及讀取程式之光碟機26800的圖。電腦系統27000可經由光碟機26800將執行根據本發明之一實施例之視訊編碼方法及視訊解碼方法中之至少一者的程式儲存於光碟26000中。為了在電腦系統27000中執行儲存於光碟26000中之程式,可藉由使用光碟機27000自光碟26000讀取程式且將程式傳輸至電腦系統26700。
執行根據本發明之一實施例之視訊編碼方法及視訊解碼方法中之至少一者的程式不僅可儲存於圖21或圖22中所說明之光碟26000中,而且可儲存於記憶卡、ROM卡匣或固態硬碟(solid state drive,SSD)中。
下文將描述上文所描述之視訊編碼方法及視訊解碼方法應用至的系統。
圖23為用於提供內容分佈服務之內容供應系統11000之總體結構的圖。通信系統之服務區被劃分成預定大小之小區,且無線基地台11700、11800、11900及12000被分別安裝於此等小
區中。
內容供應系統11000包含多個獨立器件。舉例而言,所述多個獨立器件(諸如,電腦12100、個人數位助理(personal digital assistant,PDA)12200、視訊攝影機12300及行動電話12500)經由網際網路服務提供者11200、通信網路11400及無線基地台11700、11800、11900及12000而連接至網際網路11100。
然而,內容供應系統11000不限於如圖21中所說明者,且器件可選擇性地連接至其。所述多個獨立器件可不經由無線基地台11700、11800、11900及12000而直接連接至通信網路11400。
視訊攝影機12300為能夠捕捉視訊影像之成像器件,例如數位視訊攝影機。行動電話12500可使用各種協定(例如,個人數位通信(Personal Digital Communications,PDC)、分碼多重存取(Code Division Multiple Access,CDMA)、寬頻分碼多重存取(Wideband-Code Division Multiple Access,W-CDMA)、全球行動通信系統(Global System for Mobile Communications,GSM)及個人手持電話系統(Personal Handyphone System,PHS))中的至少一通信方法。
視訊攝影機12300可經由無線基地台11900及通信網路11400連接至串流伺服器11300。串流伺服器11300允許經由即時廣播來串流傳輸經由視訊攝影機12300自使用者接收之內容。可使用視訊攝影機12300或串流伺服器11300來編碼自視訊攝影機12300接收之內容。可經由電腦12100將由視訊攝影機12300捕捉之視訊資料傳輸至串流伺服器11300。
亦可經由電腦12100將由相機12600捕捉之視訊資料傳
輸至串流伺服器11300。相機12600為能夠捕捉靜態影像及視訊影像兩者之成像器件,其類似於數位相機。可使用相機12600或電腦12100來編碼由相機12600捕捉之視訊資料。執行編碼及解碼視訊之軟體可儲存於可由電腦12100存取之電腦可讀記錄媒體(例如,CD-ROM光碟、軟碟、硬碟機、SSD或記憶卡)中。
若藉由建置於行動電話12500中之相機來捕捉視訊資料,則可自行動電話12500接收視訊資料。
亦可藉由安裝於視訊攝影機12300、行動電話12500或相機12600中之大型積體電路(large scale integrated circuit,LSI)系統來編碼視訊資料。
內容供應系統11000可編碼由使用者使用視訊攝影機12300、相機12600、行動電話12500或另一成像器件記錄之內容資料(例如,在音樂會期間記錄之內容),且將經編碼的內容資料傳輸至串流伺服器11300。串流伺服器11300可將呈串流內容之類型的經編碼內容資料傳輸至請求所述內容資料之其他用戶端。
所述用戶端為能夠解碼經編碼內容資料之器件,例如,電腦12100、PDA 12200、視訊攝影機12300或行動電話12500。因此,內容供應系統11000允許所述用戶端接收並再生經編碼內容資料。又,內容供應系統11000允許所述用戶端接收經編碼內容資料,且即時地解碼並再生經編碼內容資料,藉此實現個人廣播。
包含於內容供應系統11000中之所述多個獨立器件之編碼操作及解碼操作可類似於根據本發明之一實施例之視訊編碼裝置及視訊解碼裝置之編碼操作及解碼操作。
現將參看圖24及圖25較詳細地描述根據本發明之一實施例之包含於內容供應系統11000中之行動電話12500。
圖24說明根據本發明之一實施例的應用了視訊編碼方法及視訊解碼方法的行動電話12500之外部結構。行動電話12500可為智慧型手機,其功能不受限制且其大量功能可變化或被擴展。
行動電話12500包含內部天線12510(可經由所述內部天線與無線基地台12000交換射頻(radio-frequency,RF)信號),且包含用於顯示由相機12530捕捉之影像或經由天線12510接收且經解碼之影像的顯示螢幕12520,例如,液晶顯示器(liquid crystal display,LCD)或有機發光二極體(organic light-emitting diode,OLED)螢幕。行動電話12500包含操作面板12540,其包含控制按鈕及觸控面板。若顯示螢幕12520為觸控螢幕,則操作面板12540進一步包含顯示螢幕12520之觸控感測面板。行動電話12500包含用於輸出語音及聲音之揚聲器12580或另一類型之聲音輸出單元,及用於輸入語音及聲音之麥克風12550或另一類型之聲音輸入單元。行動電話12500進一步包含相機12530(諸如電荷耦合器件(charge-coupled device,CCD)相機)以捕捉視訊及靜態影像。行動電話12500可進一步包含用於儲存經編碼/經解碼資料(例如,由相機12530捕捉,經由電子郵件接收或根據各種方式獲得之視訊或靜態影像)之儲存媒體12570;以及槽12560,儲存媒體12570經由所述槽而裝載至行動電話12500中。儲存媒體12570可為快閃記憶體,例如,安全數位(secure digital,SD)卡或包含於塑膠罩殼中之電可抹除可程式化唯讀記憶體(electrically erasable and programmable read only memory,
EEPROM)。
圖25說明根據本發明之一實施例的行動電話12500之內部結構。為了系統地控制包含顯示螢幕12520及操作面板12540之行動電話12500之部件,電力供應電路12700、操作輸入控制器12640、影像編碼單元12720、相機介面12630、LCD控制器12620、影像解碼單元12690、多工器/解多工器12680、記錄/讀取單元12670、調變/解調變單元12660及聲音處理器12650經由同步匯流排12730連接至中央控制器12710。
若使用者操作電源按鈕且自「斷電」狀態設定至「通電」狀態,則電力供應電路12700將電力自電池組供應至行動電話12500之所有部件,藉此將行動電話12500設定為操作模式。
中央控制器12710包含中央處理單元(central processing unit,CPU)、ROM及RAM。
在行動電話12500將通信資料傳輸至外部的同時,行動電話12500在中央控制器12710的控制下產生數位信號。舉例而言,聲音處理器12650可產生數位聲音信號,影像編碼單元12720可產生數位影像信號,且可經由操作面板12540及操作輸入控制器12640產生訊息之文字資料。當在中央控制器12710之控制下將數位信號傳輸至調變/解調變單元12660時,調變/解調變單元12660調變數位信號之頻帶,且通信電路12610對經頻帶調變之數位聲音信號執行數位至類比轉換(digital-to-analog conversion,DAC)及頻率轉換。自通信電路12610輸出之傳輸信號可經由天線12510傳輸至語音通信基地台或無線基地台12000。
舉例而言,當行動電話12500處於交談模式下時,經由
麥克風12550獲得之聲音信號是在中央控制器12710之控制下由聲音處理器12650變換成數位聲音信號。數位聲音信號可經由調變/解調變單元12660及通信電路12610變換成變換信號,且可經由天線12510傳輸。
當在資料通信模式下傳輸文字訊息(例如,電子郵件)時,文字訊息之文字資料是經由操作面板12540輸入且經由操作輸入控制器12640傳輸至中央控制器12610。在中央控制器12610之控制下,文字資料經由調變/解調變單元12660及通信電路12610而變換成傳輸信號且經由天線12510傳輸至無線基地台12000。
為了在資料通信模式下傳輸影像資料,經由相機介面12630將由相機12530捕捉之影像資料提供給影像編碼單元12720。捕捉到之影像資料可經由相機介面12630及LCD控制器12620而直接顯示於顯示螢幕12520上。
影像編碼單元12720之結構可對應於上文所描述之視訊編碼裝置100之結構。影像編碼單元12720可根據上文所描述之由視訊編碼裝置100或影像編碼器400使用之視訊編碼方法將自相機12530接收之影像資料變換成經壓縮且經編碼之影像資料,且接著將經編碼影像資料輸出至多工器/解多工器12680。在相機12530之記錄操作期間,由行動電話12500之麥克風12550獲得之聲音信號可經由聲音處理器12650變換成數位聲音資料,且數位聲音資料可傳輸至多工器/解多工器12680。
多工器/解多工器12680將自影像編碼單元12720接收之經編碼影像資料與自聲音處理器12650接收之聲音資料一起多工。將資料多工之結果可經由調變/解調變單元12660及通信電路
12610而變換成傳輸信號,且可接著經由天線12510傳輸。
在行動電話12500自外部接收通信資料的同時,對經由天線12510接收之信號執行頻率復原及ADC以將信號變換成數位信號。調變/解調變單元12660調變數位信號之頻帶。根據數位信號之類型,將經頻帶調變之數位信號傳輸至視訊解碼單元12690、聲音處理器12650或LCD控制器12620。
在交談模式下,行動電話12500放大經由天線12510接收之信號,且藉由對經放大信號執行頻率轉換及ADC而獲得數位聲音信號。在中央控制器12710之控制下,經由調變/解調變單元12660及聲音處理器12650將接收之數位聲音信號變換成類比聲音信號,且經由揚聲器12580輸出類比聲音信號。
當處於資料通信模式下時,接收在網際網路網站處存取之視訊檔案之資料,經由調變/解調變單元12660將經由天線12510自無線基地台12000接收之信號輸出為多工資料,且將所述多工資料傳輸至多工器/解多工器12680。
為了解碼經由天線12510接收之多工資料,多工器/解多工器12680將多工資料解多工成經編碼的視訊資料串流及經編碼的音訊資料串流。經由同步匯流排12730,分別將經編碼視訊資料串流及經編碼音訊資料串流提供給視訊解碼單元12690及聲音處理器12650。
影像解碼單元12690之結構可對應於上文所描述之視訊解碼裝置200之結構。根據上文所描述之由視訊解碼裝置200或影像解碼器500使用之視訊解碼方法,影像解碼單元12690可解碼經編碼視訊資料以獲得恢復之視訊資料且經由LCD控制器
12620將恢復之視訊資料提供至顯示螢幕12520。
因此,在網際網路網站處存取之視訊檔案之資料可顯示於顯示螢幕12520上。同時,聲音處理器12650可將音訊資料變換成類比聲音信號,且將類比聲音信號提供至揚聲器12580。因此,亦可經由揚聲器12580再生在網際網路網站處存取之視訊檔案中所含之音訊資料。
行動電話12500或另一類型之通信終端機可為包含根據本發明之一實施例之視訊編碼裝置及視訊解碼裝置兩者之收發終端機,可為僅包含視訊編碼裝置之收發終端機,或可為僅包含視訊解碼裝置之收發終端機。
根據本發明之通信系統不限於上文參看圖24所描述之通信系統。舉例而言,圖26說明根據本發明之一實施例的使用通信系統之數位廣播系統。圖26之數位廣播系統可藉由使用根據本發明之實施例之視訊編碼裝置及視訊解碼裝置來接收經由衛星或地面網路傳輸之數位廣播。
具體言之,廣播台12890藉由使用無線電波而將視訊資料串流傳輸至通信衛星或廣播衛星12900。廣播衛星12900傳輸廣播信號,且經由家用天線12860將廣播信號傳輸至衛星廣播接收器。在每一座房屋中,可藉由TV接收器12810、機上盒12870或另一器件來解碼並再生經編碼視訊串流。
當將根據本發明之實施例之視訊解碼裝置實施於再生裝置12830中時,再生裝置12830可剖析並解碼記錄在儲存媒體12820(諸如光碟或記憶卡)上之經編碼視訊串流以恢復數位信號。因此,可(例如)在監視器12840上再生經恢復之視訊信號。
在連接至用於衛星/地面廣播之天線12860或用於接收有線電視(television,TV)廣播之有線電視天線12850的機上盒12870中,可安裝根據本發明之實施例之視訊解碼裝置。亦可在TV監視器12880上再生自機上盒12870輸出之資料。
作為另一實例,根據本發明之實施例之視訊解碼裝置可安裝於TV接收器12810中而非機上盒12870中。
具有適當天線12910之汽車12920可接收自衛星12900或無線基地台11700傳輸之信號。可在安裝於汽車12920中之汽車導航系統12930之顯示螢幕上再生經解碼視訊。
視訊信號可由根據本發明之實施例之視訊編碼裝置編碼且可接著儲存於儲存媒體中。具體言之,影像信號可藉由DVD記錄器儲存於DVD光碟12960中或可藉由硬碟記錄器12950而儲存於硬碟中。作為另一實例,視訊信號可儲存於SD卡12970中。若硬碟記錄器12950包含根據本發明之一實施例之視訊解碼裝置,則可在TV監視器12880上再生記錄於DVD光碟12960、SD卡12970或另一儲存媒體上之視訊信號。
汽車導航系統12930可不包含圖26之相機12530、相機介面12630及影像編碼單元12720。舉例而言,電腦12100及TV接收器12810可不包含於圖26之相機12530、相機介面12630及影像編碼單元12720中。
圖27為說明根據本發明之一實施例的使用視訊編碼裝置及視訊解碼裝置之雲端計算系統之網路結構的圖。
雲端計算系統可包含雲端計算伺服器14000、使用者資料庫(database,DB)14100、多個計算資源14200及使用者終端機。
雲端計算系統回應於來自使用者終端機之請求而經由資料通信網路(例如,網際網路)提供多個計算資源14200之隨選外包服務。在雲端計算環境下,服務提供者藉由透過使用虛擬化技術來組合位於實體上不同位置之資料中心處的計算資源而為使用者提供所要服務。服務使用者不必為了使用計算資源(例如,應用程式、儲存器、作業系統(operating system,OS)及安全性程式)而將所述計算資源安裝至使用者自身之終端機中,而是可在所要時間點自經由虛擬化技術產生之虛擬空間中之服務中選擇並使用所要服務。
指定服務使用者之使用者終端機是經由包含網際網路及行動電信網路之資料通信網路連接至雲端計算伺服器14000。使用者終端機可被提供來自雲端計算伺服器14000之雲端計算服務(且詳言之,視訊再生服務)。使用者終端機可為各種類型之能夠連接至網際網路之電子器件,例如,桌上型PC 14300、智慧TV 14400、智慧型手機14500、筆記型電腦14600、攜帶型多媒體播放器(portable multimedia player,PMP)14700、平板PC 14800及其類似者。
雲端計算伺服器14000可組合分佈於雲端網路中之多個計算資源14200且為使用者終端機提供組合之結果。多個計算資源14200可包含各種資料服務,且可包含自使用者終端機上載之資料。如上所述,雲端計算伺服器14000可藉由根據虛擬化技術來組合分佈於不同區域中之視訊資料庫而為使用者終端機提供所要服務。
將關於已訂用雲端計算服務之使用者的使用者資訊儲存
於使用者DB 14100中。使用者資訊可包含使用者之登錄資訊、地址、姓名及個人信用資訊。使用者資訊可進一步包含視訊之索引。此處,索引可包含已再生之視訊之清單、正在再生之視訊之清單、再生過之視訊之暫停點及其類似者。
儲存於使用者DB 14100中的關於視訊之資訊可在使用者器件之間共用。舉例而言,當回應於來自筆記型電腦14600之請求將視訊服務提供給筆記型電腦14600時,將視訊服務之再生歷史儲存於使用者DB 14100中。當自智慧型手機14500接收到用以再生此視訊服務之請求時,雲端計算伺服器14000基於使用者DB 14100來搜尋此視訊服務並再生此視訊服務。當智慧型手機14500自雲端計算伺服器14000接收視訊資料串流時,藉由解碼視訊資料串流來再生視訊之程序類似於上文關於圖24所描述之行動電話12500的操作。
雲端計算伺服器14000可參考儲存於使用者DB 14100中的所要視訊服務之再生歷史。舉例而言,雲端計算伺服器14000自使用者終端機接收用以再生儲存於使用者DB 14100中之視訊之請求。若再生過此視訊,則由雲端計算伺服器14000執行的串流傳輸此視訊之方法可根據來自使用者終端機之請求(亦即,根據視訊是否將被自視訊之開頭或視訊之暫停點開始再生)而改變。舉例而言,若使用者終端機請求自視訊之開頭開始再生視訊,則雲端計算伺服器14000自視訊之第一圖框開始將視訊之串流資料傳輸至使用者終端機。若使用者終端機請求自視訊之暫停點開始再生視訊,則雲端計算伺服器14000自對應於暫停點之圖框開始將視訊之串流資料傳輸至使用者終端機。
在此情況下,使用者終端機可包含上文參看圖1A至圖20所描述之視訊解碼裝置。作為另一實例,使用者終端機可包含如上文參看圖1A至圖20所描述之視訊編碼裝置。或者,使用者終端機可包含如上文參看圖1A至圖20所描述之視訊解碼裝置及視訊編碼裝置兩者。
上文已參看圖21至圖27描述上文參看圖1A至圖20所描述的根據本發明之實施例之視訊編碼方法、視訊解碼方法、視訊編碼裝置及視訊解碼裝置的各種應用。然而,根據本發明之各種實施例的將視訊編碼方法及視訊解碼方法儲存於儲存媒體中之方法或在器件中實施視訊編碼裝置及視訊解碼裝置之方法不限於上文參看圖21至圖27所描述之實施例。
雖然已參考本發明之例示性實施例藉由使用特定術語特定展示且描述了本發明,但實施例及術語僅用以解釋本發明且不應被解釋為限制如由申請專利範圍界定的本發明之範疇。例示性實施例應僅從描述性意義上來考慮且不用於限制目的。因此,本發明之範疇並非由本發明之詳細描述界定,而是由附加之申請專利範圍界定,且在範疇內之所有差異將被解釋為包含於本發明中。
11‧‧‧熵編碼方法
S13、S15、S17‧‧‧操作
Claims (15)
- 一種用於視訊編碼之熵編碼方法,所述熵編碼方法包括:對來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的串行配置於水平方向上之第一列區塊中之區塊順序地執行熵編碼;將安置於所述第一列區塊下而鄰近於所述第一列區塊之第二列區塊之最前面區塊的初始熵寫碼機率資訊判定為由所述第一列區塊之固定位置之區塊更新之熵寫碼機率資訊,基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵編碼,且對所述第二列區塊之所述串行配置之區塊順序地執行熵編碼;以及在所述熵編碼完成至所述第一列區塊之最後一個區塊之後,初始化所述第一列區塊之熵編碼位元串之內部狀態資訊。
- 如申請專利範圍第1項所述之熵編碼方法,其中對所述第二列區塊之所述串行配置之區塊之順序地執行熵編碼的步驟包括:為了判定所述第二列區塊之所述最前面區塊之初始熵寫碼機率資訊,參考由所述第一列區塊的位於所述第二列區塊之所述最前面區塊之右上側處之第二區塊更新之熵寫碼機率資訊,其中,為了判定待參考之區塊以便判定所述第二列區塊之所述最前面區塊之所述初始熵寫碼機率資訊,跳過關於所述第一列區塊與所述第二列區塊之間的上下文同步發生在包括所述影像之圖片中的分析。
- 如申請專利範圍第2項所述之熵編碼方法,其中對所述第 二列區塊之所述串行配置之區塊之順序地執行熵編碼的步驟包括,在獲得基於所述第一列區塊之所述第二區塊之符號更新之熵寫碼機率資訊之後,開始自所述第二列區塊之所述最前面區塊起執行熵編碼,其中所述熵編碼方法進一步包括,在獲得由所述第二列區塊之第二區塊更新之熵編碼機率資訊之後,開始自安置於所述第二列區塊下而鄰近於所述第二列區塊之第三列區塊的最前面區塊起對所述第三列區塊執行熵編碼。
- 如申請專利範圍第1項所述之熵編碼方法,其中初始化所述第一列區塊之所述熵編碼位元串的所述內部狀態資訊的步驟包括:在儲存所述第一列區塊之所述熵編碼位元串之緩衝器中,將指示儲存接觸所述影像之邊界之所述最後一個區塊之碼的位置的偏移資訊及指示碼間隔之範圍的範圍資訊初始化至預設值;以及基於所述經初始化之內部狀態資訊對第四列區塊執行熵編碼,所述第四列區塊與所述第一列區塊屬於同一執行緒且在所述第一列區塊之後處理,其中為了初始化所述內部狀態資訊,在包括所述影像之所述圖片中,不允許在對每一列區塊之最後一個區塊執行熵編碼之後選擇是否初始化所述熵編碼位元串之所述內部狀態資訊。
- 如申請專利範圍第1項所述之熵編碼方法,其中所述影像為藉由在水平方向上分裂圖片而產生之切片區段中之一者或藉由在水平方向及垂直方向上分裂所述圖片而產生之圖塊中之一者,且 所述影像之區塊為各自包括具樹狀結構之寫碼單元之最大寫碼單元,且所述第一列區塊及所述第二列區塊中之每一者為串行配置於所述水平方向上之所述最大寫碼單元之群組。
- 一種用於視訊解碼之熵解碼方法,所述熵解碼方法包括:自接收之位元串流擷取第一列區塊及第二列區塊,所述第一列區塊及所述第二列區塊各自包括來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的串行配置於水平方向上之區塊之位元串;藉由對所述第一列區塊執行熵解碼而順序地恢復所述第一列區塊之區塊之符號;將所述第二列區塊之最前面區塊之初始熵寫碼機率資訊判定為由所述第一列區塊之固定位置之區塊更新之熵寫碼機率資訊,基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵解碼,且順序地恢復所述第二列區塊之區塊之符號;以及在使所執行之所述熵解碼完成至所述第一列之最後一個區塊之後,初始化所述第一列區塊之位元串之內部狀態資訊。
- 如申請專利範圍第6項所述之熵解碼方法,其中順序地恢復所述第二列區塊之所述區塊之所述符號的步驟包括:為了判定所述第二列區塊之所述最前面區塊之初始熵寫碼機率資訊,參考由所述第一列區塊的位於所述第二列區塊之所述最前面區塊之右上側處之第二區塊更新之熵寫碼機率資訊,其中,為了判定待參考之區塊以便判定所述第二列區塊之所述最前面區塊之所述初始熵寫碼機率資訊,不剖析來自所述位元 串流的關於所述第一列區塊與所述第二列區塊之間的上下文同步發生在包括所述影像之圖片中的資訊。
- 如申請專利範圍第7項所述之熵解碼方法,其中順序地恢復所述第二列區塊之所述區塊之所述符號的步驟包括,在獲得基於所述第一列區塊之所述第二區塊之符號更新之熵寫碼機率資訊之後,開始自所述第二列區塊之所述最前面區塊起執行熵解碼,其中所述熵解碼方法進一步包括,在獲得由所述第二列區塊之第二區塊更新之熵寫碼機率資訊之後,開始自安置於所述第二列區塊下而鄰近於所述第二列區塊之第三列區塊的最前面區塊起對所述第三列區塊執行熵解碼。
- 如申請專利範圍第6項所述之熵解碼方法,其中初始化所述第一列區塊之所述位元串之所述內部狀態資訊的步驟包括:在儲存所述第一列區塊之所述位元串之緩衝器中,將指示儲存接觸所述影像之邊界之所述最後一個區塊之碼的位置的偏移資訊及指示碼間隔之範圍的範圍資訊初始化至預設值;以及基於所述經初始化之內部狀態資訊對下一位元串執行熵解碼,所述下一位元串與所述第一列區塊屬於同一執行緒且在所述第一列區塊之所述位元串之後處理,且恢復第四列區塊之區塊,其中為了初始化所述內部狀態資訊,在包括所述影像之圖片中,在對每一列區塊之最後一個區塊執行熵解碼之後,不剖析來自所述位元串流的關於所述內部狀態資訊是否經初始化之資訊。
- 如申請專利範圍第6項所述之熵解碼方法,其中所述影像為藉由在水平方向上分裂圖片而產生之切片區段中之一者或藉由在水平方向及垂直方向上分裂所述圖片而產生之圖塊中之一 者,且所述影像之區塊為各自包括具樹狀結構之寫碼單元之最大寫碼單元,所述第一列區塊及所述第二列區塊中之每一者為串行配置於所述水平方向上之所述最大寫碼單元之群組。
- 如申請專利範圍第8項所述之熵解碼方法,其中當所述熵解碼方法是藉由使用兩個或兩個以上處理核心執行時,所述第一列區塊之所述區塊之所述符號之所述順序恢復包括,藉由使用第一處理核心,藉由使用基於所述第一列區塊之最前面區塊之符號更新之熵寫碼機率資訊而自所述第一列區塊之第二區塊起執行熵解碼,所述第二列區塊之所述區塊之所述符號之所述順序恢復包括,藉由使用第二處理核心,緊接在獲得基於所述第一列區塊之所述第二區塊之符號更新之熵寫碼機率資訊之後,開始藉由使用所述獲得之熵寫碼機率資訊自所述第二列區塊之所述最前面區塊起對所述第二列區塊執行熵解碼,且所述第二處理核心對所述第二列區塊執行之熵解碼操作被從所述第一處理核心對所述第一列區塊執行之熵解碼操作延遲與獲得基於所述第一列區塊之所述第二區塊之所述符號更新之所述熵寫碼機率資訊所耗用之時間差不多的時間。
- 如申請專利範圍第6項所述之熵解碼方法,其中當所述熵解碼方法是藉由使用一個處理核心執行時,所述熵解碼方法包括:藉由使用第一處理核心,藉由使用第一處理核心對所述第一列區塊之區塊順序地執行熵解碼來恢復所述第一列區塊之符號; 藉由使用所述第一處理核心,在所述熵解碼完成至所述第一列區塊之最後一個區塊之後,初始化所述第一列區塊之位元串之內部狀態資訊;藉由使用所述第一處理核心,將所述第二列區塊之所述最前面區塊之初始熵寫碼機率資訊判定為由所述第一列區塊之第二區塊之符號更新之熵寫碼機率資訊,且藉由基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵解碼而順序地恢復所述第二列區塊之區塊之符號;藉由使用所述第一處理核心,在使所述熵解碼完成至所述第二列區塊之最後一個區塊之後,初始化所述第二列區塊之位元串之內部狀態資訊;以及藉由使用所述第一處理核心,將安置於所述第二列區塊下而鄰近於所述第二列區塊之第三列區塊之最前面區塊的初始熵寫碼機率資訊判定為由所述第二列區塊之第二區塊之符號更新之熵寫碼機率資訊,藉由使用所述第一列區塊之所述位元串之所述經初始化之內部狀態資訊及所述經判定之初始熵寫碼機率資訊而對所述第三列區塊之所述最前面區塊執行熵解碼,且順序地恢復所述第三列區塊之區塊之符號。
- 一種用於視訊編碼之熵編碼裝置,所述熵編碼裝置包括:第一熵編碼器,其對來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的串行配置於水平方向上之第一列區塊之區塊順序地執行熵編碼;第二熵編碼器,其將安置於所述第一列區塊下而鄰近於所述第一列區塊之第二列區塊之最前面區塊的初始熵寫碼機率資訊判 定為由所述第一列區塊之固定位置之區塊更新之熵寫碼機率資訊,基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵編碼,且對所述第二行區塊之串行配置之區塊順序地執行熵編碼,其中在所述熵編碼完成至所述第一列區塊之最後一個區塊之後,所述第一熵編碼器初始化所述第一列區塊之熵編碼位元串之內部狀態資訊。
- 一種用於視訊解碼之熵解碼裝置,所述熵解碼裝置包括:接收器,其自接收之位元串流擷取第一列區塊及第二列區塊,所述第一列區塊及所述第二列區塊各自包括來自各自具有預定大小且藉由分裂及編碼影像所獲得之區塊中的串行配置於水平方向上之區塊之位元串;第一熵解碼器,其對所述第一列區塊執行熵解碼且順序地恢復所述第一列區塊之區塊之符號;以及第二熵解碼器,其將所述第二列區塊之最前面區塊之初始熵寫碼機率資訊判定為由所述第一列區塊之固定位置之區塊更新之熵寫碼機率資訊,基於所述經判定初始熵寫碼機率資訊對所述第二列區塊之所述最前面區塊執行熵解碼,且順序地恢復所述第二列區塊之區塊之符號,其中在所述熵解碼完成至所述第一列之最後一個區塊之後,所述第一熵解碼器初始化所述第一列區塊之位元串之內部狀態資訊。
- 一種非暫時性電腦可讀記錄媒體,其用於執行如申請專利範圍第1項至第6項中任一項所述之方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261588691P | 2012-01-20 | 2012-01-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201347547A true TW201347547A (zh) | 2013-11-16 |
TWI573436B TWI573436B (zh) | 2017-03-01 |
Family
ID=48799478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102102238A TWI573436B (zh) | 2012-01-20 | 2013-01-21 | 用於並行熵編碼的方法及裝置以及用於並行熵解碼的方法及裝置以及非暫時性電腦可讀記錄媒體 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20140355690A1 (zh) |
KR (1) | KR20130086004A (zh) |
TW (1) | TWI573436B (zh) |
WO (1) | WO2013109115A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2977111A1 (fr) * | 2011-06-24 | 2012-12-28 | France Telecom | Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants |
US11178407B2 (en) * | 2012-11-19 | 2021-11-16 | Texas Instruments Incorporated | Adaptive coding unit (CU) partitioning based on image statistics |
US10904551B2 (en) | 2013-04-05 | 2021-01-26 | Texas Instruments Incorporated | Video coding using intra block copy |
US10264261B2 (en) * | 2013-08-27 | 2019-04-16 | Integrated Device Technology, Inc. | Entropy encoding initialization for a block dependent upon an unencoded block |
US10212441B2 (en) | 2014-02-12 | 2019-02-19 | Chips & Media, Inc. | Method and apparatus for processing video |
WO2015122550A1 (ko) * | 2014-02-12 | 2015-08-20 | 주식회사 칩스앤미디어 | 동영상 처리 방법 및 장치 |
US10057599B2 (en) * | 2014-02-19 | 2018-08-21 | Mediatek Inc. | Method for performing image processing control with aid of predetermined tile packing, associated apparatus and associated non-transitory computer readable medium |
KR101983441B1 (ko) | 2014-05-28 | 2019-08-28 | 애리스 엔터프라이지즈 엘엘씨 | 비디오 코덱들에서의 콘텍스트 적응형 이진 산술 코딩(cabac)의 가속화 |
US10715833B2 (en) * | 2014-05-28 | 2020-07-14 | Apple Inc. | Adaptive syntax grouping and compression in video data using a default value and an exception value |
KR101676788B1 (ko) | 2014-10-17 | 2016-11-16 | 삼성전자주식회사 | 멀티코어 시스템 기반 비디오 병렬 복호화 방법 및 그 장치 |
WO2016076677A1 (ko) * | 2014-11-14 | 2016-05-19 | 엘지전자(주) | 대용량 병렬 처리를 위해 비디오 신호를 엔트로피 인코딩 또는 엔트로피 디코딩하는 방법 및 장치 |
KR20170007069A (ko) * | 2015-07-08 | 2017-01-18 | 주식회사 케이티 | 파노라믹 비디오의 왜곡보정 방법 및 장치 |
WO2019009450A1 (ko) * | 2017-07-06 | 2019-01-10 | 엘지전자(주) | 비디오 신호를 엔트로피 인코딩, 디코딩하는 방법 및 장치 |
US11197009B2 (en) * | 2019-05-30 | 2021-12-07 | Hulu, LLC | Processing sub-partitions in parallel using reference pixels |
CN113949868B (zh) * | 2020-07-17 | 2023-07-07 | 武汉Tcl集团工业研究院有限公司 | 一种熵编码方法及装置 |
KR20220090887A (ko) | 2020-12-23 | 2022-06-30 | 삼성전자주식회사 | 이미지 처리 장치 및 이미지 처리 장치의 동작 방법 |
CN114765684B (zh) * | 2021-01-12 | 2023-05-09 | 四川大学 | 一种基于gpu的jpeg并行熵编码方法 |
US20230119972A1 (en) * | 2021-10-01 | 2023-04-20 | Mediatek Inc. | Methods and Apparatuses of High Throughput Video Encoder |
CN115002471B (zh) * | 2022-05-27 | 2024-08-09 | 武汉理工大学 | 基于鲁棒自适应dac码的分布式视频编码及解码方法和系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003043346A1 (en) * | 2001-11-16 | 2003-05-22 | Ntt Docomo, Inc. | Image encoding method, image decoding method, image encoder, image decode, program, computer data signal, and image transmission system |
KR101712351B1 (ko) * | 2009-06-26 | 2017-03-06 | 에스케이 텔레콤주식회사 | 다차원 정수 변환을 이용한 영상 부호화/복호화 장치 및 방법 |
KR20110043407A (ko) * | 2009-10-21 | 2011-04-27 | 에스케이 텔레콤주식회사 | 영상 부호화/복호화 장치 및 방법 |
WO2011052142A1 (ja) * | 2009-10-29 | 2011-05-05 | パナソニック株式会社 | 画像符号化方法および画像復号方法 |
ES2823549T3 (es) * | 2010-04-13 | 2021-05-07 | Ge Video Compression Llc | Codificación de mapas de significado y bloques de coeficiente de transformada |
KR101791078B1 (ko) * | 2010-04-16 | 2017-10-30 | 에스케이텔레콤 주식회사 | 영상 부호화/복호화 장치 및 방법 |
-
2013
- 2013-01-21 WO PCT/KR2013/000474 patent/WO2013109115A1/ko active Application Filing
- 2013-01-21 KR KR1020130006494A patent/KR20130086004A/ko not_active Application Discontinuation
- 2013-01-21 TW TW102102238A patent/TWI573436B/zh not_active IP Right Cessation
- 2013-01-21 US US14/373,496 patent/US20140355690A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
KR20130086004A (ko) | 2013-07-30 |
TWI573436B (zh) | 2017-03-01 |
US20140355690A1 (en) | 2014-12-04 |
WO2013109115A1 (ko) | 2013-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI573436B (zh) | 用於並行熵編碼的方法及裝置以及用於並行熵解碼的方法及裝置以及非暫時性電腦可讀記錄媒體 | |
RU2701080C1 (ru) | Способ кодирования видео и устройство кодирования видео и способ декодирования видео и устройство декодирования видео для сигнализации параметров sao | |
TWI519135B (zh) | 視訊解碼裝置 | |
CN108307196B (zh) | 视频编码方法和视频编码设备 | |
TWI575944B (zh) | 視訊解碼裝置 | |
RU2628319C2 (ru) | Способ и устройство для определения опорных изображений для внешнего предсказания | |
TWI552579B (zh) | 視訊編碼方法與裝置以及非暫時性電腦可讀記錄媒體 | |
JP6100777B2 (ja) | 多視点ビデオ予測符号化方法及びその装置、多視点ビデオ予測復号化方法及びその装置 | |
TW201325247A (zh) | 在視訊解碼的反量化及逆轉換期間實現資料修剪的逆轉換方法及設備 | |
TW201701670A (zh) | 視訊解碼裝置 | |
TWI605702B (zh) | 視訊解碼裝置 | |
CN107079159B (zh) | 基于多核系统的并行视频解码的方法和设备 | |
US20150010074A1 (en) | Method and apparatus for encoding multi-view video prediction capable of view switching, and method and apparatus for decoding multi-view video prediction capable of view switching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |