DE10022520A1 - Verfahren zur örtlichen skalierbaren Bewegtbildcodierung - Google Patents
Verfahren zur örtlichen skalierbaren BewegtbildcodierungInfo
- Publication number
- DE10022520A1 DE10022520A1 DE10022520A DE10022520A DE10022520A1 DE 10022520 A1 DE10022520 A1 DE 10022520A1 DE 10022520 A DE10022520 A DE 10022520A DE 10022520 A DE10022520 A DE 10022520A DE 10022520 A1 DE10022520 A1 DE 10022520A1
- Authority
- DE
- Germany
- Prior art keywords
- image signal
- resolution
- coding
- motion
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/53—Multi-resolution motion estimation; Hierarchical motion estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Zur örtlichen skalierbaren Bewegtbildcodierung wird die Bewegungsschätzung (ME) für eine Stufe (EL) erhöhter Auflösung anhand interpolierter Versionen eines aktuellen und eines Referenzbildsignals durchgeführt, welches aus einem zeitlich zuvor ermittelten Bildsignal ermittelt wurde. DOLLAR A Bei dem Verfahren nach der Erfindung ist es nicht notwendig, für die Stufe (EL) erhöhter Auflösung Displacement-Vektoren zu übertragen. Nahezu die gesamte Datenrate kann für die Codierung des Prädiktionsfehlers verwendet werden.
Description
Die Erfindung geht aus von einem Verfahren zur örtlich
skalierbaren Bewegtbildcodierung in mindestens zwei Stufen
unterschiedlicher örtlicher Auflösung.
Skalierbare Bildcodierverfahren ermöglichen die Decodierung
eines codierten Signals in verschiedenen Auflösungen.
Üblicherweise verdoppelt sich die Auflösung zwischen den
Skalierungsstufen. Zur Decodierung einer höheren Auflösung
sind alle niedrigeren Auflösungen notwendig (hierarchische
Struktur). Die Stufen werden in separaten Bitströmen
codiert.
Die bisher standardisierten örtlich skalierbaren Verfahren
[1, 2] basieren auf dem hybriden Codierkonzept. Sie haben
eine Pyramiden-Struktur, in der das Base-Layer, d. h. eine
Stufe mit niedriger örtlicher Auflösung, und das
Enhancement-Layer, d. h. eine Stufe mit erhöhter örtlicher
Auflösung, codiert werden. Zur Codierung des Enhancement-
Layers verwenden sie die Enhanced Intra-Prädiktion, bei der
keine Informationen aus vorhergehenden Frames, wohl aber aus
dem aktuellen Base-Layer, verwendet werden, und die
Enhanced-Inter-Prädiktion, bei der für das Enhancement-Layer
Bewegungsvektoren und der Prädiktionsfehler übertragen
werden. Hierbei muß die für das Enhancement-Layer zur
Verfügung stehende Rate zwischen den Bewegungsvektoren
(Displacement-Vektoren) und dem Prädiktionsfehler aufgeteilt
werden.
In [3] wird ein örtlich skalierbares Verfahren vorgestellt,
das ohne die Übertragung von Bewegungsvektoren auskommt.
Hier wird die Schätzung zwischen zwei vorangegangenen Frames
durchgeführt und die Bewegungsvektoren dann für den
aktuellen Frame extrapoliert. Für dieses Verfahren wird der
Begriff Rückwärts-Bewegungskompensation verwendet.
In [4] und [5] werden hierarchische Codierverfahren
vorgestellt, die auf der diskreten Wavelettransformation
(DWT) aufsetzten. Hierbei wird eine hierarchische
Bewegungsschätzung auf den bisher codierten Zerlegungsstufen
der DWT des aktuellen und des Referenz-Frames durchgeführt.
Da diese dem Sender wie dem Empfänger bekannt sind, können
diese Verfahren auf eine Übertragung von Bewegungsvektoren
verzichten.
Eine einstufige DWT zerlegt einen Frame in Zeilen- und in
Spaltenrichtung jeweils in eine Tiefpaß- (L) und eine
Hochpaß-Komponente (H). Es resultieren vier Teilbänder LL,
HL, LH und HH, die jeweils die halbe Zeilen- und Spaltenzahl
haben; die Gesamtzahl der Koeffizienten enspricht also der
Anzahl der Pixel im Frame. Bei einer mehrstufigen DWT wird
diese Zerlegung jeweils auf das LL-Band der aktuellen
Zerlegungsstufe angewendet. Im folgenden wird das LL-Band
Tiefpaß-Band und die anderen Bänder HL, LH und HH, Hochpaß-
Bänder genannt.
In der in [4] vorgeschlagenen Variante werden die auf den
Tiefpaßbändern der groben Zerlegungsstufe des aktuellen und
des Referenzframes geschätzten Displacement-Vektoren auf die
Hochpaßbänder derselben Zerlegungsstufe angewendet. Bei [5]
werden beide Tiefpaß-Bänder der groben Zerlegungsstufe des
aktuellen und des Referenzframes überabgetastet und
hochinterpoliert. Das geschätzte Displacement-Vektorfeld
wird dann auf das Tiefpaß-Band der feineren Zerlegungsstufe
angewendet. Die einstufige Zerlegung dieser
bewegungskompensierten Prädiktion (BKP) wird dann als
Prädiktion für die Hochpaß-Komponenten des aktuellen Frames
verwendet. In beiden Verfahren werden also Prädiktionen für
die Hochpaß-Bänder der groberen Stufe erstellt.
Das Verfahren der Erfindung nach Anspruch 1 und den
Weiterbildungen gemäß den Unteransprüchen verbessert die
Codiereffizienz von hybriden Bewegtbildcodierverfahren mit
örtlicher Skalierbarkeit. Dieses Verfahren hat den Vorteil,
daß auf die Übertragung von Displacement-Vektoren für die
Stufe mit erhöhter örtlicher Auflösung verzichtet werden
kann. Die in der Stufe erhöhter örtlicher Auflösung EL
(Enhancement-Layer) zur bewegungskompensierten Prädiktion
benötigten Displacement-Vektoren brauchen nicht als
Seiteninformation zum Empfänger übertragen werden, sondern
werden beim Sender (Encoder) und beim Empfänger (Decoder)
aus bereits bekannten Informationen ermittelt.
Durch Anwendung der Rückwärts-Bewegungskompensation bei der
Codierung des Enhancement-Layers wird eine Aufteilung der
Rate zwischen den Displacement-Vektoren und dem
Prädiktionsfehler vermieden. Die Begungsschätzung wird auf
interpolierten Versionen des aktuellen und des Referenz-
Frame durchgeführt. Da diese sowohl beim Sender als auch
beim Empfänger bekannt sind, ist eine Übertragung der
geschätzten Displacement-Vektoren als Seiteninformation
nicht notwendig, so daß nahezu die gesamte Datenrate für die
Codierung des Prädiktionsfehlers verwendet werden kann.
Die bisher standardisierten örtlich skalierbaren Verfahren
können zeitliche Korrespondenzen nur durch Übertragung von
Displacement-Vektoren ausnutzen. Gegenüber Verfahren, die
die Displacement-Vektoren aus vorhergehenden Frames
extrapolieren, hat das erfindungsgemäße Verfahren den
Vorteil der besseren Übereinstimmung mit der im aktuellen
Frame vorhandenen Bewegung. Gleichzeitig kann das Verfahren
gut in vorhandene und zukünftige Standardcodierer eingebaut
werden, da gegenüber Verfahren auf Basis der DWT keine
wesentliche Änderung der Coderstruktur vorgenommen werden
muß.
Im Gegensatz zu den eingangs vorgestellten DWT-basierten
Konzepten wird im erfindungsgemäßen Verfahren das
Enhancement-Layer zur Prädiktion der Displacement-Vektoren
herangezogen. Dieses kann zur Schätzung optional
tiefpaßgefiltert werden. Das Verfahren eignet sich zur
blockbasierten Anwendung, insbesondere kann es hierbei
parallel zu den zuvor beschriebenen Enhanced-Intra- und
Enhanced-Inter-Prädiktionsverfahren eingesetzt werden. Bei
Verfahren, die zur bewegungskompensierten Prädiktion eine
Unterteilung der Blöcke in Unterblöcke zulassen, kann
optional die optimale Block-Aufteilung vom Encoder als
Seiteninformation übermittelt werden.
Die DWT-basierten Verfahren eignen sich nicht zur Anwendung
in blockbasierten Codierkonzepten, da Blockstrukturen im
Prädiktionsbild bei der DWT zu teuer zu codierenden
Hochpaßinformationen führen.
Anhand der Zeichnungen werden Ausführungsbeispiele der
Erfindung näher erläutert. Es zeigen
Fig. 1 ein Blockschaltbild mit Codierung des Base-Layers
und den Möglichkeiten zur Codierung des Enhancement-Layers,
Fig. 2 die Suche des Displacement-Vektors zur
Bewegungsschätzung im Enhancement-Layer,
Fig. 3 mögliche Teilungen eines Macroblockes,
Fig. 4 die Teilung von vier Macroblöcken des Enhancement-
Layers.
Im Folgenden wird eine Skalierung in zwei Stufen
beschrieben; das erfindungsgemäße Verfahren kann auch
entsprechend auf mehrere Skalierungsstufen angewendet
werden. Die Stufe mit erhöhter örtlicher Auflösung wird mit
Enhancement-Layer (EL) bezeichnet, die Stufe mit geringerer
Auflösung heißt Base-Layer (BL).
Im erfindungsgemäßen Verfahren wird der bereits übertragene
aktuelle BL-Frame durch Erhöhung der Abtastrate und
Interpolationsfilterung auf die Größe und Auflösung der EL-
Frames gebracht. Als Referenz wird der vorangegangene
Bildframe des EL verwendet, welcher bei Encoder und Decoder
bereits vorliegt. Optional kann der Referenz-Frame
tiefpaßgefiltert werden, so daß er keine höheren
Frequenzanteile enthält als der entsprechend
hochinterpolierte BL-Frame. Zwischen dem hochinterpolierten
BL-Frame und dem Referenz-Frame wird eine Bewegungsschätzung
durchgeführt. Da die verwendeten Frames dem Sender (Encoder)
als auch dem Empfänger (Decoder) bekannt sind, kann die
Bewegungsschätzung sowohl beim Encoder als auch beim Decoder
durchgeführt werden, so daß eine Übertragung der geschätzten
Displacement-Vektoren nicht notwendig ist. Die Displacement-
Vektoren werden zur bewegungskompensierten Prädiktion BKP
des aktuellen, zu codierenden EL-Frames verwendet. Als
Referenz bei der bewegungskompensierten Prädiktion BKP wird
wiederum der vorangegangene EL-Frame verwendet, welcher
ebenfalls optional vorher tiefpaßgefiltert werden kann. Bei
solchen Codierverfahren, die bei der bewegungskompensierten
Prädiktion BKP die Unterteilung eines Blockes in Unterblöcke
verschiedener Größen zulassen, kann optional die optimale
Aufteilung der EL-Blöcke in Unterblöcke beim Encoder
ermittelt und als Seiteninformation zum Empfänger übertragen
werden.
Das Verfahren der Erfindung kann optional entweder für alle
Blöcke des zu codierenden EL-Frames verwendet, oder
alternativ zu den bereits im Codierverfahren vorgesehenen
BKP-Modi verwendet werden.
Das erfindungsgemäße Verfahren wird im folgenden am
Ausführungsbeispiel der Luminanzkomponente einer Bildsequenz
erläutert. Die Codierung soll blockorientiert auf Basis von
sogenannten Makroblöcken (MB) mit 16 × 16 Pixeln erfolgen.
Das Verfahren nach der Erfindung soll mit EBP (enhanced
backward prediction) bezeichnet werden. Die bisher
verwendete Inter-Prädiktion wird mit EFP (enhanced forward
prediction), die Intra-Prädiktion mit EIP bezeichnet. Das
Enhancement-Layer soll in horizontaler und vertikaler
Richtung um den Faktor 2 größer sein als das Base-Layer.
Dieses Größenverhältnis wird üblicherweise verwendet; andere
Größenverhältnisse können ebenso realisiert werden.
Mit Fn wird der n-te-Frame einer Bildsequenz bezeichnet. Für
das Bewegungsvektorfeld wird das Symbol Vn verwendet, der
quantisierte Prädiktionsfehler ist Dn. Mit n wird eine
Prädiktion für Fn bezeichnet, während die Rekonstruktion mit
n dargestellt wird. Die Indices B und E kennzeichnen
jeweils das Base-Layer und das Enhancement-Layer des
entsprechenden Frames. Ein Macroblock wird mit MB, ein
Unterblock des Macroblocks mit B bezeichnet.
Die hochinterpolierte Version des Frames wird mit F'n und die
skalierte Version des Bewegungsvektorfeldes mit V'n
bezeichnet. n ist eine tiefpaßgefilterte Version von Fn.
In der Beschreibung wird der Referenzframe mit Fn-1
gekennzeichnet, was auf den zeitlich vorhergehenden Frame
hindeutet. Es kann ebenso ein Frame in anderem zeitlichen
Abstand oder eine Auswahl von vorhergehenden Frames als
Referenz zur Prädiktion herangezogen werden.
Mit C D|n C V|n und C MB|n werden die codierten Prädiktionsfehler,
die Bewegungsvektoren und die Information zur Aufteilung
eines Macroblocks MB bezeichnet. Die Kosten KME, die bei der
Bewegungsschätzung entstehen, setzen sich aus der Summe der
absoluten Differenzen SAD zwischen aktuellem und
verschobenem Referenzblock und optional den Kosten für die
Codierung, z. B. Vektoren, Block-Aufteilung zusammen.
In Fig. 1 ist ein vereinfachtes Blockschaltbild mit Base-
Layer und Enhancement-Layer-Codierung dargestellt. Die
Codierung des Base-Layers entspricht dem bekannten hybriden
Codierkonzept, wie es prinzipiell in den etablierten
Standards verwendet wird; sie wird hier kurz erläutert, um
die verwendeten Bezeichnungen einzuführen. Für den aktuellen
Base-Layer-Frame FBn wird durch Bewegungsschätzung ME und
Bewegungskompensation MC aus dem Referenz-Frame Bn-1 eine
Vorwärtsprädiktion Bn erstellt. Das resultierende
Bewegungsvektorfeld VBn wird entropie-codiert EC und an den
Empfänger übertragen. Der Suchbereich bei Kompensation mit
16 × 16 Blöcken kann z. B. auf 16 Pixel in jede Richtung
festgelegt werden.
Der Prädiktionsfehler zwischen FBn und Bn wird
transformiert (TR, z. B. mit der diskreten Cosinus-
Transformation DCT) und quantisiert. Dieses quantisierte
Differenzsignal DBn wird zum einen codiert und zum Empfänger
übertragen, zum anderen mittels TR-1 rücktransformiert und
zur Prädiktion Bn addiert, so daß sich der am Empfänger
rekonstruierte Frame Bn ergibt. Dieser wird in einem
Buffer T zwischengespeichert, um als Referenz Bn-1 für den
nächsten Frame zu dienen. Mit Q ist der Quantisierer
bezeichnet.
Das Verfahren wird macroblockweise angewendet. Falls für die
Macroblöcke verschiedene Modi, z. B. Intra oder Inter, oder
Aufteilungen vorgesehen sind, müssen diese zusätzlich als
Seiteninformation C MB|n übertragen werden. Die mögliche
Entropie-Codierung für C MB|n wurde ebenso wie die Wahl
zwischen Intra- und Intercodierung aus Gründen der
Übersichtlichkeit nicht im Blockschaltbild dargestellt.
Zunächst stehen in Fig. 1 die Schalter wie folgt:
S1 = offen, S2 = b, S3 = a, S4 = a. Da Schalter S5 und S3 gekoppelt sind, werden hier keine Displacement-Vektoren übertragen. Die Schalterstellungen seien fest. Die Schätzung von VEn erfolgt zwischen den durch Überabtastung und Filterung mit dem Interpolationsfilter G (z) hochinterpolierten Base-Layer-Frame 'Bn und dem Enhancement-Layer-Referenz-Frame En-1.
S1 = offen, S2 = b, S3 = a, S4 = a. Da Schalter S5 und S3 gekoppelt sind, werden hier keine Displacement-Vektoren übertragen. Die Schalterstellungen seien fest. Die Schätzung von VEn erfolgt zwischen den durch Überabtastung und Filterung mit dem Interpolationsfilter G (z) hochinterpolierten Base-Layer-Frame 'Bn und dem Enhancement-Layer-Referenz-Frame En-1.
Die Bewegungsschätzung ME schätzt die Bewegung für den
aktuellen Block. Dies kann in Form eines dichten
Displacement-Vektorfeldes oder blockbasiert durchgeführt
werden. Ein Displacement-Vektorfeld heißt dicht, wenn für
jedes Pixel des kompensierten Bereiches ein eigener Vektor
existiert. Bei blockbasierten Verfahren wird einem Block,
z. B. 8 × 8 Pixel, ein gemeinsamer Vektor zugewiesen. Es
werden keine Vektoren und im blockbasierten Fall keine
Informationen über die Blockteilung übertragen.
Hierzu wird der Schalter S2 in Stellung a gebracht. Die
Schalterstellungen seien fest wie im Basisverfahren. Die
Schätzung von VEn erfolgt nun zwischen dem
hochinterpolierten Base-Layer-Frame 'Bn und dem mit L(z)
tiefpaßgefilteren Enhancement-Layer-Frame *|En-1.
Die Filterung dient dazu, den Frequenzgang des Referenz-
Frames dem des hochinterpolierten Base-Layer-Frames
anzupassen.
Hierzu wird Schalter S1 geschlossen. Dadurch liegt V'Bn am
Bewegungsschätzungsblock ME des Enhanced-Layer EL an und
dient zur Initialisierung der Vektorschätzung. Das
Prädiktions-Vektorfeld V'Bn entsteht durch Skalierung von
VBn um den Faktor 2 und ist damit der Größe des Enhancement-
Layers angepaßt. Die Suche wird in einem verkleinerten
Suchbereich um den skalierten Base-Layer-Vektor herum
durchgeführt, z. B. zwei Pixel, um den Suchaufwand zu
minimieren. Dies ist in Fig. 2 dargestellt. Um den
skalierten Bewegungsvektor V'Bn (i,j) wird die Suche auf
dem interpolierten Frame 'Bn mit verkleinertem Suchbereich
RE durchgeführt.
Um den Suchaufwand zur Bewegungsschätzung auf der Decoder-
Seite zu minimieren, kann bei blockbasierten Verfahren, die
Unterteilungen der Macroblöcke MB zulassen, C MB|En als
Seiteninformation übertragen werden. Die Suche nach den
Vektoren muß dann nur noch für die bereits übertragene
Block-Aufteilung durchgeführt werden.
In dieser Betriebsart wird das erfindungsgemäße Verfahren
parallel zu den bekannten Prädiktions-Modi verwendet. Dazu
werden die Codierungs-Kosten für EIP (S1 = offen, S2 = b,
S3 = a, S4 = b), EFP (S1 = offen, S2 = b, S3 = b, S4 = a)
und EBP (Schalterstellungen wie zuvor beschrieben)
verglichen und für jeden Macroblock MB das günstigste
Verfahren gewählt.
Die möglichen Unterteilungen des Macroblocks sind an die im
Testmodell TML-3 zum Videocodierstandard H.26L
vorgeschlagenen Unterteilungen angelehnt [6]. Der Macroblock
kann auf die in Fig. 3 dargestellten Weisen in Unterblöcke
zerlegt werden, so daß sich Unterblöcke der Größen 16 × 16,
16 × 8, 8 × 16, 8 × 8, 8 × 4, 4 × 8 und 4 × 4 Pixeln
ergeben. Im Enhancement-Layer korrespondieren vier
Macroblöcke mit einem hochinterpolierten Base-Layer-
Macroblock. Die im Base-Layer verwendete Teilung der
Macroblöcke wird durch die Interpolation in 'Bn um den
Faktor 2 vergrößert. Die Größe der Unterblöcke der
Enhancement-Layer-Macroblöcke darf diese Base-Layer-Teilung
nicht überschreiten, da sonst Blockartefakte innerhalb der
Enhancement-Layer-Blöcke auftreten können.
In Fig. 4, die die Teilung von vier Makroblöcken MBEn (i,j)
mit i,j = {0,1} des Enhancement-Layer in Abhängigkeit von
der Teilung des korrespondierenden interpolierten Base-
Layer-Macroblocks MB'Bn schematisch zeigt, sind vier
mögliche Teilungen für Enhancement-Layer-Macroblöcke
dargestellt, wenn im korrespondierenden Base-Layer-
Macroblock die Teilung 6 aus Fig. 3 gewählt wurde.
Die Teilung für die Enhancement-Layer-Macroblöcke soll so
gewählt werden, daß der zu codierende Prädiktionsfehler
möglichst klein wird. Dazu werden die ermittelten
Bewegungsvektoren auf das nicht gefilterte Enhancement-
Layer-Signal En-1 angewendet, und die günstigste
Blockteilung als Vorwärts-Information an den Empfänger
übertragen.
Das Verfahren nach der Erfindung eignet sich zur Anwendung
in der örtlich skalierbaren Bildsequenzcodierung mit H.26L.
Für Macroblöcke, die mit EBP codiert wurden, muß dieses im
Macroblock-Header signalisiert werden, außerdem werden keine
Bewegungsvektoren codiert.
[1] ISO/IEC JTC1 IS 14496-2 (MPEG-4). "Information
technology - generic coding of audio-visual objects (final
draft of international standard)", Oct. 1998.
[2] Telecom. Standardization Sector of ITU, "Video coding for low bitrate communication (H.263 Version 2)", Sept. 1997.
[3] T. Naveen and J. W. Woods, "Motion compensated multiresolution transmission of high definition video", IEEE Trans. on Circuits and Systems for Video Technology, vol 4, pp 29-41, Feb. 1994.
[4] A. Nosratinia and M. T. Orchard; "Multiresolution backward video coding", in Proc. IEEE Int. Conf. Image Processing ICIP '95, vol. 2, pp. 563-566, Oct. 1995.
[5] X. Yang and K. Ramchandran, "Hierarchical backward motion compensation for wavelet video coding optimized interpolation filters", in Proc. IEEE Int. Conf. Image Processing ICIP '97, vol. 1, pp. 85-88, Oct. 1997.
[6] Telecom. Standardization Sector of ITU, "H.26L test model long term 3", in Study Group 16, Question 15, Meeting J. (Osaka, Japan), ITU, Mar. 2000.
[2] Telecom. Standardization Sector of ITU, "Video coding for low bitrate communication (H.263 Version 2)", Sept. 1997.
[3] T. Naveen and J. W. Woods, "Motion compensated multiresolution transmission of high definition video", IEEE Trans. on Circuits and Systems for Video Technology, vol 4, pp 29-41, Feb. 1994.
[4] A. Nosratinia and M. T. Orchard; "Multiresolution backward video coding", in Proc. IEEE Int. Conf. Image Processing ICIP '95, vol. 2, pp. 563-566, Oct. 1995.
[5] X. Yang and K. Ramchandran, "Hierarchical backward motion compensation for wavelet video coding optimized interpolation filters", in Proc. IEEE Int. Conf. Image Processing ICIP '97, vol. 1, pp. 85-88, Oct. 1997.
[6] Telecom. Standardization Sector of ITU, "H.26L test model long term 3", in Study Group 16, Question 15, Meeting J. (Osaka, Japan), ITU, Mar. 2000.
Claims (10)
1. Verfahren zur örtlichen skalierbaren Bewegtbildcodierung
in mindestens zwei Stufen (EL, BL) unterschiedlicher
örtlicher Auflösung mit folgender Maßnahme:
die Bewegungsschätzung (ME) wird für eine Stufe (EL) erhöhter örtlicher Auflösung anhand interpolierter Versionen eines aktuellen Bildsignals und eines Referenzbildsignals durchgeführt, wobei als Referenzbildsignal ein zeitlich zuvor ermitteltes oder übertragenes Bildsignal verwendet wird.
die Bewegungsschätzung (ME) wird für eine Stufe (EL) erhöhter örtlicher Auflösung anhand interpolierter Versionen eines aktuellen Bildsignals und eines Referenzbildsignals durchgeführt, wobei als Referenzbildsignal ein zeitlich zuvor ermitteltes oder übertragenes Bildsignal verwendet wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
die Displacement-Vektoren für die Stufe erhöhter örtlicher
Auslösung encoder- und decoderseitig aus bereits bekannten
Informationen ermittelt werden und somit nicht als
Seiteninformation zum Decoder übertragen werden müssen.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß
der durch Nichtübertragung der Seiteninformation eingesparte
Codieraufwand im wesentlichen zur Codierung des
Prädiktionsfehlers verwendet wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch
gekennzeichnet, daß ein bereits übertragenes aktuelles
Bildsignal der Stufe (BL) niedriger örtlicher Auflösung
durch Erhöhung der Abtastrate und Interpolationsfilterung
auf die Größe und Auflösung der Stufe (EL) erhöhter
Auflösung gebracht wird und mit dem Referenzbildsignal der
Stufe (EL) erhöhter Auflösung zur Bewegungsschätzung
verglichen wird.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch
gekennzeichnet, daß das Referenzbildsignal tiefpaßgefiltert
wird.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch
gekennzeichnet, daß die Displacement-Vektoren zur
bewegungskompensierten Prädiktion (BKP) des aktuellen zu
codierenden Bildsignals erhöhter Auflösung verwendet werden.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß
als Referenz zur bewegungskompensierten Prädiktion ein
zeitlich zuvor ermitteltes oder übertragenes Bildsignal
verwendet wird.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch
gekennzeichnet, daß die Bewegungsschätzung (ME) blockbasiert
vorgenommen wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch
gekennzeichnet, daß eine parallele Anwendung mit Enhanced-
Intra und/oder Enhanced-Inter-Prädiktionsverfahren
vorgenommen wird.
10. Verfahren nach Anspruch 8 oder 9, dadurch
gekennzeichnet, daß bei einer Unterteilung von Blöcken in
Unterblöcke die optimale Blockaufteilung als
Seiteninformation zum Empfänger übermittelt wird.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10022520A DE10022520A1 (de) | 2000-05-10 | 2000-05-10 | Verfahren zur örtlichen skalierbaren Bewegtbildcodierung |
GB0111024A GB2363274B (en) | 2000-05-10 | 2001-05-04 | Spatial scalable moving-picture encoding method |
JP2001140361A JP2001320715A (ja) | 2000-05-10 | 2001-05-10 | 動画の局所的階層符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10022520A DE10022520A1 (de) | 2000-05-10 | 2000-05-10 | Verfahren zur örtlichen skalierbaren Bewegtbildcodierung |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10022520A1 true DE10022520A1 (de) | 2001-11-15 |
Family
ID=7641280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10022520A Withdrawn DE10022520A1 (de) | 2000-05-10 | 2000-05-10 | Verfahren zur örtlichen skalierbaren Bewegtbildcodierung |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2001320715A (de) |
DE (1) | DE10022520A1 (de) |
GB (1) | GB2363274B (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8290058B2 (en) | 2004-08-27 | 2012-10-16 | Siemens Aktiengesellschaft | Method and device for coding and decoding |
EP1679900A3 (de) * | 2005-01-07 | 2016-04-27 | NTT DoCoMo, Inc. | Gerät und Verfahren für Dekodierung und Kodierung mit mehrfachen Auflösungen |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100420308C (zh) | 2002-04-26 | 2008-09-17 | 株式会社Ntt都科摩 | 图象编码装置和图象译码装置 |
KR20060103430A (ko) | 2003-10-28 | 2006-09-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 작고 고속으로 움직이는 오브젝트들을 추적하기 위한움직임 벡터 필드들 정제 방법 |
KR20070039552A (ko) * | 2004-06-23 | 2007-04-12 | 에이전시 포 사이언스, 테크놀로지 앤드 리서치 | 그리드 움직임 추정 및 보상을 갖는 스캘러블 비디오 코딩 |
JP4835855B2 (ja) | 2004-10-07 | 2011-12-14 | 日本電気株式会社 | 動画像符号化の装置、方法及びプログラムと、動画像復号の装置方法及びプログラム |
WO2006042611A1 (de) * | 2004-10-15 | 2006-04-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und verfahren zum erzeugen einer codierten videosequenz unter verwendung einer zwischen-schicht-bewegungsdaten-prädiktion |
DE102004059993B4 (de) | 2004-10-15 | 2006-08-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Bewegungsdaten-Prädiktion sowie Computerprogramm und computerlesbares Medium |
KR100656645B1 (ko) * | 2004-12-22 | 2006-12-11 | 엘지전자 주식회사 | 동영상 부호화 장치와 방법 |
JP2009522972A (ja) * | 2006-01-09 | 2009-06-11 | ノキア コーポレイション | スケーラブルなビデオ符号化におけるエラー耐性を有するモード決定 |
WO2014141964A1 (ja) * | 2013-03-14 | 2014-09-18 | ソニー株式会社 | 画像処理装置および方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2702917B1 (fr) * | 1993-03-16 | 1995-04-21 | Thomson Csf | Codeur-décodeur pour un codage compatible sous-bande d'images de télévision, et son application au codage de mouvement hiérarchique par des structures arborescentes . |
CA2126467A1 (en) * | 1993-07-13 | 1995-01-14 | Barin Geoffry Haskell | Scalable encoding and decoding of high-resolution progressive video |
JPH07212761A (ja) * | 1994-01-17 | 1995-08-11 | Toshiba Corp | 階層符号化装置及び階層復号化装置 |
-
2000
- 2000-05-10 DE DE10022520A patent/DE10022520A1/de not_active Withdrawn
-
2001
- 2001-05-04 GB GB0111024A patent/GB2363274B/en not_active Expired - Fee Related
- 2001-05-10 JP JP2001140361A patent/JP2001320715A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8290058B2 (en) | 2004-08-27 | 2012-10-16 | Siemens Aktiengesellschaft | Method and device for coding and decoding |
EP1679900A3 (de) * | 2005-01-07 | 2016-04-27 | NTT DoCoMo, Inc. | Gerät und Verfahren für Dekodierung und Kodierung mit mehrfachen Auflösungen |
Also Published As
Publication number | Publication date |
---|---|
GB0111024D0 (en) | 2001-06-27 |
GB2363274B (en) | 2002-07-17 |
JP2001320715A (ja) | 2001-11-16 |
GB2363274A (en) | 2001-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69422564T2 (de) | Verfahren zur halbpixel Bewegungskompensation in Bilddekodierung | |
DE69323586T2 (de) | Gerät zur Schichtkodierung/-dekodierung für ein progressives Eingangsbildsignal | |
DE102004059978B4 (de) | Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium | |
DE69535228T2 (de) | Bildumsetzungsvorrichtung | |
DE60027955T2 (de) | Verfahren und Vorrichtung zur kontextbasierten Inter/Intra Kodierungsmodeauswahl | |
DE69118654T2 (de) | Progressives Signalkodierungssystem für bewegte Bilder | |
EP0359094B1 (de) | Übertragungssystem für ein zeitlich und örtlich hochaufgelöstes Bildsignal | |
DE69232063T2 (de) | Adaptive Bewegungskompensation mit mehreren Bewegungskompensatoren | |
DE69432142T2 (de) | Verfahren und vorrichtung zur effizienten transkodierung | |
DE69836696T2 (de) | Verfahren und vorrichtung zur durchführung einer hierarchischen bewegungsschätzung unter verwendung einer nicht-linearen pyramide | |
DE69915843T2 (de) | Teilbandkodierung/-dekodierung | |
DE60315125T2 (de) | Auf Bewegungskompensation basierendes Verfahren und Vorrichtung zur Rauschabschätzung | |
DE10022520A1 (de) | Verfahren zur örtlichen skalierbaren Bewegtbildcodierung | |
DE69637008T2 (de) | Verfahren zur Videokompression mittels Teilbandzerlegung | |
EP1025704B1 (de) | Verfahren zur bewegungskompensierenden prädiktion von bewegtbildfolgen | |
DE102004041664A1 (de) | Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung | |
DE69320674T2 (de) | System und Einrichtung zur Kodierung und Dekodierung eines digitalen Signals | |
DE69430738T2 (de) | Kompatible teilbandkodierung/dekodierung von fernsehbildern | |
DE19951341B4 (de) | Verfahren zur bewegungskompensierenden Prädiktion von Bewegtbildern sowie Einrichtung hierzu | |
DE60210757T2 (de) | Vorrichtung zur videokodierung und -aufzeichnung | |
EP1285537B1 (de) | Verfahren und eine anordnung zur codierung bzw. decodierung einer folge von bildern | |
EP0346636A2 (de) | Verfahren zur Aufbereitung und Übertragung einer Bildsequenz | |
DE102004063902B4 (de) | Computerprogramm mit einem Verfahren zum Verarbeiten einer Gruppe von Bildern und mit einem Verfahren zum Verarbeiten eines Basisbildes und eines oder mehrerer Erweiterungsbilder | |
DE102004011421B4 (de) | Vorrichtung und Verfahren zum Erzeugen eines skalierten Datenstroms | |
DE102004011422B4 (de) | Vorrichtung und Verfahren zum Verarbeiten einer Gruppe von Bildern und Vorrichtung und Verfahren zum Verarbeiten eines Basisbildes und eines oder mehrerer Erweiterungsbilder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
R016 | Response to examination communication | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20121201 |