DE10328777A1 - Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals - Google Patents
Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals Download PDFInfo
- Publication number
- DE10328777A1 DE10328777A1 DE10328777A DE10328777A DE10328777A1 DE 10328777 A1 DE10328777 A1 DE 10328777A1 DE 10328777 A DE10328777 A DE 10328777A DE 10328777 A DE10328777 A DE 10328777A DE 10328777 A1 DE10328777 A1 DE 10328777A1
- Authority
- DE
- Germany
- Prior art keywords
- audio signal
- encoder
- signal
- resolution
- temporal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims description 24
- 230000002123 temporal effect Effects 0.000 claims abstract description 24
- 230000003595 spectral effect Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 description 21
- 230000001052 transient effect Effects 0.000 description 8
- 230000000873 masking effect Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Beim Codieren eines Audiosignals wird das Audiosignal zunächst mit einem ersten Codierer codiert, um ein erstes Codiererausgangssignal zu erhalten. Dieses erste Codiererausgangssignal wird in einen Bitstrom geschrieben. Es wird ferner von einem Decodierer decodiert, um ein decodiertes Audiosignal zu liefern. Das decodierte Audiosignal wird mit dem ursprünglichen Audiosignal verglichen, um ein Restsignal zu erhalten. Das Restsignal wird dann mittels eines zweiten Codierers codiert, um ein zweites Codiererausgangssignal zu liefern, das ebenfalls in einen Bitstrom geschrieben wird. Der erste Codierer hat eine erste zeitliche oder frequenzmäßige Auflösung. Der zweite Codierer hat eine zweite zeitliche oder frequenzmäßige Auflösung. Die erste Auflösung unterscheidet sich von der zweiten Auflösung, so daß in einem entsprechenden Decodierer ein Audiosignal mit sowohl einer hohen zeitlichen Auflösung als auch mit einer hohen frequenzmäßigen Auflösung wiedergewonnen werden kann.
Description
- Die vorliegende Erfindung bezieht sich auf Codierungstechniken und insbesondere auf Audiocodierungstechniken. Audiocodierer, und insbesondere solche Codierer, die unter dem Stichwort „mp3", „AAC" oder „mp3PRO" bekannt sind, haben sich in jüngster Zeit stark durchgesetzt. Sie erlauben die Komprimierung von Audiosignalen, die eine erhebliche Datenmenge benötigen, wenn sie beispielsweise im PCM-Format auf einer Audio-CD vorliegen, auf „erträgliche" Datenraten, die für die Übertragung der Audiosignale über Kanäle mit begrenzter Bandbreite geeignet sind. So sind zur Übertragung von Daten im PCM-Format Datenraten bis zu 1,4 Mbit/s erforderlich. „mp3"-codierte Audiodaten erreichen bereits bei Datenraten von 128 kbit/s eine Musikwiedergabe in Stereo bei hoher Qualität.
- Mit der Spectral Band Replication (SBR) ist ferner ein Verfahren bekannt, das die Effizienz bestehender gehörangepaßter Audiocoder deutlich verbessert. Die SBR-Technik ist in der WO 98/57436 beschrieben und in dem Format „mp3PRO" implementiert. Hier wird gute Stereoqualität bereits mit Datenraten von 64 kbit/s erreicht.
- Das europäische Patent
EP 0 846 375 B1 offenbart ein Verfahren und eine Vorrichtung zum skalierbaren Codieren von Audiosignalen. Ein Audiosignal wird mittels eines ersten Codierers codiert, um den Bitstrom für den ersten Codierer zu erhalten. Dieses Signal wird dann wieder decodiert, und zwar mit einem an den ersten Codierer angepaßten Decodierer. Das Decodiererausgangssignal wird zusammen mit dem verzögerten ursprünglichen Audiosignal einer Differenzstufe zugeführt, um ein Differenzsignal zu erzeugen. Dieses Differenzsignal wird mit dem ursprünglichen Audiosignal bandweise verglichen, um für spektrale Bänder festzustellen, ob die Energie des Differenzsignals größer als die Energie des Audiosignals ist. Ist dies der Fall, so wird das ursprüngliche Audiosignal einem zweiten Codierer zugeführt, während dann, wenn die Energie des Differenzsignals kleiner als die Energie des ursprünglichen Audiosignals ist, das Differenzsignal dem zweiten Codierer zugeführt wird. Der zweite Codierer ist ein Transformationscodierer, der auf der Basis eines psychoakustischen Modells arbeitet. Der ausgangsseitige Bitstrom des zweiten Codierers wird ebenso wie der Bitstrom des ersten Codierers in einen Bitstrommultiplexer eingespeist, der einen sogenannten skalieren ausgangsseitigen Bitstrom liefert. Skalierbarkeit bedeutet in diesem Zusammenhang, daß ein Decodierer je nach Ausführung in der Lage ist, entweder decodiererseitig aus dem Bitstrom nur den Bitstrom des ersten Codierers zu extrahieren, oder sowohl den Bitstrom des ersten Codierers als auch den Bitstrom des zweiten Codierers zu extrahieren, um im ersteren Fall eine niederqualitative Wiedergabe zu erreichen, und um im zweiten Fall eine hochqualitative Wiedergabe des ursprünglichen Audiosignals zu erreichen. - Ein typischerweise Transformations-basierter Codierer ist in
4a dargestellt. Das Audiosignal wird einer Analyse-Filterbank400 zugeführt, die aus dem Strom von Abtastwerten an ihrem Eingang mittels Blockbildung bzw. Fensterung einen Block mit einer bestimmten Anzahl von Abtastwerten des Audiosignals bildet und in eine spektrale Darstellung umsetzt. Die am Ausgang der Analyse-Filterbank erzeugten Spektralkoeffizienten bzw. Subband-Signale werden quantisiert. Die Quantisierer-Schrittweite wird von unterschiedlichen Faktoren abhängen. Ein wesentlicher Faktor ist eine psychoakustische Maskierungsschwelle, die durch ein psychoakustisches Modell402 aus dem ursprünglichen Audiosignal berechnet wird. Der Quantisierer in einem Block „Quantisie rung und Codierung404 " wird immer versuchen, so grob als möglich zu quantisieren, um eine gute Kompression zu erreichen. Andererseits wird er jedoch ebenfalls versuchen, so fein als nötig zu quantisieren, derart, daß das durch die Quantisierung eingeführte Quantisierungsrauschen unterhalb der durch den Block402 bereitgestellten psychoakustischen Maskierungsschwelle liegt, wie es in der Technik bekannt ist. Die derart quantisierten Spektralwerte werden dann einer Entropie-Codierung unterzogen, wobei als Entropie-Codierung typischerweise eine Huffman-Codierung eingesetzt wird, die typischerweise mit vordefinierten Huffman-Codebooks bzw. Huffman-Codetabellen arbeitet. Am Ausgang des Blocks404 liegen dann Entropie-codierte quantisierte Spektralwerte an, die zusammen mit für die Decodierung nötigen Seiteninformationen mittels eines Blocks406 in einen Bitstrom408 geschrieben werden, wobei dieser Bitstrom gespeichert oder je nach Anwendungsfall über einen Übertragungskanal zu einem Decodierer übertragen werden kann, der in4b dargestellt ist. Der Decodierer umfaßt zunächst einen Block410 zum Lesen des Bitstroms, um einerseits die Seiteninformationen und andererseits die Entropie-codierten quantisierten Spektralwerte aus dem Bitstrom zu extrahieren. Die Entropie-codierten quantisierten Spektralwerte werden dann zunächst einer Entropie-Decodierung und dann einer inversen Quantisierung zugeführt, um invers quantisierte Spektralwerte zu erhalten (Block412 ), die dann mittels einer an die Analyse-Filterbank400 von4a angepaßte Synthese-Filterbank414 geliefert werden, um ausgangsseitig ein zeitdiskretes decodiertes Audiosignal zu erhalten. Dieses zeitdiskrete Audiosignal am Ausgang der Synthese-Filterbank kann dann nach entsprechender Interpolation und Digital/Analog-Wandlung und gegebenenfalls Verstärkung einem Lautsprecher zugeführt und dadurch hörbar gemacht werden. - Block-basierte Codierer/Decodierer, wie sie bei dem in
4a und4b gezeigten bekannten Szenario zum Einsatz kommen, basieren darauf, daß typischerweise ein Block von Abtastwerten, wie beispielsweise 1024 bzw. bei einer in der Technik bekannten MDCT mit Overlap and Add 2048 zeitdiskrete Abtastwerte des Audiosignals in den Spektralbereich umgesetzt werden. Auch bei weniger frequenzauflösenden Filterbanken, wie beispielsweise der SBR-Filterbank mit 64 Kanälen, wird ebenfalls immer ein Block von Abtastwerten mit einer bestimmten Anzahl von Abtastwerten verwendet und in eine spektrale Darstellung, nämlich hier die einzelnen Subbandsignale, umgesetzt. Die spektrale Darstellung wird dann, wie es ausgeführt worden ist, entsprechend quantisiert, und zwar typischerweise unter Zuhilfenahme eines psychoakustischen Modells, das auf in der Technik bekannte Art und Weise die psychoakustische Maskierungsschwelle berechnet. - Solche Transformationen haben inhärent eine bestimmte Zeit/Frequenz-Auflösung. Dies bedeutet, daß dann, wenn eine große Anzahl von Abtastwerten in einen Block eingefügt wird, eine auf diesen Block angewandte Transformation inhärent eine hohe Frequenzauflösung hat. Andererseits ist jedoch die Zeitauflösung entsprechend reduziert. Würde man zum Erhöhen der Zeitauflösung kürzere Abschnitte des Audiosignals in den Spektralbereich umsetzen, so hätte dies zur Folge, daß die Frequenzauflösung entsprechend leidet.
- Problematisch ist also, daß man Audiosignale nur für sehr kurze Zeiträume als stationär ansehen kann. Es gibt durchaus kurzzeitige starke Energieanstiege, die Transienten genannt werden, während derer das Audiosignal nicht stationär ist.
- Um diesem Problem der Zeit/Frequenzauflösung zu begegnen, wird beispielsweise beim AAC-Codierer (AAC = Advanced Audio Coding) eine Blockumschaltung verwendet, die von einem Transientendetektor gesteuert wird. Hier wird das zu codierende Audiosignal vor der Fensterung bzw. Blockbildung untersucht, um festzustellen, ob das Audiosignal eine derartige Transiente hat oder nicht. Wird eine Transiente fest gestellt, so werden kurze Blöcke zum Codieren verwendet. Wird dagegen ein Signalausschnitt ohne Transiente detektiert, so wird eine lange Blocklänge verwendet. Damit wird bei solchen gängigen Transformations-Codierverfahren eine Blockumschaltung zur Anpassung der Transformationslänge an das Signal eingesetzt. Besonders wenn es darum geht, niedrige Bitraten zu erzielen, werden gerne besonders lange Transformationslängen eingesetzt, da das Verhältnis der Seiteninformationen zu den Nutzinformationen typischerweise relativ unabhängig von der Blocklänge ist. Dies bedeutet, daß die Menge an Seiteninformationen unabhängig davon, ob ein Block eine große Anzahl von zeitlichen Abtastwerten des Audiosignals darstellt, oder ob ein Block kurz ist, also eine kleine Anzahl von Abtastwerten darstellt, im wesentlichen die gleiche ist. Daher wird es aus Gründen der Codiereffizienz angestrebt, immer möglichst hohe Blocklängen bzw. bei einem Transformationscodierer hohe Transformationslängen zu verwenden.
- Andererseits muß für die Transientendetektion und Umschaltung auf kurze Fenster bei Auftreten von nicht-stationären Bereichen des Audiosignals ein Verarbeitungsaufwand in Kauf genommen werden, der dennoch dazu führt, daß das Signal in seiner codierten Form entweder nur mit guter Frequenzauflösung oder nur mit guter Zeitauflösung vorliegt.
- Die Aufgabe der vorliegenden Erfindung besteht darin, ein verbessertes Konzept zum Codieren bzw. Decodieren zu schaffen, um eine höherqualitativere und dennoch effiziente Audiocodierung/Decodierung zu erreichen.
- Diese Aufgabe wird durch eine Vorrichtung zum Codieren eines Audiosignals nach Patentanspruch 1, ein Verfahren zum Codieren eines Audiosignals nach Patentanspruch 10, eine Vorrichtung zum Decodieren eines codierten Audiosignals nach Patentanspruch 11, ein Verfahren zum Decodieren eines codierten Audiosignals nach Patentanspruch 13 oder ein Computer-Programm nach Patentanspruch 14 gelöst.
- Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß eine gute Codierqualität sowohl guter Frequenzauflösung als auch guter Zeitauflösung dadurch erreicht wird, daß im Sinne des Konzepts der Skalierbarkeit ein erster Codierer eine erste Zeit/Frequenzauflösung hat, und daß ein zweiter Codierer eine zweite Zeit/Frequenzauflösung hat, die sich voneinander unterscheiden, so daß der erste Codierer das ursprüngliche Audiosignal mit einer bestimmten Auflösung codiert, und daß der zweite Codierer dann mit einer bestimmten anderen Auflösung bezüglich der Zeit bzw. Frequenz arbeitet, so daß zwei Datenströme erhalten werden, die zusammengenommen betrachtet sowohl eine gute Zeitauflösung als auch eine gute Frequenzauflösung darstellen.
- Darüber hinaus wird als dem zweiten Codierer nicht das ursprüngliche Audiosignal zugeführt, sondern die Differenz zwischen dem ursprünglichen Audiosignal und dem codierten und wieder decodierten Ergebnis des ersten Codierers/Decodierers. Der Auflösungsfehler, den der erste Codierer gemacht hat, erscheint somit automatisch in dem Restsignal, das beispielsweise durch Differenzbildung erhalten wird, wobei dem Restsignal typischerweise Fehler anhaften werden, aufgrund beispielsweise der schlechten Zeitauflösung der ersten Codierer/Decodiererstrecke. Dagegen wird das Restsignal, da die erste Codierer/Decodierer-Strecke eine gute Frequenzauflösung hatte, kaum diesbezügliche Frequenzfehler anhaften. Damit kann ohne weiteres das Restsignal mit einem Codierer mit hoher Zeitauflösung (und damit entsprechend schlechter Frequenzauflösung codiert werden, um als zweites Codierausgangssignal ein Signal zu erhalten, das eine gute Zeitauflösung hat, jedoch eine schlechte Frequenzauflösung, was jedoch nichts macht, da das erste Codiererausgangssignal bereits eine gute Frequenzauflösung hat und somit die frequenzmäßig betrachtete Struktur des Audiosignals sehr gut wiedergibt.
- Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung sind sowohl der erste Codierer als auch der zweite Codierer Transformationscodierer. Ferner wird es bevorzugt, den ersten Codierer mit einer hohen Frequenzauflösung (und damit einer schlechten Zeitauflösung), also mit einer hohen Transformationslänge zu betreiben, während der zweite Codierer mit einer hohen Zeitauflösung (und damit einer schlechten Frequenzauflösung) betrieben wird.
- Erfindungsgemäß hat sich herausgestellt, daß in vielen Fällen Artefakte im Zeitbereich, also Artefakte aufgrund einer schlechten Zeitauflösung, eher akzeptiert werden als Artefakte im Frequenzbereich, also Artefakte aufgrund einer schlechten Frequenzauflösung. Daher wird es bevorzugt, den ersten Codierer mit einer hohen Frequenzauflösung zu betreiben, da dann von einem entsprechenden Decodierer lediglich das erste Codiererausgangssignal genügt, um eine einigermaßen gute Audioausgabe zu erreichen, was im Sinne des Konzepts der Skalierbarkeit liegt.
- Erfindungsgemäß wird durch den zweiten Codierer die Qualität des ersten Codierverfahrens verbessert, indem eine Differenzbildung zwischen dem Ausgangssignal der ersten Codierer/Decodierer-Strecke und dem ursprünglichen Audiosignal genommen wird, und daß dann das dabei entstehende Restsignal mit dem zweiten Codierer codiert wird, der eine gute Zeitauflösung hat. Diese Codierung ist besonders günstig für das Restsignal, da es bereits wenig tonale Elemente umfaßt, da diese bereits sehr gut und effizient vom ersten Codierverfahren erfaßt worden sind.
- Der wesentliche Mangel dieses Restsignals ist jedoch die schlechte Zeitauflösung, die sich in der Entstehung von Rauschen vor oder nach einem Transienten, also eines Vor-Echos oder Nachechos zeigt. Vorechos sind störender als Nachechos, da sie gut subjektiv wahrnehmbar sind. Dieses Rauschen ist gewissermaßen das Quantisierungsrauschen des Transienten und entspricht in seinem Spektralgehalt im we sentlichen dem des Transienten und ist somit nicht tonal. Durch die Verwendung des Transformations-Codierverfahrens mit kurzen Blöcken, also mit einer hohen Zeitauflösung, wird somit die Zeitauflösung auf effiziente Art und Weise erheblich verbessert.
- Erfindungsgemäß wird somit ein Audio-Codierverfahren mit hoher und höchster Qualität erhalten, indem die Anteile des Audiosignals, die tonal oder eher tonal sind, mit einem frequenzselektiven Transformations-Codierverfahren mit langen Transformationslängen erfaßt werden, während ein nachgeschaltetes Codierverfahren mit kurzen Transformationslängen für das Restsignal eine hohe Zeitauflösung ermöglicht.
- Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
-
1 ein Blockschaltbild eines erfindungsgemäßen Codierkonzepts; -
2 ein Blockschaltbild eines erfindungsgemäßen Codierkonzepts gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung; -
3 ein Blockschaltbild eines erfindungsgemäßen Decodierkonzepts; -
4a einen bekannten Transformations-Codierer; und -
4b einen bekannten Transformations-Decodierer. -
1 zeigt eine Vorrichtung zum Codieren eines Audiosignals, das über einen Eingang10 bereitgestellt wird. Das Audiosignal wird zunächst in einen ersten Codierer12 mit einer ersten Zeit/Frequenz-Auflösung eingespeist. Der erste Codierer12 ist ausgebildet, um ein erstes Codiererausgangssignal an einem Ausgang14 zu erzeugen. Das erste Co diererausgangssignal an dem Ausgang14 des ersten Codierers12 wird einerseits einem Multiplexer16 zugeführt, und andererseits einem Decodierer18 , der an den ersten Codierer angepaßt ist und das erste Codiererausgangssignal decodiert, um ein decodiertes Audiosignal an einem Ausgang20 des Decodierers18 zu liefern. Das decodierte Ausgangssignal20 sowie das ursprüngliche Audiosignal10 werden einem Vergleicher22 zugeführt. Der Vergleicher22 ist ausgebildet, um das Audiosignal an dem Eingang10 mit dem decodierten Audiosignal am Ausgang20 , also nach der Strecke aus erstem Codierer12 und dem Decodierer18 , zu vergleichen. Der Vergleicher22 ist insbesondere ausgebildet, um ein Restsignal an einem Ausgang24 desselben zu liefern, wobei das Restsignal einen Unterschied zwischen dem Audiosignal und dem decodierten Audiosignal umfaßt. Dieses Restsignal24 wird einem zweiten Codierer26 zugeführt, welcher ausgebildet ist, um das Restsignal an dem Ausgang24 des Vergleichers22 zu codieren, um ein zweites Codiererausgangssignal an einem Ausgang28 zu liefern, das ebenfalls dem Multiplexer16 zugeführt wird. Der Multiplexer16 ist ausgebildet, um das erste Codiererausgangssignal und das zweite Codiererausgangssignal zu kombinieren und um aus denselben gegebenenfalls unter Berücksichtigung entsprechender Seiteninformationen und Bitstrom-Syntax-Konventionen ein codiertes Audiosignal an einem Ausgang30 zu erzeugen. - Erfindungsgemäß hat der erste Codierer eine erste zeitliche oder frequenzmäßige Auflösung, und hat der zweite Codierer eine zweite zeitliche oder frequenzmäßige Auflösung. Gemäß der vorliegenden Erfindung unterscheiden sich die erste Auflösung des ersten Codierers und die zweite Auflösung des zweiten Codierers, so daß das erste Codiererausgangssignal entweder zeitlich oder frequenzmäßig gut codiert ist, und daß das zweite Codiererausgangssignal frequenzmäßig bzw. zeitlich gut codiert ist, dahingehend, daß das codierte Audiosignal am Ausgang des Multiplexers
16 sowohl eine hohe zeitliche Auflösung als auch eine hohe Frequenzauflösung hat. - Nachfolgend ist anhand von
2 ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung dargestellt. Hierbei wird das Audiosignal10 , bevor es dem Vergleicher22 zugeführt wird, der in2 als Differenzglied dargestellt ist, einer Verzögerung durch ein Verzögerungsglied32 unterzogen, so daß bei dem in2 gezeigten bevorzugten Ausführungsbeispiel eine abtastwertweise Differenzbildung durch das Differenz-Glied22 zwischen dem decodierten Audiosignal am Ausgang des Decoders18 und dem (verzögerten) Audiosignal am Ausgang des Verzögerungsglieds32 in Echtzeit durchgeführt werden kann. - Bei dem in
2 gezeigten Ausführungsbeispiel sind ferner der erste Codier, also der Encoder12 in2 , und der zweite Codierer26 , der in2 mit Differenz-Encoder bezeichnet ist, ausgebildet, um eine Transformations-Codierung durchzuführen. - Ferner wird es bevorzugt, daß der erste Codierer
12 eine Codierung mit langen Transformationslängen, also einer hohen Frequenzauflösung und damit einhergehend einer niedrigen Zeitauflösung durchführt, während der zweite Codierer26 eine Codierung mit kurzen Transformationslängen durchführt, also mit einer hohen Zeitauflösung und inhärent damit einhergehend niedrigen Frequenzauflösung. - Obgleich prinzipiell auch der erste Codierer mit kurzen Transformationslängen und der Differenzcodierer mit langen Transformationslängen arbeiten könnte, wird es dennoch bevorzugt, den ersten Codierer mit langen Transformationslängen laufen zu lassen, da, wie es bereits ausgeführt worden ist, für einen Zuhörer Zeitartefakte eher weniger problematisch sind als Frequenzartefakte. Daher wird ein Codierer, der nur das erste Codiererausgangssignal am Ausgang
14 , nicht aber das zweite Codiererausgangssignal am Ausgang28 verarbeiten kann, dann, wenn der erste Codierer mit langen Transformationslängen arbeitet, eine angenehmere Wiedergabe erzeugen als wenn der erste Codierer mit kurzen Transformationslängen arbeiten würde. - Als Transformationsalgorithmus innerhalb des ersten Codierers und/oder des zweiten Codierers von
2 kann jede beliebige Einrichtung zum Umsetzen eines Blocks von zeitlichen Abtastwerten in eine spektrale Darstellung verwendet werden, wie beispielsweise eine Fourier-Transformation, eine diskrete Fourier-Transformation, eine schnelle Fourier-Transformation, eine diskrete Cosinustransformation, eine modifizierte diskrete Cosinustransformation etc. Alternativ kann jedoch auch eine Filterbank mit einer kleineren Anzahl von Kanälen eingesetzt werden, wie z. B. eine 64-Kanal-Filterbank, eine 128-Kanal-Filterbank oder eine Filterbank mit mehr oder weniger Kanälen. - Bei einem anderen Ausführungsbeispiel der vorliegenden Erfindung kann der erste Encoder
12 ein SBR-Encoder sein, der ausgebildet ist, um ein erstes Codiererausgangssignal zu liefern, das nur Informationen bis zu einer Grenzfrequenz umfaßt, die kleiner als die Grenzfrequenz des Audiosignals am Audioeingang10 ist. Typische SBR-Encoder extrahieren aus dem Audiosignal Seiteninformationen, die zur Hochfrequenz-Rekonstruktion in einem SBR-Decoder eingesetzt werden können, um das hohe Band, also das Band des Audiosignals oberhalb der Grenzfrequenz des ersten Codiererausgangssignals, möglichst hochqualitativ zu rekonstruieren. Der Decodierer18 in2 ist jedoch hier kein solcher SBR-Decodierer mit Hochfrequenzrekonstruktion, sondern ein üblicher Transformations-Decodierer, der an den ersten Codierer12 angepaßt ist, um das Codiererausgangssignal unabhängig davon, daß dasselbe Band begrenzt ist, einfach zu decodieren, so daß das Ausgangssignal des Decodierers18 am Ausgang20 ebenfalls eine niedrigere Grenzfrequenz hat als das ursprüngliche Audiosignal. - In diesem Fall würde das Restsignal bis zur Grenzfrequenz den Codier/Decodier-Fehler der Strecke aus Encoder
12 und Decoder18 umfassen, würde jedoch oberhalb der Grenzfrequenz das komplette Audiosignal sein. - In diesem Fall kann das Restsignal, da es oberhalb der Grenzfrequenz des ersten Codiererausgangssignals mit dem ursprünglichen Audiosignal übereinstimmt, entweder ebenfalls mit dem Differenz-Codierer
16 codiert werden, der kurze Transformationslängen verwendet. Alternativ könnte jedoch nur der Spektralbereich des Restsignals bis zur Grenzfrequenz des ersten Codiererausgangssignals mit dem Differenz-Codierer26 codiert werden, während der hochfrequente Anteil des Restsignals wieder mit dem ersten Codierer12 mit den langen Transformationslängen codiert wird, um auch im hochfrequenten Teil des Audiosignals eine hohe Frequenzauflösung zu erreichen. - Das Ausgangssignal des Codierers
12 für das hochfrequente Band kann nun wieder mit dem entsprechenden Band des ursprünglichen Audiosignals verglichen werden, um das Differenzsignal wieder mit dem Differenzcodierer26 zu codieren, so daß am Ende vier Datenströme dem Multiplexer16 zugeführt werden, die, wenn sie alle zusammen decodiert werden, eine transparente Wiedergabe, d. h. eine Wiedergabe ohne Artefakte, ermöglichen. - Erfindungsgemäß ist es nicht wesentlich, daß der erste Codierer und der zweite Codierer unter Verwendung eines psychoakustischen Modells arbeiten. Aus Dateneffizienzgründen wird es jedoch bevorzugt, daß zumindest der erste Codierer
12 unter Verwendung eines psychoakustischen Modells arbeitet. Je nach Ressourcen könnte der zweite Codierer dann verlustlos codieren, wenn die entsprechenden Übertragungskanalressourcen vorhanden sind, so daß eine vollständig transparente Wiedergabe erreicht wird. Alternativ könnte jedoch auch der zweite Codierer unter Verwendung eines psychoakustischen Modells arbeiten, wobei es bevorzugt wird, daß in diesem Fall für den zweiten Codierer das psychoakustische Modell nicht noch einmal komplett berechnet wird, sondern zumindest Teile desselben bzw. die gesamte psychoakustische Maskierungsschwelle unter Berücksichtigung der unterschiedlichen Transformationslängen von dem ersten Codierer zu dem zweiten Codierer gewissermaßen „wieder verwendet" werden kann. Dies kann z. B. dadurch geschehen, daß die von dem ersten Codierer berechnete psychoakustische Maskierungsschwelle unmittelbar für den zweiten Codierer genommen wird, wobei jedoch zur Berücksichtigung der kürzeren Transformationslängen des zweiten Codierers z. B. einen „Sicherheitsaufschlag" von beispielsweise 3 dB verwendet wird, derart, daß die psychoakustische Maskierungsschwelle für den zweiten Codierer z. B. um 3 dB oder einen anderen vorbestimmten Betrag kleiner als die psychoakustische Maskierungsschwelle für den ersten Codierer12 ist. - Im Hinblick auf die Transformationslängen wird es bevorzugt, daß die Transformationslänge des ersten Codierers ein ganzzahliges Vielfaches der Transformationslänge des zweiten Codierers ist. So kann die Transformationslänge des ersten Codierers beispielsweise doppelt so viele, dreimal so viele, viermal so viele oder fünfmal so viele Abtastwerte des Audiosignals umfassen als die Transformationslänge des zweiten Codierers
26 . Diese ganzzahlige Relation zwischen den Transformationslängen des ersten und des zweiten Codierers wird deswegen bevorzugt, da dann eine relativ gute Wiederverwendung von Codiererdaten des ersten Codierers für den zweiten Codierer möglich sind. Andererseits wäre jedoch auch ein nicht-ganzzahliger Zusammenhang zwischen den Transformationslängen unproblematisch, da der erste Codierer12 und der zweite Codierer26 auch nicht synchronisiert zueinander laufen können, sofern dies einem Decodierer entsprechend mitgeteilt wird, damit derselbe mit den richtigen Abtastwerten die Aufsummation durchführt, also das Inverse der abtastwertweisen Differenzbildung im Element22 von2 . -
3 zeigt einen Decodierer zum Decodieren eines codierten Audiosignals gemäß der vorliegenden Erfindung. Das codierte Audiosignal, das an dem Ausgang30 von1 bzw.2 ausgegeben wird, wird nach Übertragung, Speicherung, etc. einem Eingang40 des Decodierers in3 zugeführt. Der Eingang40 ist zunächst mit einem Extraktor42 gekoppelt, der die Funktionalität eines Bitstrom-Demultiplexers aufweist, um aus dem codierten Audiosignal zunächst das erste Codiererausgangssignal zu extrahieren und an einem Ausgang44 bereitzustellen, und der ferner ausgebildet ist, um das codierte Restsignal, bzw. das Differenzsignal bzw. das zweite Codiererausgangssignal an einem Ausgang46 bereitzustellen. Das erste Codiererausgangssignal wird einem ersten Decodierer zugeführt, der an den ersten Codierer12 der in1 gezeigten erfindungsgemäßen Vorrichtung zum Codieren angepaßt ist und prinzipiell mit dem Decodierer18 von1 identisch sein kann. Dies bedeutet, daß der erste Decodierer48 wieder dieselbe Zeit/Frequenz-Auflösung hat, also mit derselben beispielsweise Transformationslänge arbeitet wie der Codierer12 von1 . Das zweite Codiererausgangssignal am Ausgang46 des Extraktors wird einem zweiten Decodierer50 zugeführt, der an den zweiten Codierer26 von1 angepaßt ist und damit die zweite Zeit/Frequenz-Auflösung hat, also eine Zeit/Frequenz-Auflösung, die zu der Zeit-Frequenz-Auflösung des zweiten Codierers26 in1 identisch ist. - Der erste Decodierer
48 liefert ausgangsseitig das decodierte Audiosignal, das mit dem Signal am Ausgang20 von2 identisch sein kann. Analog hierzu liefert der zweite Decodierer50 an seinem Ausgang das decodierte Restsignal. Es sei darauf hingewiesen, daß beide Decodierer prinzipiell so ausgebildet sein können, wie es anhand von4b dargestellt worden ist, wobei sich dieselben jedoch im Hinblick auf ihre Transformationslängen und damit auf die verwendeten Synthese-Filterbanken unterscheiden werden. - Sowohl das decodierte Audiosignal am Ausgang
52 in3 als auch das decodierte Restsignal am Ausgang54 von3 werden einem Kombinierer56 zugeführt, der bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung eine abtastwertweise Summation durchführt, also allgemein gesagt eine Operation, die invers zu der Vergleichsoperation ist, die im Codierer im Element22 von1 durchgeführt worden ist. Der Kombinierer56 liefert ausgangsseitig an einem Ausgang58 der Decodiervorrichtung von3 ein Ausgangssignal, das sich nun aufgrund der vorliegenden Erfindung sowohl durch eine gute Zeitauflösung als auch durch eine gute Frequenzauflösung auszeichnet, das also sowohl wenig Frequenzartefakte als auch wenig Zeitartefakte umfaßt. - Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Codieren, wie es anhand von
1 dargestellt worden ist, oder kann das erfindungsgemäße Verfahren zum Decodieren, wie es anhand von3 dargestellt worden ist, in Hardware oder in Software implementiert werden. Die Implementierung kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, daß das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.
Claims (14)
- Vorrichtung zum Codieren eines Audiosignals, mit folgenden Merkmalen: einem ersten Codierer (
12 ) zum Erzeugen eines ersten Codiererausgangssignals aus dem Audiosignal; einem Decodierer (18 ), der an den ersten Codierer (12 ) angepaßt ist, zum Decodieren des ersten Codiererausgangssignals, um ein decodiertes Audiosignal zu liefern; einem Vergleicher (22 ) zum Vergleichen des Audiosignals mit dem decodierten Audiosignal, wobei der Vergleicher (22 ) ausgebildet ist, um ein Restsignal zu liefern, wobei das Restsignal einen Unterschied zwischen dem Audiosignal und dem decodierten Audiosignal umfaßt; einem zweiten Codierer (26 ) zum Codieren des Restsignals, um ein zweites Codiererausgangssignal zu liefern; und einem Multiplexer (16 ) zum Verbinden des ersten Codiererausgangssignals und des zweiten Codiererausgangssignals, um ein codiertes Audiosignal zu erhalten, wobei der erste Codierer (12 ) eine erste zeitliche oder frequenzmäßige Auflösung hat, wobei der zweite Codierer (26 ) eine zweite zeitliche oder frequenzmäßige Auflösung hat, und wobei sich die erste Auflösung von der zweiten Auflösung unterscheidet. - Vorrichtung nach Anspruch 1, bei der der erste Codierer (
12 ) ausgebildet ist, um als erste Auflösung eine hohe frequenzmäßige Auflösung und eine niedrige zeitliche Auflösung zu haben, und bei der zweite Codierer (26 ) ausgebildet ist, um als zweite Auflösung eine niedrige frequenzmäßige und eine hohe zeitliche Auflösung zu haben. - Vorrichtung nach Anspruch 1 oder 2, bei der der erste Codierer (
12 ) ein Transformationscodierer ist, der ausgebildet ist, um einen Block mit einer ersten Anzahl von zeitlichen Abtastwerten des Audiosignals in eine spektrale Darstellung umzusetzen, bei der der zweite Codierer (26 ) ein Transformationscodierer ist, der ausgebildet ist, um einen Block mit einer zweiten Anzahl von zeitlichen Abtastwerten des Restsignals in eine spektrale Darstellung umzusetzen, und bei der sich die erste Anzahl von der zweiten Anzahl unterscheidet. - Vorrichtung nach Anspruch 3, bei der die erste Anzahl größer als die zweite Anzahl ist.
- Vorrichtung nach Anspruch 3 oder 4, bei der der erste Codierer (
12 ) und der zweite Codierer (26 ) eine Filterbank oder einen Transformationsalgorithmus aufweisen, der eine Fourier-Transformation, eine diskrete Fourier-Transformation, eine schnelle Fourier-Transformation, eine diskrete Cosinus-Transformation oder eine modifizierte diskrete Cosinus-Transformation umfaßt. - Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der Decodierer (
18 ) ausgebildet ist, um ein zeitdiskretes decodiertes Audiosignal mit eine Folge von Abtastwerten zu liefern, bei der das Audiosignal ein zeitdiskretes Audiosignal mit einer Folge von Abtastwerten ist, und bei der der Vergleicher (22 ) ausgebildet ist, um eine abtastwertweise Differenzbildung durchzuführen, um das Restsignal zu erhalten. - Vorrichtung nach einem der vorhergehenden Ansprüche, die ferner folgendes Merkmal aufweist: ein Verzögerungsglied (
32 ) zum Verzögern des Audiosignals, wobei das Verzögerungsglied (32 ) ausgebildet ist, um eine Verzögerung zu haben, die von einer dem ersten Codierer (12 ) und dem Decodierer (18 ) zugehörigen Verzögerung abhängt. - Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der Multiplexer (
16 ) ausgebildet ist, um das codierte Audiosignal so zu erzeugen, daß das erste Codierausgangssignal unabhängig von dem zweiten Codiererausgangssignal decodierbar ist. - Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der erste Codierer (
12 ) ausgebildet ist, um das Audiosignal einer Bandbegrenzung zu unterziehen, so daß das erste Codiererausgangssignal eine obere Grenzfrequenz hat, die kleiner als eine obere Grenzfrequenz des Audiosignals ist, bei der der Vergleicher (22 ) ein Restsignal liefert, das oberhalb der oberen Grenzfrequenz des ersten Codiererausgangssignals dem Audiosignal entspricht, und bei der der zweite Codierer (26 ) ausgebildet ist, um einen Anteil des Restsignals oberhalb der oberen Grenzfrequenz des ersten Codierers mit einer zeitlichen oder frequenzmäßige Auflösung zu codieren, die ungleich der zweiten Auflösung oder gleich der zweiten Auflösung ist. - Verfahren zum Codieren eines Audiosignals, mit folgenden Schritten: Erzeugen (
12 ) eines ersten Codiererausgangssignals mit einer ersten zeitlichen oder frequenzmäßigen Auflösung aus dem Audiosignal; Decodieren des ersten Codiererausgangssignals, um ein decodiertes Audiosignal zu liefern; Vergleichen (22 ) des Audiosignals mit dem decodierten Audiosignal, um ein Restsignal zu liefern, wobei das Restsignal einen Unterschied zwischen dem Audiosignal und dem decodierten Audiosignal umfaßt; Codieren (26 ) des Restsignals mit einer zweiten zeitlichen oder frequenzmäßigen Auflösung, um ein zweites Codiererausgangssignal zu liefern; und Verbinden (16 ) des ersten Codiererausgangssignals und des zweiten Codiererausgangssignals, um ein codiertes Audiosignal zu erhalten, wobei sich die erste Auflösung von der zweiten Auflösung unterscheidet. - Vorrichtung zum Decodieren eines codierten Audiosignals, um ein Ausgangssignal zu erhalten, wobei das codierte Audiosignal ein erstes Codiererausgangssignal aufweist, das mit einer ersten zeitlichen oder frequenzmäßigen Auflösung codiert ist, und wobei das co dierte Audiosignal ferner ein zweites Codiererausgangssignal aufweist, das ein mit einer zweiten zeitlichen oder frequenzmäßigen Auflösung codiertes Restsignal darstellt, das einen Unterschied zwischen einem ursprünglichen Audiosignal und einem decodierten Audiosignal darstellt, wobei das decodierte Audiosignal durch Decodieren des ersten Codiererausgangssignals erhaltbar ist, mit folgenden Merkmalen: einem Extraktor (
42 ) zum Extrahieren des ersten Codiererausgangssignals und des zweiten Codiererausgangssignals aus dem codierten Audiosignal; einem ersten Decodierer (48 ) zum Decodieren des ersten Codiererausgangssignals, um das decodierte Audiosignal zu erhalten, wobei der erste Decodierer (48 ) ausgebildet ist, um mit der ersten zeitlichen oder frequenzmäßigen Auflösung zu arbeiten; einem zweiten Decodierer (50 ) zum Decodieren des zweiten Codiererausgangssignals, um ein decodiertes Restsignal zu erhalten, wobei der zweite Decodierer ausgebildet ist, um mit der zweiten zeitlichen oder frequenzmäßigen Auflösung zu arbeiten, wobei sich die zweite Auflösung von der ersten Auflösung unterscheidet; und einem Kombinierer (56 ) zum Kombinieren des decodierten Audiosignals und des decodierten Restsignals, um das Ausgangssignal zu erhalten. - Vorrichtung nach Anspruch 11, bei der der erste Decodierer ein Transformationsdecodierer ist, der ausgebildet ist, um einen Block mit einer ersten Anzahl von Spektralwerten in eine zeitliche Darstellung umzusetzen, bei der der zweite Decodierer ein Transformationsdecodierer ist, der ausgebildet ist, um einen Block mit einer zweiten Anzahl von Spektralwerten des Restsignals in eine zeitliche Darstellung umzusetzen, und bei der sich die erste Anzahl von der zweiten Anzahl unterscheidet.
- Verfahren zum Decodieren eines codierten Audiosignals, um ein Ausgangssignal zu erhalten, wobei das codierte Audiosignal ein erstes Codiererausgangssignal aufweist, das mit einer ersten zeitlichen oder frequenzmäßigen Auflösung codiert ist, und wobei das codierte Audiosignal ferner ein zweites Codiererausgangssignal aufweist, das ein mit einer zweiten zeitlichen oder frequenzmäßigen Auflösung codiertes Restsignal darstellt, das einen Unterschied zwischen einem ursprünglichen Audiosignal und einem decodierten Audiosignal darstellt, wobei das decodierte Audiosignal durch Decodieren des ersten Codiererausgangssignals erhaltbar ist, mit folgenden Schritten: Extrahieren (
42 ) des ersten Codiererausgangssignals und des zweiten Codiererausgangssignals aus dem codierten Audiosignal; Decodieren (48 ) des ersten Codiererausgangssignals mit der ersten zeitlichen oder frequenzmäßigen Auflösung, um das decodierte Audiosignal zu erhalten; Decodieren (50 ) des zweiten Codiererausgangssignals mit der zweiten zeitlichen oder frequenzmäßigen Auflösung, um ein decodiertes Restsignal zu erhalten, wobei sich die zweite Auflösung von der ersten Auflösung unterscheidet; und Kombinieren (56 ) des decodierten Audiosignals und des decodierten Restsignals, um das Ausgangssignal zu erhalten. - Computer-Programm mit einem Programmcode zum Durchführen des Verfahrens nach Anspruch 10 oder Anspruch 13, wenn das Programm auf einem Computer abläuft.
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10328777A DE10328777A1 (de) | 2003-06-25 | 2003-06-25 | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
PCT/EP2004/006850 WO2005001813A1 (en) | 2003-06-25 | 2004-06-24 | Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal |
DE602004005197T DE602004005197T2 (de) | 2003-06-25 | 2004-06-24 | Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals |
JP2006516049A JP2009513992A (ja) | 2003-06-25 | 2004-06-24 | オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法 |
CN200480017095.2A CN1809872B (zh) | 2003-06-25 | 2004-06-24 | 编码音频信号的设备和方法及解码已编码音频信号的设备和方法 |
EP04740263A EP1636791B1 (de) | 2003-06-25 | 2004-06-24 | Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals |
US11/317,521 US7275031B2 (en) | 2003-06-25 | 2005-12-22 | Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal |
HK06105737A HK1083664A1 (en) | 2003-06-25 | 2006-05-17 | Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10328777A DE10328777A1 (de) | 2003-06-25 | 2003-06-25 | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10328777A1 true DE10328777A1 (de) | 2005-01-27 |
Family
ID=33546670
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10328777A Withdrawn DE10328777A1 (de) | 2003-06-25 | 2003-06-25 | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
DE602004005197T Expired - Lifetime DE602004005197T2 (de) | 2003-06-25 | 2004-06-24 | Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE602004005197T Expired - Lifetime DE602004005197T2 (de) | 2003-06-25 | 2004-06-24 | Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals |
Country Status (7)
Country | Link |
---|---|
US (1) | US7275031B2 (de) |
EP (1) | EP1636791B1 (de) |
JP (1) | JP2009513992A (de) |
CN (1) | CN1809872B (de) |
DE (2) | DE10328777A1 (de) |
HK (1) | HK1083664A1 (de) |
WO (1) | WO2005001813A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4303872A1 (de) * | 2022-07-07 | 2024-01-10 | Technische Universität München | Kodierungsvorrichtung und kodierungsverfahren zur mehrkanalkodierung von vibrotaktilen signalen sowie dekodierung und dekodierungsverfahren |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7539870B2 (en) * | 2004-02-10 | 2009-05-26 | Microsoft Corporation | Media watermarking by biasing randomized statistics |
EP1792306B1 (de) * | 2004-09-17 | 2013-03-13 | Koninklijke Philips Electronics N.V. | Kombinierte audiokodierung zur minimierung von perzeptueller verzerrung |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
ATE521143T1 (de) | 2005-02-23 | 2011-09-15 | Ericsson Telefon Ab L M | Adaptive bitzuweisung für die mehrkanal- audiokodierung |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
ATE442645T1 (de) | 2006-02-06 | 2009-09-15 | France Telecom | Verfahren und vorrichtung zur hierarchischen kodierung eines quelltonsignals sowie entsprechendes decodierverfahren und gerät, programme und signal |
EP1855271A1 (de) * | 2006-05-12 | 2007-11-14 | Deutsche Thomson-Brandt Gmbh | Verfahren und Vorrichtung zur Wiederkodierung von Signalen |
GB2443911A (en) * | 2006-11-06 | 2008-05-21 | Matsushita Electric Ind Co Ltd | Reducing power consumption in digital broadcast receivers |
JP5103880B2 (ja) * | 2006-11-24 | 2012-12-19 | 富士通株式会社 | 復号化装置および復号化方法 |
EP3712888B1 (de) * | 2007-03-30 | 2024-05-08 | Electronics and Telecommunications Research Institute | Verfahren und vorrichtungen zur codierung und decodierung von multiobjektaudiosignal mit multikanal |
EP2015293A1 (de) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen über adaptiv geschaltete temporäre Auflösung in einer Spektraldomäne |
US20090006081A1 (en) * | 2007-06-27 | 2009-01-01 | Samsung Electronics Co., Ltd. | Method, medium and apparatus for encoding and/or decoding signal |
RU2452043C2 (ru) * | 2007-10-17 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Аудиокодирование с использованием понижающего микширования |
KR101441897B1 (ko) * | 2008-01-31 | 2014-09-23 | 삼성전자주식회사 | 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치 |
CN101527138B (zh) * | 2008-03-05 | 2011-12-28 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
EP2139000B1 (de) * | 2008-06-25 | 2011-05-25 | Thomson Licensing | Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprache bzw. Nicht-Sprache-Audioeingabesignalen |
EP4224471B1 (de) | 2008-07-11 | 2024-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierer und audiodecodierer |
CN101729198B (zh) * | 2008-10-27 | 2014-04-02 | 华为技术有限公司 | 一种编解码方法、装置及系统 |
RU2523035C2 (ru) * | 2008-12-15 | 2014-07-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Аудио кодер и декодер, увеличивающий полосу частот |
WO2010069885A1 (en) | 2008-12-15 | 2010-06-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and bandwidth extension decoder |
ES2906085T3 (es) | 2009-10-21 | 2022-04-13 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
CN103854651B (zh) * | 2009-12-16 | 2017-04-12 | 杜比国际公司 | Sbr比特流参数缩混 |
WO2011087061A1 (ja) | 2010-01-15 | 2011-07-21 | 三菱化学株式会社 | 単結晶基板、それを用いて得られるiii族窒化物結晶及びiii族窒化物結晶の製造方法 |
CN102263771B (zh) * | 2010-05-26 | 2014-03-19 | 中国移动通信集团公司 | 移动终端、适配器及多媒体数据的播放方法和系统 |
KR102296955B1 (ko) | 2010-07-02 | 2021-09-01 | 돌비 인터네셔널 에이비 | 선택적인 베이스 포스트 필터 |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
CN106409299B (zh) | 2012-03-29 | 2019-11-05 | 华为技术有限公司 | 信号编码和解码的方法和设备 |
EP2688066A1 (de) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Verfahren und Vorrichtung zur Codierung von Mehrkanal-HOA-Audiosignalen zur Rauschreduzierung sowie Verfahren und Vorrichtung zur Decodierung von Mehrkanal-HOA-Audiosignalen zur Rauschreduzierung |
BR122021009025B1 (pt) * | 2013-04-05 | 2022-08-30 | Dolby International Ab | Método de decodificação para decodificar dois sinais de áudio e decodificador para decodificar dois sinais de áudio |
EP2980794A1 (de) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierer und -decodierer mit einem Frequenzdomänenprozessor und Zeitdomänenprozessor |
WO2019089341A1 (en) * | 2017-11-02 | 2019-05-09 | Bose Corporation | Low latency audio distribution |
CN111444382B (zh) * | 2020-03-30 | 2021-08-17 | 腾讯科技(深圳)有限公司 | 一种音频处理方法、装置、计算机设备以及存储介质 |
CN112104952B (zh) * | 2020-11-19 | 2021-05-11 | 首望体验科技文化有限公司 | 应用于720度球幕全景影院的全景声音频系统 |
US12104955B2 (en) * | 2021-03-01 | 2024-10-01 | The Boeing Company | Device to process sample using a time-windowed transform function to generate spectral data and to use combined magnitude and phase spectrograms |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998057436A2 (en) * | 1997-06-10 | 1998-12-17 | Lars Gustaf Liljeryd | Source coding enhancement using spectral-band replication |
EP0846375B1 (de) * | 1995-10-06 | 1999-08-25 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Verfahren und vorrichtung zur skalierbaren codierung von audiosignalen |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02143735A (ja) * | 1988-11-25 | 1990-06-01 | Victor Co Of Japan Ltd | 音声多段符号化伝送方式 |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
US5732391A (en) * | 1994-03-09 | 1998-03-24 | Motorola, Inc. | Method and apparatus of reducing processing steps in an audio compression system using psychoacoustic parameters |
JPH07261799A (ja) * | 1994-03-18 | 1995-10-13 | Pioneer Electron Corp | 直交変換符号化装置及び方法 |
JP3186413B2 (ja) * | 1994-04-01 | 2001-07-11 | ソニー株式会社 | データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体 |
JPH0846517A (ja) * | 1994-07-28 | 1996-02-16 | Sony Corp | 高能率符号化及び復号化システム |
JP3139602B2 (ja) * | 1995-03-24 | 2001-03-05 | 日本電信電話株式会社 | 音響信号符号化方法及び復号化方法 |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
US6092041A (en) * | 1996-08-22 | 2000-07-18 | Motorola, Inc. | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder |
TW384434B (en) * | 1997-03-31 | 2000-03-11 | Sony Corp | Encoding method, device therefor, decoding method, device therefor and recording medium |
KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
DE19743662A1 (de) * | 1997-10-02 | 1999-04-08 | Bosch Gmbh Robert | Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms |
US6263312B1 (en) * | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
JP2003510643A (ja) * | 1999-09-20 | 2003-03-18 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号を補正する処理回路、受信機、通信システム、携帯装置、及びその方法 |
US6377916B1 (en) * | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
JP3609323B2 (ja) * | 2000-05-08 | 2005-01-12 | 日本電信電話株式会社 | 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体 |
US7171355B1 (en) * | 2000-10-25 | 2007-01-30 | Broadcom Corporation | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
DE10102159C2 (de) | 2001-01-18 | 2002-12-12 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer |
JP4506039B2 (ja) * | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
-
2003
- 2003-06-25 DE DE10328777A patent/DE10328777A1/de not_active Withdrawn
-
2004
- 2004-06-24 WO PCT/EP2004/006850 patent/WO2005001813A1/en active IP Right Grant
- 2004-06-24 DE DE602004005197T patent/DE602004005197T2/de not_active Expired - Lifetime
- 2004-06-24 CN CN200480017095.2A patent/CN1809872B/zh not_active Expired - Lifetime
- 2004-06-24 EP EP04740263A patent/EP1636791B1/de not_active Expired - Lifetime
- 2004-06-24 JP JP2006516049A patent/JP2009513992A/ja active Pending
-
2005
- 2005-12-22 US US11/317,521 patent/US7275031B2/en not_active Expired - Lifetime
-
2006
- 2006-05-17 HK HK06105737A patent/HK1083664A1/xx not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0846375B1 (de) * | 1995-10-06 | 1999-08-25 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Verfahren und vorrichtung zur skalierbaren codierung von audiosignalen |
WO1998057436A2 (en) * | 1997-06-10 | 1998-12-17 | Lars Gustaf Liljeryd | Source coding enhancement using spectral-band replication |
Non-Patent Citations (3)
Title |
---|
GRILL,B., BRANDENBURG,K.: A two-or three-stage bit rate scalable audio coding system. In: Proceeding AES, 99th Convention 1995 October 6-9, New York, Nr.4132 |
GRILL,B., BRANDENBURG,K.: A two-or three-stage bitrate scalable audio coding system. In: Proceeding AES, 99th Convention 1995 October 6-9, New York, Nr.4132 * |
PURNHAGEN,H.: Der MPEG-4-Audio-Standart - Ein Überblick. In: Rundfunktechnische Mitteilungen, Heft 2, Jg.44, 2000, S.37-47 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4303872A1 (de) * | 2022-07-07 | 2024-01-10 | Technische Universität München | Kodierungsvorrichtung und kodierungsverfahren zur mehrkanalkodierung von vibrotaktilen signalen sowie dekodierung und dekodierungsverfahren |
Also Published As
Publication number | Publication date |
---|---|
EP1636791B1 (de) | 2007-03-07 |
EP1636791A1 (de) | 2006-03-22 |
DE602004005197T2 (de) | 2007-06-28 |
CN1809872A (zh) | 2006-07-26 |
DE602004005197D1 (de) | 2007-04-19 |
WO2005001813A1 (en) | 2005-01-06 |
US7275031B2 (en) | 2007-09-25 |
US20060167683A1 (en) | 2006-07-27 |
CN1809872B (zh) | 2010-06-02 |
HK1083664A1 (en) | 2006-07-07 |
JP2009513992A (ja) | 2009-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE602004005197T2 (de) | Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals | |
EP0954909B1 (de) | Verfahren zum codieren eines audiosignals | |
EP1145227B1 (de) | Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals | |
DE60214599T2 (de) | Skalierbare audiokodierung | |
DE19747132C2 (de) | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms | |
DE19730129C2 (de) | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals | |
DE69731677T2 (de) | Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung | |
DE60117471T2 (de) | Breitband-signalübertragungssystem | |
DE19537338C1 (de) | Verfahren und Vorrichtung zum Codieren von Audiosignalen | |
DE60225276T2 (de) | Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm | |
EP1495464B1 (de) | Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten | |
DE69732761T2 (de) | Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung | |
DE60214027T2 (de) | Kodiervorrichtung und dekodiervorrichtung | |
DE102006051673A1 (de) | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale | |
DE60311334T2 (de) | Verfahren und Vorrichtung zur Kodierung und Dekodierung eines digitalen Informationssignals | |
WO1999017587A1 (de) | Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals | |
DE60112407T2 (de) | Verfahren und vorrichtung zur konvertierung eines audiosignals zwischen unterschiedlichen datenkompressionsformaten | |
DE102007029381A1 (de) | Digitalsignal-Verarbeitungsvorrichtung, Digitalsignal-Verarbeitungsverfahren, Digitalsignal-Verarbeitungsprogramm, Digitalsignal-Wiedergabevorrichtung und Digitalsignal-Wiedergabeverfahren | |
DE602004009926T2 (de) | Vorrichtung und verfahren zum einbetten eines wasserzeichens unter verwendung von subbandfilterung | |
DE19742201C1 (de) | Verfahren und Vorrichtung zum Codieren von Audiosignalen | |
DE19829284C2 (de) | Verfahren und Vorrichtung zum Verarbeiten eines zeitlichen Stereosignals und Verfahren und Vorrichtung zum Decodieren eines unter Verwendung einer Prädiktion über der Frequenz codierten Audiobitstroms | |
DE69803457T2 (de) | Audiokodierer | |
DE4209382C1 (de) | ||
EP1028539B1 (de) | Verfahren zum Transkodieren eines Audiodatenstroms | |
DE10119980C1 (de) | Verfahren zur Codierung von Audiodaten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8130 | Withdrawal |