[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

DE10328777A1 - Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals - Google Patents

Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals Download PDF

Info

Publication number
DE10328777A1
DE10328777A1 DE10328777A DE10328777A DE10328777A1 DE 10328777 A1 DE10328777 A1 DE 10328777A1 DE 10328777 A DE10328777 A DE 10328777A DE 10328777 A DE10328777 A DE 10328777A DE 10328777 A1 DE10328777 A1 DE 10328777A1
Authority
DE
Germany
Prior art keywords
audio signal
encoder
signal
resolution
temporal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10328777A
Other languages
English (en)
Inventor
Holger HÖRICH
Michael Schug
Matthias Neusinger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coding Technologies Sweden AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Priority to DE10328777A priority Critical patent/DE10328777A1/de
Priority to PCT/EP2004/006850 priority patent/WO2005001813A1/en
Priority to DE602004005197T priority patent/DE602004005197T2/de
Priority to JP2006516049A priority patent/JP2009513992A/ja
Priority to CN200480017095.2A priority patent/CN1809872B/zh
Priority to EP04740263A priority patent/EP1636791B1/de
Publication of DE10328777A1 publication Critical patent/DE10328777A1/de
Priority to US11/317,521 priority patent/US7275031B2/en
Priority to HK06105737A priority patent/HK1083664A1/xx
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Beim Codieren eines Audiosignals wird das Audiosignal zunächst mit einem ersten Codierer codiert, um ein erstes Codiererausgangssignal zu erhalten. Dieses erste Codiererausgangssignal wird in einen Bitstrom geschrieben. Es wird ferner von einem Decodierer decodiert, um ein decodiertes Audiosignal zu liefern. Das decodierte Audiosignal wird mit dem ursprünglichen Audiosignal verglichen, um ein Restsignal zu erhalten. Das Restsignal wird dann mittels eines zweiten Codierers codiert, um ein zweites Codiererausgangssignal zu liefern, das ebenfalls in einen Bitstrom geschrieben wird. Der erste Codierer hat eine erste zeitliche oder frequenzmäßige Auflösung. Der zweite Codierer hat eine zweite zeitliche oder frequenzmäßige Auflösung. Die erste Auflösung unterscheidet sich von der zweiten Auflösung, so daß in einem entsprechenden Decodierer ein Audiosignal mit sowohl einer hohen zeitlichen Auflösung als auch mit einer hohen frequenzmäßigen Auflösung wiedergewonnen werden kann.

Description

  • Die vorliegende Erfindung bezieht sich auf Codierungstechniken und insbesondere auf Audiocodierungstechniken. Audiocodierer, und insbesondere solche Codierer, die unter dem Stichwort „mp3", „AAC" oder „mp3PRO" bekannt sind, haben sich in jüngster Zeit stark durchgesetzt. Sie erlauben die Komprimierung von Audiosignalen, die eine erhebliche Datenmenge benötigen, wenn sie beispielsweise im PCM-Format auf einer Audio-CD vorliegen, auf „erträgliche" Datenraten, die für die Übertragung der Audiosignale über Kanäle mit begrenzter Bandbreite geeignet sind. So sind zur Übertragung von Daten im PCM-Format Datenraten bis zu 1,4 Mbit/s erforderlich. „mp3"-codierte Audiodaten erreichen bereits bei Datenraten von 128 kbit/s eine Musikwiedergabe in Stereo bei hoher Qualität.
  • Mit der Spectral Band Replication (SBR) ist ferner ein Verfahren bekannt, das die Effizienz bestehender gehörangepaßter Audiocoder deutlich verbessert. Die SBR-Technik ist in der WO 98/57436 beschrieben und in dem Format „mp3PRO" implementiert. Hier wird gute Stereoqualität bereits mit Datenraten von 64 kbit/s erreicht.
  • Das europäische Patent EP 0 846 375 B1 offenbart ein Verfahren und eine Vorrichtung zum skalierbaren Codieren von Audiosignalen. Ein Audiosignal wird mittels eines ersten Codierers codiert, um den Bitstrom für den ersten Codierer zu erhalten. Dieses Signal wird dann wieder decodiert, und zwar mit einem an den ersten Codierer angepaßten Decodierer. Das Decodiererausgangssignal wird zusammen mit dem verzögerten ursprünglichen Audiosignal einer Differenzstufe zugeführt, um ein Differenzsignal zu erzeugen. Dieses Differenzsignal wird mit dem ursprünglichen Audiosignal bandweise verglichen, um für spektrale Bänder festzustellen, ob die Energie des Differenzsignals größer als die Energie des Audiosignals ist. Ist dies der Fall, so wird das ursprüngliche Audiosignal einem zweiten Codierer zugeführt, während dann, wenn die Energie des Differenzsignals kleiner als die Energie des ursprünglichen Audiosignals ist, das Differenzsignal dem zweiten Codierer zugeführt wird. Der zweite Codierer ist ein Transformationscodierer, der auf der Basis eines psychoakustischen Modells arbeitet. Der ausgangsseitige Bitstrom des zweiten Codierers wird ebenso wie der Bitstrom des ersten Codierers in einen Bitstrommultiplexer eingespeist, der einen sogenannten skalieren ausgangsseitigen Bitstrom liefert. Skalierbarkeit bedeutet in diesem Zusammenhang, daß ein Decodierer je nach Ausführung in der Lage ist, entweder decodiererseitig aus dem Bitstrom nur den Bitstrom des ersten Codierers zu extrahieren, oder sowohl den Bitstrom des ersten Codierers als auch den Bitstrom des zweiten Codierers zu extrahieren, um im ersteren Fall eine niederqualitative Wiedergabe zu erreichen, und um im zweiten Fall eine hochqualitative Wiedergabe des ursprünglichen Audiosignals zu erreichen.
  • Ein typischerweise Transformations-basierter Codierer ist in 4a dargestellt. Das Audiosignal wird einer Analyse-Filterbank 400 zugeführt, die aus dem Strom von Abtastwerten an ihrem Eingang mittels Blockbildung bzw. Fensterung einen Block mit einer bestimmten Anzahl von Abtastwerten des Audiosignals bildet und in eine spektrale Darstellung umsetzt. Die am Ausgang der Analyse-Filterbank erzeugten Spektralkoeffizienten bzw. Subband-Signale werden quantisiert. Die Quantisierer-Schrittweite wird von unterschiedlichen Faktoren abhängen. Ein wesentlicher Faktor ist eine psychoakustische Maskierungsschwelle, die durch ein psychoakustisches Modell 402 aus dem ursprünglichen Audiosignal berechnet wird. Der Quantisierer in einem Block „Quantisie rung und Codierung 404" wird immer versuchen, so grob als möglich zu quantisieren, um eine gute Kompression zu erreichen. Andererseits wird er jedoch ebenfalls versuchen, so fein als nötig zu quantisieren, derart, daß das durch die Quantisierung eingeführte Quantisierungsrauschen unterhalb der durch den Block 402 bereitgestellten psychoakustischen Maskierungsschwelle liegt, wie es in der Technik bekannt ist. Die derart quantisierten Spektralwerte werden dann einer Entropie-Codierung unterzogen, wobei als Entropie-Codierung typischerweise eine Huffman-Codierung eingesetzt wird, die typischerweise mit vordefinierten Huffman-Codebooks bzw. Huffman-Codetabellen arbeitet. Am Ausgang des Blocks 404 liegen dann Entropie-codierte quantisierte Spektralwerte an, die zusammen mit für die Decodierung nötigen Seiteninformationen mittels eines Blocks 406 in einen Bitstrom 408 geschrieben werden, wobei dieser Bitstrom gespeichert oder je nach Anwendungsfall über einen Übertragungskanal zu einem Decodierer übertragen werden kann, der in 4b dargestellt ist. Der Decodierer umfaßt zunächst einen Block 410 zum Lesen des Bitstroms, um einerseits die Seiteninformationen und andererseits die Entropie-codierten quantisierten Spektralwerte aus dem Bitstrom zu extrahieren. Die Entropie-codierten quantisierten Spektralwerte werden dann zunächst einer Entropie-Decodierung und dann einer inversen Quantisierung zugeführt, um invers quantisierte Spektralwerte zu erhalten (Block 412), die dann mittels einer an die Analyse-Filterbank 400 von 4a angepaßte Synthese-Filterbank 414 geliefert werden, um ausgangsseitig ein zeitdiskretes decodiertes Audiosignal zu erhalten. Dieses zeitdiskrete Audiosignal am Ausgang der Synthese-Filterbank kann dann nach entsprechender Interpolation und Digital/Analog-Wandlung und gegebenenfalls Verstärkung einem Lautsprecher zugeführt und dadurch hörbar gemacht werden.
  • Block-basierte Codierer/Decodierer, wie sie bei dem in 4a und 4b gezeigten bekannten Szenario zum Einsatz kommen, basieren darauf, daß typischerweise ein Block von Abtastwerten, wie beispielsweise 1024 bzw. bei einer in der Technik bekannten MDCT mit Overlap and Add 2048 zeitdiskrete Abtastwerte des Audiosignals in den Spektralbereich umgesetzt werden. Auch bei weniger frequenzauflösenden Filterbanken, wie beispielsweise der SBR-Filterbank mit 64 Kanälen, wird ebenfalls immer ein Block von Abtastwerten mit einer bestimmten Anzahl von Abtastwerten verwendet und in eine spektrale Darstellung, nämlich hier die einzelnen Subbandsignale, umgesetzt. Die spektrale Darstellung wird dann, wie es ausgeführt worden ist, entsprechend quantisiert, und zwar typischerweise unter Zuhilfenahme eines psychoakustischen Modells, das auf in der Technik bekannte Art und Weise die psychoakustische Maskierungsschwelle berechnet.
  • Solche Transformationen haben inhärent eine bestimmte Zeit/Frequenz-Auflösung. Dies bedeutet, daß dann, wenn eine große Anzahl von Abtastwerten in einen Block eingefügt wird, eine auf diesen Block angewandte Transformation inhärent eine hohe Frequenzauflösung hat. Andererseits ist jedoch die Zeitauflösung entsprechend reduziert. Würde man zum Erhöhen der Zeitauflösung kürzere Abschnitte des Audiosignals in den Spektralbereich umsetzen, so hätte dies zur Folge, daß die Frequenzauflösung entsprechend leidet.
  • Problematisch ist also, daß man Audiosignale nur für sehr kurze Zeiträume als stationär ansehen kann. Es gibt durchaus kurzzeitige starke Energieanstiege, die Transienten genannt werden, während derer das Audiosignal nicht stationär ist.
  • Um diesem Problem der Zeit/Frequenzauflösung zu begegnen, wird beispielsweise beim AAC-Codierer (AAC = Advanced Audio Coding) eine Blockumschaltung verwendet, die von einem Transientendetektor gesteuert wird. Hier wird das zu codierende Audiosignal vor der Fensterung bzw. Blockbildung untersucht, um festzustellen, ob das Audiosignal eine derartige Transiente hat oder nicht. Wird eine Transiente fest gestellt, so werden kurze Blöcke zum Codieren verwendet. Wird dagegen ein Signalausschnitt ohne Transiente detektiert, so wird eine lange Blocklänge verwendet. Damit wird bei solchen gängigen Transformations-Codierverfahren eine Blockumschaltung zur Anpassung der Transformationslänge an das Signal eingesetzt. Besonders wenn es darum geht, niedrige Bitraten zu erzielen, werden gerne besonders lange Transformationslängen eingesetzt, da das Verhältnis der Seiteninformationen zu den Nutzinformationen typischerweise relativ unabhängig von der Blocklänge ist. Dies bedeutet, daß die Menge an Seiteninformationen unabhängig davon, ob ein Block eine große Anzahl von zeitlichen Abtastwerten des Audiosignals darstellt, oder ob ein Block kurz ist, also eine kleine Anzahl von Abtastwerten darstellt, im wesentlichen die gleiche ist. Daher wird es aus Gründen der Codiereffizienz angestrebt, immer möglichst hohe Blocklängen bzw. bei einem Transformationscodierer hohe Transformationslängen zu verwenden.
  • Andererseits muß für die Transientendetektion und Umschaltung auf kurze Fenster bei Auftreten von nicht-stationären Bereichen des Audiosignals ein Verarbeitungsaufwand in Kauf genommen werden, der dennoch dazu führt, daß das Signal in seiner codierten Form entweder nur mit guter Frequenzauflösung oder nur mit guter Zeitauflösung vorliegt.
  • Die Aufgabe der vorliegenden Erfindung besteht darin, ein verbessertes Konzept zum Codieren bzw. Decodieren zu schaffen, um eine höherqualitativere und dennoch effiziente Audiocodierung/Decodierung zu erreichen.
  • Diese Aufgabe wird durch eine Vorrichtung zum Codieren eines Audiosignals nach Patentanspruch 1, ein Verfahren zum Codieren eines Audiosignals nach Patentanspruch 10, eine Vorrichtung zum Decodieren eines codierten Audiosignals nach Patentanspruch 11, ein Verfahren zum Decodieren eines codierten Audiosignals nach Patentanspruch 13 oder ein Computer-Programm nach Patentanspruch 14 gelöst.
  • Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß eine gute Codierqualität sowohl guter Frequenzauflösung als auch guter Zeitauflösung dadurch erreicht wird, daß im Sinne des Konzepts der Skalierbarkeit ein erster Codierer eine erste Zeit/Frequenzauflösung hat, und daß ein zweiter Codierer eine zweite Zeit/Frequenzauflösung hat, die sich voneinander unterscheiden, so daß der erste Codierer das ursprüngliche Audiosignal mit einer bestimmten Auflösung codiert, und daß der zweite Codierer dann mit einer bestimmten anderen Auflösung bezüglich der Zeit bzw. Frequenz arbeitet, so daß zwei Datenströme erhalten werden, die zusammengenommen betrachtet sowohl eine gute Zeitauflösung als auch eine gute Frequenzauflösung darstellen.
  • Darüber hinaus wird als dem zweiten Codierer nicht das ursprüngliche Audiosignal zugeführt, sondern die Differenz zwischen dem ursprünglichen Audiosignal und dem codierten und wieder decodierten Ergebnis des ersten Codierers/Decodierers. Der Auflösungsfehler, den der erste Codierer gemacht hat, erscheint somit automatisch in dem Restsignal, das beispielsweise durch Differenzbildung erhalten wird, wobei dem Restsignal typischerweise Fehler anhaften werden, aufgrund beispielsweise der schlechten Zeitauflösung der ersten Codierer/Decodiererstrecke. Dagegen wird das Restsignal, da die erste Codierer/Decodierer-Strecke eine gute Frequenzauflösung hatte, kaum diesbezügliche Frequenzfehler anhaften. Damit kann ohne weiteres das Restsignal mit einem Codierer mit hoher Zeitauflösung (und damit entsprechend schlechter Frequenzauflösung codiert werden, um als zweites Codierausgangssignal ein Signal zu erhalten, das eine gute Zeitauflösung hat, jedoch eine schlechte Frequenzauflösung, was jedoch nichts macht, da das erste Codiererausgangssignal bereits eine gute Frequenzauflösung hat und somit die frequenzmäßig betrachtete Struktur des Audiosignals sehr gut wiedergibt.
  • Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung sind sowohl der erste Codierer als auch der zweite Codierer Transformationscodierer. Ferner wird es bevorzugt, den ersten Codierer mit einer hohen Frequenzauflösung (und damit einer schlechten Zeitauflösung), also mit einer hohen Transformationslänge zu betreiben, während der zweite Codierer mit einer hohen Zeitauflösung (und damit einer schlechten Frequenzauflösung) betrieben wird.
  • Erfindungsgemäß hat sich herausgestellt, daß in vielen Fällen Artefakte im Zeitbereich, also Artefakte aufgrund einer schlechten Zeitauflösung, eher akzeptiert werden als Artefakte im Frequenzbereich, also Artefakte aufgrund einer schlechten Frequenzauflösung. Daher wird es bevorzugt, den ersten Codierer mit einer hohen Frequenzauflösung zu betreiben, da dann von einem entsprechenden Decodierer lediglich das erste Codiererausgangssignal genügt, um eine einigermaßen gute Audioausgabe zu erreichen, was im Sinne des Konzepts der Skalierbarkeit liegt.
  • Erfindungsgemäß wird durch den zweiten Codierer die Qualität des ersten Codierverfahrens verbessert, indem eine Differenzbildung zwischen dem Ausgangssignal der ersten Codierer/Decodierer-Strecke und dem ursprünglichen Audiosignal genommen wird, und daß dann das dabei entstehende Restsignal mit dem zweiten Codierer codiert wird, der eine gute Zeitauflösung hat. Diese Codierung ist besonders günstig für das Restsignal, da es bereits wenig tonale Elemente umfaßt, da diese bereits sehr gut und effizient vom ersten Codierverfahren erfaßt worden sind.
  • Der wesentliche Mangel dieses Restsignals ist jedoch die schlechte Zeitauflösung, die sich in der Entstehung von Rauschen vor oder nach einem Transienten, also eines Vor-Echos oder Nachechos zeigt. Vorechos sind störender als Nachechos, da sie gut subjektiv wahrnehmbar sind. Dieses Rauschen ist gewissermaßen das Quantisierungsrauschen des Transienten und entspricht in seinem Spektralgehalt im we sentlichen dem des Transienten und ist somit nicht tonal. Durch die Verwendung des Transformations-Codierverfahrens mit kurzen Blöcken, also mit einer hohen Zeitauflösung, wird somit die Zeitauflösung auf effiziente Art und Weise erheblich verbessert.
  • Erfindungsgemäß wird somit ein Audio-Codierverfahren mit hoher und höchster Qualität erhalten, indem die Anteile des Audiosignals, die tonal oder eher tonal sind, mit einem frequenzselektiven Transformations-Codierverfahren mit langen Transformationslängen erfaßt werden, während ein nachgeschaltetes Codierverfahren mit kurzen Transformationslängen für das Restsignal eine hohe Zeitauflösung ermöglicht.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
  • 1 ein Blockschaltbild eines erfindungsgemäßen Codierkonzepts;
  • 2 ein Blockschaltbild eines erfindungsgemäßen Codierkonzepts gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung;
  • 3 ein Blockschaltbild eines erfindungsgemäßen Decodierkonzepts;
  • 4a einen bekannten Transformations-Codierer; und
  • 4b einen bekannten Transformations-Decodierer.
  • 1 zeigt eine Vorrichtung zum Codieren eines Audiosignals, das über einen Eingang 10 bereitgestellt wird. Das Audiosignal wird zunächst in einen ersten Codierer 12 mit einer ersten Zeit/Frequenz-Auflösung eingespeist. Der erste Codierer 12 ist ausgebildet, um ein erstes Codiererausgangssignal an einem Ausgang 14 zu erzeugen. Das erste Co diererausgangssignal an dem Ausgang 14 des ersten Codierers 12 wird einerseits einem Multiplexer 16 zugeführt, und andererseits einem Decodierer 18, der an den ersten Codierer angepaßt ist und das erste Codiererausgangssignal decodiert, um ein decodiertes Audiosignal an einem Ausgang 20 des Decodierers 18 zu liefern. Das decodierte Ausgangssignal 20 sowie das ursprüngliche Audiosignal 10 werden einem Vergleicher 22 zugeführt. Der Vergleicher 22 ist ausgebildet, um das Audiosignal an dem Eingang 10 mit dem decodierten Audiosignal am Ausgang 20, also nach der Strecke aus erstem Codierer 12 und dem Decodierer 18, zu vergleichen. Der Vergleicher 22 ist insbesondere ausgebildet, um ein Restsignal an einem Ausgang 24 desselben zu liefern, wobei das Restsignal einen Unterschied zwischen dem Audiosignal und dem decodierten Audiosignal umfaßt. Dieses Restsignal 24 wird einem zweiten Codierer 26 zugeführt, welcher ausgebildet ist, um das Restsignal an dem Ausgang 24 des Vergleichers 22 zu codieren, um ein zweites Codiererausgangssignal an einem Ausgang 28 zu liefern, das ebenfalls dem Multiplexer 16 zugeführt wird. Der Multiplexer 16 ist ausgebildet, um das erste Codiererausgangssignal und das zweite Codiererausgangssignal zu kombinieren und um aus denselben gegebenenfalls unter Berücksichtigung entsprechender Seiteninformationen und Bitstrom-Syntax-Konventionen ein codiertes Audiosignal an einem Ausgang 30 zu erzeugen.
  • Erfindungsgemäß hat der erste Codierer eine erste zeitliche oder frequenzmäßige Auflösung, und hat der zweite Codierer eine zweite zeitliche oder frequenzmäßige Auflösung. Gemäß der vorliegenden Erfindung unterscheiden sich die erste Auflösung des ersten Codierers und die zweite Auflösung des zweiten Codierers, so daß das erste Codiererausgangssignal entweder zeitlich oder frequenzmäßig gut codiert ist, und daß das zweite Codiererausgangssignal frequenzmäßig bzw. zeitlich gut codiert ist, dahingehend, daß das codierte Audiosignal am Ausgang des Multiplexers 16 sowohl eine hohe zeitliche Auflösung als auch eine hohe Frequenzauflösung hat.
  • Nachfolgend ist anhand von 2 ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung dargestellt. Hierbei wird das Audiosignal 10, bevor es dem Vergleicher 22 zugeführt wird, der in 2 als Differenzglied dargestellt ist, einer Verzögerung durch ein Verzögerungsglied 32 unterzogen, so daß bei dem in 2 gezeigten bevorzugten Ausführungsbeispiel eine abtastwertweise Differenzbildung durch das Differenz-Glied 22 zwischen dem decodierten Audiosignal am Ausgang des Decoders 18 und dem (verzögerten) Audiosignal am Ausgang des Verzögerungsglieds 32 in Echtzeit durchgeführt werden kann.
  • Bei dem in 2 gezeigten Ausführungsbeispiel sind ferner der erste Codier, also der Encoder 12 in 2, und der zweite Codierer 26, der in 2 mit Differenz-Encoder bezeichnet ist, ausgebildet, um eine Transformations-Codierung durchzuführen.
  • Ferner wird es bevorzugt, daß der erste Codierer 12 eine Codierung mit langen Transformationslängen, also einer hohen Frequenzauflösung und damit einhergehend einer niedrigen Zeitauflösung durchführt, während der zweite Codierer 26 eine Codierung mit kurzen Transformationslängen durchführt, also mit einer hohen Zeitauflösung und inhärent damit einhergehend niedrigen Frequenzauflösung.
  • Obgleich prinzipiell auch der erste Codierer mit kurzen Transformationslängen und der Differenzcodierer mit langen Transformationslängen arbeiten könnte, wird es dennoch bevorzugt, den ersten Codierer mit langen Transformationslängen laufen zu lassen, da, wie es bereits ausgeführt worden ist, für einen Zuhörer Zeitartefakte eher weniger problematisch sind als Frequenzartefakte. Daher wird ein Codierer, der nur das erste Codiererausgangssignal am Ausgang 14, nicht aber das zweite Codiererausgangssignal am Ausgang 28 verarbeiten kann, dann, wenn der erste Codierer mit langen Transformationslängen arbeitet, eine angenehmere Wiedergabe erzeugen als wenn der erste Codierer mit kurzen Transformationslängen arbeiten würde.
  • Als Transformationsalgorithmus innerhalb des ersten Codierers und/oder des zweiten Codierers von 2 kann jede beliebige Einrichtung zum Umsetzen eines Blocks von zeitlichen Abtastwerten in eine spektrale Darstellung verwendet werden, wie beispielsweise eine Fourier-Transformation, eine diskrete Fourier-Transformation, eine schnelle Fourier-Transformation, eine diskrete Cosinustransformation, eine modifizierte diskrete Cosinustransformation etc. Alternativ kann jedoch auch eine Filterbank mit einer kleineren Anzahl von Kanälen eingesetzt werden, wie z. B. eine 64-Kanal-Filterbank, eine 128-Kanal-Filterbank oder eine Filterbank mit mehr oder weniger Kanälen.
  • Bei einem anderen Ausführungsbeispiel der vorliegenden Erfindung kann der erste Encoder 12 ein SBR-Encoder sein, der ausgebildet ist, um ein erstes Codiererausgangssignal zu liefern, das nur Informationen bis zu einer Grenzfrequenz umfaßt, die kleiner als die Grenzfrequenz des Audiosignals am Audioeingang 10 ist. Typische SBR-Encoder extrahieren aus dem Audiosignal Seiteninformationen, die zur Hochfrequenz-Rekonstruktion in einem SBR-Decoder eingesetzt werden können, um das hohe Band, also das Band des Audiosignals oberhalb der Grenzfrequenz des ersten Codiererausgangssignals, möglichst hochqualitativ zu rekonstruieren. Der Decodierer 18 in 2 ist jedoch hier kein solcher SBR-Decodierer mit Hochfrequenzrekonstruktion, sondern ein üblicher Transformations-Decodierer, der an den ersten Codierer 12 angepaßt ist, um das Codiererausgangssignal unabhängig davon, daß dasselbe Band begrenzt ist, einfach zu decodieren, so daß das Ausgangssignal des Decodierers 18 am Ausgang 20 ebenfalls eine niedrigere Grenzfrequenz hat als das ursprüngliche Audiosignal.
  • In diesem Fall würde das Restsignal bis zur Grenzfrequenz den Codier/Decodier-Fehler der Strecke aus Encoder 12 und Decoder 18 umfassen, würde jedoch oberhalb der Grenzfrequenz das komplette Audiosignal sein.
  • In diesem Fall kann das Restsignal, da es oberhalb der Grenzfrequenz des ersten Codiererausgangssignals mit dem ursprünglichen Audiosignal übereinstimmt, entweder ebenfalls mit dem Differenz-Codierer 16 codiert werden, der kurze Transformationslängen verwendet. Alternativ könnte jedoch nur der Spektralbereich des Restsignals bis zur Grenzfrequenz des ersten Codiererausgangssignals mit dem Differenz-Codierer 26 codiert werden, während der hochfrequente Anteil des Restsignals wieder mit dem ersten Codierer 12 mit den langen Transformationslängen codiert wird, um auch im hochfrequenten Teil des Audiosignals eine hohe Frequenzauflösung zu erreichen.
  • Das Ausgangssignal des Codierers 12 für das hochfrequente Band kann nun wieder mit dem entsprechenden Band des ursprünglichen Audiosignals verglichen werden, um das Differenzsignal wieder mit dem Differenzcodierer 26 zu codieren, so daß am Ende vier Datenströme dem Multiplexer 16 zugeführt werden, die, wenn sie alle zusammen decodiert werden, eine transparente Wiedergabe, d. h. eine Wiedergabe ohne Artefakte, ermöglichen.
  • Erfindungsgemäß ist es nicht wesentlich, daß der erste Codierer und der zweite Codierer unter Verwendung eines psychoakustischen Modells arbeiten. Aus Dateneffizienzgründen wird es jedoch bevorzugt, daß zumindest der erste Codierer 12 unter Verwendung eines psychoakustischen Modells arbeitet. Je nach Ressourcen könnte der zweite Codierer dann verlustlos codieren, wenn die entsprechenden Übertragungskanalressourcen vorhanden sind, so daß eine vollständig transparente Wiedergabe erreicht wird. Alternativ könnte jedoch auch der zweite Codierer unter Verwendung eines psychoakustischen Modells arbeiten, wobei es bevorzugt wird, daß in diesem Fall für den zweiten Codierer das psychoakustische Modell nicht noch einmal komplett berechnet wird, sondern zumindest Teile desselben bzw. die gesamte psychoakustische Maskierungsschwelle unter Berücksichtigung der unterschiedlichen Transformationslängen von dem ersten Codierer zu dem zweiten Codierer gewissermaßen „wieder verwendet" werden kann. Dies kann z. B. dadurch geschehen, daß die von dem ersten Codierer berechnete psychoakustische Maskierungsschwelle unmittelbar für den zweiten Codierer genommen wird, wobei jedoch zur Berücksichtigung der kürzeren Transformationslängen des zweiten Codierers z. B. einen „Sicherheitsaufschlag" von beispielsweise 3 dB verwendet wird, derart, daß die psychoakustische Maskierungsschwelle für den zweiten Codierer z. B. um 3 dB oder einen anderen vorbestimmten Betrag kleiner als die psychoakustische Maskierungsschwelle für den ersten Codierer 12 ist.
  • Im Hinblick auf die Transformationslängen wird es bevorzugt, daß die Transformationslänge des ersten Codierers ein ganzzahliges Vielfaches der Transformationslänge des zweiten Codierers ist. So kann die Transformationslänge des ersten Codierers beispielsweise doppelt so viele, dreimal so viele, viermal so viele oder fünfmal so viele Abtastwerte des Audiosignals umfassen als die Transformationslänge des zweiten Codierers 26. Diese ganzzahlige Relation zwischen den Transformationslängen des ersten und des zweiten Codierers wird deswegen bevorzugt, da dann eine relativ gute Wiederverwendung von Codiererdaten des ersten Codierers für den zweiten Codierer möglich sind. Andererseits wäre jedoch auch ein nicht-ganzzahliger Zusammenhang zwischen den Transformationslängen unproblematisch, da der erste Codierer 12 und der zweite Codierer 26 auch nicht synchronisiert zueinander laufen können, sofern dies einem Decodierer entsprechend mitgeteilt wird, damit derselbe mit den richtigen Abtastwerten die Aufsummation durchführt, also das Inverse der abtastwertweisen Differenzbildung im Element 22 von 2.
  • 3 zeigt einen Decodierer zum Decodieren eines codierten Audiosignals gemäß der vorliegenden Erfindung. Das codierte Audiosignal, das an dem Ausgang 30 von 1 bzw. 2 ausgegeben wird, wird nach Übertragung, Speicherung, etc. einem Eingang 40 des Decodierers in 3 zugeführt. Der Eingang 40 ist zunächst mit einem Extraktor 42 gekoppelt, der die Funktionalität eines Bitstrom-Demultiplexers aufweist, um aus dem codierten Audiosignal zunächst das erste Codiererausgangssignal zu extrahieren und an einem Ausgang 44 bereitzustellen, und der ferner ausgebildet ist, um das codierte Restsignal, bzw. das Differenzsignal bzw. das zweite Codiererausgangssignal an einem Ausgang 46 bereitzustellen. Das erste Codiererausgangssignal wird einem ersten Decodierer zugeführt, der an den ersten Codierer 12 der in 1 gezeigten erfindungsgemäßen Vorrichtung zum Codieren angepaßt ist und prinzipiell mit dem Decodierer 18 von 1 identisch sein kann. Dies bedeutet, daß der erste Decodierer 48 wieder dieselbe Zeit/Frequenz-Auflösung hat, also mit derselben beispielsweise Transformationslänge arbeitet wie der Codierer 12 von 1. Das zweite Codiererausgangssignal am Ausgang 46 des Extraktors wird einem zweiten Decodierer 50 zugeführt, der an den zweiten Codierer 26 von 1 angepaßt ist und damit die zweite Zeit/Frequenz-Auflösung hat, also eine Zeit/Frequenz-Auflösung, die zu der Zeit-Frequenz-Auflösung des zweiten Codierers 26 in 1 identisch ist.
  • Der erste Decodierer 48 liefert ausgangsseitig das decodierte Audiosignal, das mit dem Signal am Ausgang 20 von 2 identisch sein kann. Analog hierzu liefert der zweite Decodierer 50 an seinem Ausgang das decodierte Restsignal. Es sei darauf hingewiesen, daß beide Decodierer prinzipiell so ausgebildet sein können, wie es anhand von 4b dargestellt worden ist, wobei sich dieselben jedoch im Hinblick auf ihre Transformationslängen und damit auf die verwendeten Synthese-Filterbanken unterscheiden werden.
  • Sowohl das decodierte Audiosignal am Ausgang 52 in 3 als auch das decodierte Restsignal am Ausgang 54 von 3 werden einem Kombinierer 56 zugeführt, der bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung eine abtastwertweise Summation durchführt, also allgemein gesagt eine Operation, die invers zu der Vergleichsoperation ist, die im Codierer im Element 22 von 1 durchgeführt worden ist. Der Kombinierer 56 liefert ausgangsseitig an einem Ausgang 58 der Decodiervorrichtung von 3 ein Ausgangssignal, das sich nun aufgrund der vorliegenden Erfindung sowohl durch eine gute Zeitauflösung als auch durch eine gute Frequenzauflösung auszeichnet, das also sowohl wenig Frequenzartefakte als auch wenig Zeitartefakte umfaßt.
  • Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Codieren, wie es anhand von 1 dargestellt worden ist, oder kann das erfindungsgemäße Verfahren zum Decodieren, wie es anhand von 3 dargestellt worden ist, in Hardware oder in Software implementiert werden. Die Implementierung kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, daß das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.

Claims (14)

  1. Vorrichtung zum Codieren eines Audiosignals, mit folgenden Merkmalen: einem ersten Codierer (12) zum Erzeugen eines ersten Codiererausgangssignals aus dem Audiosignal; einem Decodierer (18), der an den ersten Codierer (12) angepaßt ist, zum Decodieren des ersten Codiererausgangssignals, um ein decodiertes Audiosignal zu liefern; einem Vergleicher (22) zum Vergleichen des Audiosignals mit dem decodierten Audiosignal, wobei der Vergleicher (22) ausgebildet ist, um ein Restsignal zu liefern, wobei das Restsignal einen Unterschied zwischen dem Audiosignal und dem decodierten Audiosignal umfaßt; einem zweiten Codierer (26) zum Codieren des Restsignals, um ein zweites Codiererausgangssignal zu liefern; und einem Multiplexer (16) zum Verbinden des ersten Codiererausgangssignals und des zweiten Codiererausgangssignals, um ein codiertes Audiosignal zu erhalten, wobei der erste Codierer (12) eine erste zeitliche oder frequenzmäßige Auflösung hat, wobei der zweite Codierer (26) eine zweite zeitliche oder frequenzmäßige Auflösung hat, und wobei sich die erste Auflösung von der zweiten Auflösung unterscheidet.
  2. Vorrichtung nach Anspruch 1, bei der der erste Codierer (12) ausgebildet ist, um als erste Auflösung eine hohe frequenzmäßige Auflösung und eine niedrige zeitliche Auflösung zu haben, und bei der zweite Codierer (26) ausgebildet ist, um als zweite Auflösung eine niedrige frequenzmäßige und eine hohe zeitliche Auflösung zu haben.
  3. Vorrichtung nach Anspruch 1 oder 2, bei der der erste Codierer (12) ein Transformationscodierer ist, der ausgebildet ist, um einen Block mit einer ersten Anzahl von zeitlichen Abtastwerten des Audiosignals in eine spektrale Darstellung umzusetzen, bei der der zweite Codierer (26) ein Transformationscodierer ist, der ausgebildet ist, um einen Block mit einer zweiten Anzahl von zeitlichen Abtastwerten des Restsignals in eine spektrale Darstellung umzusetzen, und bei der sich die erste Anzahl von der zweiten Anzahl unterscheidet.
  4. Vorrichtung nach Anspruch 3, bei der die erste Anzahl größer als die zweite Anzahl ist.
  5. Vorrichtung nach Anspruch 3 oder 4, bei der der erste Codierer (12) und der zweite Codierer (26) eine Filterbank oder einen Transformationsalgorithmus aufweisen, der eine Fourier-Transformation, eine diskrete Fourier-Transformation, eine schnelle Fourier-Transformation, eine diskrete Cosinus-Transformation oder eine modifizierte diskrete Cosinus-Transformation umfaßt.
  6. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der Decodierer (18) ausgebildet ist, um ein zeitdiskretes decodiertes Audiosignal mit eine Folge von Abtastwerten zu liefern, bei der das Audiosignal ein zeitdiskretes Audiosignal mit einer Folge von Abtastwerten ist, und bei der der Vergleicher (22) ausgebildet ist, um eine abtastwertweise Differenzbildung durchzuführen, um das Restsignal zu erhalten.
  7. Vorrichtung nach einem der vorhergehenden Ansprüche, die ferner folgendes Merkmal aufweist: ein Verzögerungsglied (32) zum Verzögern des Audiosignals, wobei das Verzögerungsglied (32) ausgebildet ist, um eine Verzögerung zu haben, die von einer dem ersten Codierer (12) und dem Decodierer (18) zugehörigen Verzögerung abhängt.
  8. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der Multiplexer (16) ausgebildet ist, um das codierte Audiosignal so zu erzeugen, daß das erste Codierausgangssignal unabhängig von dem zweiten Codiererausgangssignal decodierbar ist.
  9. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der erste Codierer (12) ausgebildet ist, um das Audiosignal einer Bandbegrenzung zu unterziehen, so daß das erste Codiererausgangssignal eine obere Grenzfrequenz hat, die kleiner als eine obere Grenzfrequenz des Audiosignals ist, bei der der Vergleicher (22) ein Restsignal liefert, das oberhalb der oberen Grenzfrequenz des ersten Codiererausgangssignals dem Audiosignal entspricht, und bei der der zweite Codierer (26) ausgebildet ist, um einen Anteil des Restsignals oberhalb der oberen Grenzfrequenz des ersten Codierers mit einer zeitlichen oder frequenzmäßige Auflösung zu codieren, die ungleich der zweiten Auflösung oder gleich der zweiten Auflösung ist.
  10. Verfahren zum Codieren eines Audiosignals, mit folgenden Schritten: Erzeugen (12) eines ersten Codiererausgangssignals mit einer ersten zeitlichen oder frequenzmäßigen Auflösung aus dem Audiosignal; Decodieren des ersten Codiererausgangssignals, um ein decodiertes Audiosignal zu liefern; Vergleichen (22) des Audiosignals mit dem decodierten Audiosignal, um ein Restsignal zu liefern, wobei das Restsignal einen Unterschied zwischen dem Audiosignal und dem decodierten Audiosignal umfaßt; Codieren (26) des Restsignals mit einer zweiten zeitlichen oder frequenzmäßigen Auflösung, um ein zweites Codiererausgangssignal zu liefern; und Verbinden (16) des ersten Codiererausgangssignals und des zweiten Codiererausgangssignals, um ein codiertes Audiosignal zu erhalten, wobei sich die erste Auflösung von der zweiten Auflösung unterscheidet.
  11. Vorrichtung zum Decodieren eines codierten Audiosignals, um ein Ausgangssignal zu erhalten, wobei das codierte Audiosignal ein erstes Codiererausgangssignal aufweist, das mit einer ersten zeitlichen oder frequenzmäßigen Auflösung codiert ist, und wobei das co dierte Audiosignal ferner ein zweites Codiererausgangssignal aufweist, das ein mit einer zweiten zeitlichen oder frequenzmäßigen Auflösung codiertes Restsignal darstellt, das einen Unterschied zwischen einem ursprünglichen Audiosignal und einem decodierten Audiosignal darstellt, wobei das decodierte Audiosignal durch Decodieren des ersten Codiererausgangssignals erhaltbar ist, mit folgenden Merkmalen: einem Extraktor (42) zum Extrahieren des ersten Codiererausgangssignals und des zweiten Codiererausgangssignals aus dem codierten Audiosignal; einem ersten Decodierer (48) zum Decodieren des ersten Codiererausgangssignals, um das decodierte Audiosignal zu erhalten, wobei der erste Decodierer (48) ausgebildet ist, um mit der ersten zeitlichen oder frequenzmäßigen Auflösung zu arbeiten; einem zweiten Decodierer (50) zum Decodieren des zweiten Codiererausgangssignals, um ein decodiertes Restsignal zu erhalten, wobei der zweite Decodierer ausgebildet ist, um mit der zweiten zeitlichen oder frequenzmäßigen Auflösung zu arbeiten, wobei sich die zweite Auflösung von der ersten Auflösung unterscheidet; und einem Kombinierer (56) zum Kombinieren des decodierten Audiosignals und des decodierten Restsignals, um das Ausgangssignal zu erhalten.
  12. Vorrichtung nach Anspruch 11, bei der der erste Decodierer ein Transformationsdecodierer ist, der ausgebildet ist, um einen Block mit einer ersten Anzahl von Spektralwerten in eine zeitliche Darstellung umzusetzen, bei der der zweite Decodierer ein Transformationsdecodierer ist, der ausgebildet ist, um einen Block mit einer zweiten Anzahl von Spektralwerten des Restsignals in eine zeitliche Darstellung umzusetzen, und bei der sich die erste Anzahl von der zweiten Anzahl unterscheidet.
  13. Verfahren zum Decodieren eines codierten Audiosignals, um ein Ausgangssignal zu erhalten, wobei das codierte Audiosignal ein erstes Codiererausgangssignal aufweist, das mit einer ersten zeitlichen oder frequenzmäßigen Auflösung codiert ist, und wobei das codierte Audiosignal ferner ein zweites Codiererausgangssignal aufweist, das ein mit einer zweiten zeitlichen oder frequenzmäßigen Auflösung codiertes Restsignal darstellt, das einen Unterschied zwischen einem ursprünglichen Audiosignal und einem decodierten Audiosignal darstellt, wobei das decodierte Audiosignal durch Decodieren des ersten Codiererausgangssignals erhaltbar ist, mit folgenden Schritten: Extrahieren (42) des ersten Codiererausgangssignals und des zweiten Codiererausgangssignals aus dem codierten Audiosignal; Decodieren (48) des ersten Codiererausgangssignals mit der ersten zeitlichen oder frequenzmäßigen Auflösung, um das decodierte Audiosignal zu erhalten; Decodieren (50) des zweiten Codiererausgangssignals mit der zweiten zeitlichen oder frequenzmäßigen Auflösung, um ein decodiertes Restsignal zu erhalten, wobei sich die zweite Auflösung von der ersten Auflösung unterscheidet; und Kombinieren (56) des decodierten Audiosignals und des decodierten Restsignals, um das Ausgangssignal zu erhalten.
  14. Computer-Programm mit einem Programmcode zum Durchführen des Verfahrens nach Anspruch 10 oder Anspruch 13, wenn das Programm auf einem Computer abläuft.
DE10328777A 2003-06-25 2003-06-25 Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals Withdrawn DE10328777A1 (de)

Priority Applications (8)

Application Number Priority Date Filing Date Title
DE10328777A DE10328777A1 (de) 2003-06-25 2003-06-25 Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
PCT/EP2004/006850 WO2005001813A1 (en) 2003-06-25 2004-06-24 Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal
DE602004005197T DE602004005197T2 (de) 2003-06-25 2004-06-24 Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
JP2006516049A JP2009513992A (ja) 2003-06-25 2004-06-24 オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法
CN200480017095.2A CN1809872B (zh) 2003-06-25 2004-06-24 编码音频信号的设备和方法及解码已编码音频信号的设备和方法
EP04740263A EP1636791B1 (de) 2003-06-25 2004-06-24 Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
US11/317,521 US7275031B2 (en) 2003-06-25 2005-12-22 Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal
HK06105737A HK1083664A1 (en) 2003-06-25 2006-05-17 Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10328777A DE10328777A1 (de) 2003-06-25 2003-06-25 Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals

Publications (1)

Publication Number Publication Date
DE10328777A1 true DE10328777A1 (de) 2005-01-27

Family

ID=33546670

Family Applications (2)

Application Number Title Priority Date Filing Date
DE10328777A Withdrawn DE10328777A1 (de) 2003-06-25 2003-06-25 Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
DE602004005197T Expired - Lifetime DE602004005197T2 (de) 2003-06-25 2004-06-24 Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE602004005197T Expired - Lifetime DE602004005197T2 (de) 2003-06-25 2004-06-24 Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals

Country Status (7)

Country Link
US (1) US7275031B2 (de)
EP (1) EP1636791B1 (de)
JP (1) JP2009513992A (de)
CN (1) CN1809872B (de)
DE (2) DE10328777A1 (de)
HK (1) HK1083664A1 (de)
WO (1) WO2005001813A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4303872A1 (de) * 2022-07-07 2024-01-10 Technische Universität München Kodierungsvorrichtung und kodierungsverfahren zur mehrkanalkodierung von vibrotaktilen signalen sowie dekodierung und dekodierungsverfahren

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7539870B2 (en) * 2004-02-10 2009-05-26 Microsoft Corporation Media watermarking by biasing randomized statistics
EP1792306B1 (de) * 2004-09-17 2013-03-13 Koninklijke Philips Electronics N.V. Kombinierte audiokodierung zur minimierung von perzeptueller verzerrung
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
ATE521143T1 (de) 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
ATE442645T1 (de) 2006-02-06 2009-09-15 France Telecom Verfahren und vorrichtung zur hierarchischen kodierung eines quelltonsignals sowie entsprechendes decodierverfahren und gerät, programme und signal
EP1855271A1 (de) * 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Verfahren und Vorrichtung zur Wiederkodierung von Signalen
GB2443911A (en) * 2006-11-06 2008-05-21 Matsushita Electric Ind Co Ltd Reducing power consumption in digital broadcast receivers
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
EP3712888B1 (de) * 2007-03-30 2024-05-08 Electronics and Telecommunications Research Institute Verfahren und vorrichtungen zur codierung und decodierung von multiobjektaudiosignal mit multikanal
EP2015293A1 (de) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen über adaptiv geschaltete temporäre Auflösung in einer Spektraldomäne
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
RU2452043C2 (ru) * 2007-10-17 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудиокодирование с использованием понижающего микширования
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
CN101527138B (zh) * 2008-03-05 2011-12-28 华为技术有限公司 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
EP2139000B1 (de) * 2008-06-25 2011-05-25 Thomson Licensing Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprache bzw. Nicht-Sprache-Audioeingabesignalen
EP4224471B1 (de) 2008-07-11 2024-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierer und audiodecodierer
CN101729198B (zh) * 2008-10-27 2014-04-02 华为技术有限公司 一种编解码方法、装置及系统
RU2523035C2 (ru) * 2008-12-15 2014-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудио кодер и декодер, увеличивающий полосу частот
WO2010069885A1 (en) 2008-12-15 2010-06-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and bandwidth extension decoder
ES2906085T3 (es) 2009-10-21 2022-04-13 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
WO2011087061A1 (ja) 2010-01-15 2011-07-21 三菱化学株式会社 単結晶基板、それを用いて得られるiii族窒化物結晶及びiii族窒化物結晶の製造方法
CN102263771B (zh) * 2010-05-26 2014-03-19 中国移动通信集团公司 移动终端、适配器及多媒体数据的播放方法和系统
KR102296955B1 (ko) 2010-07-02 2021-09-01 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
CN106409299B (zh) 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
EP2688066A1 (de) * 2012-07-16 2014-01-22 Thomson Licensing Verfahren und Vorrichtung zur Codierung von Mehrkanal-HOA-Audiosignalen zur Rauschreduzierung sowie Verfahren und Vorrichtung zur Decodierung von Mehrkanal-HOA-Audiosignalen zur Rauschreduzierung
BR122021009025B1 (pt) * 2013-04-05 2022-08-30 Dolby International Ab Método de decodificação para decodificar dois sinais de áudio e decodificador para decodificar dois sinais de áudio
EP2980794A1 (de) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierer und -decodierer mit einem Frequenzdomänenprozessor und Zeitdomänenprozessor
WO2019089341A1 (en) * 2017-11-02 2019-05-09 Bose Corporation Low latency audio distribution
CN111444382B (zh) * 2020-03-30 2021-08-17 腾讯科技(深圳)有限公司 一种音频处理方法、装置、计算机设备以及存储介质
CN112104952B (zh) * 2020-11-19 2021-05-11 首望体验科技文化有限公司 应用于720度球幕全景影院的全景声音频系统
US12104955B2 (en) * 2021-03-01 2024-10-01 The Boeing Company Device to process sample using a time-windowed transform function to generate spectral data and to use combined magnitude and phase spectrograms

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998057436A2 (en) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Source coding enhancement using spectral-band replication
EP0846375B1 (de) * 1995-10-06 1999-08-25 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Verfahren und vorrichtung zur skalierbaren codierung von audiosignalen

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143735A (ja) * 1988-11-25 1990-06-01 Victor Co Of Japan Ltd 音声多段符号化伝送方式
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5732391A (en) * 1994-03-09 1998-03-24 Motorola, Inc. Method and apparatus of reducing processing steps in an audio compression system using psychoacoustic parameters
JPH07261799A (ja) * 1994-03-18 1995-10-13 Pioneer Electron Corp 直交変換符号化装置及び方法
JP3186413B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
DE19743662A1 (de) * 1997-10-02 1999-04-08 Bosch Gmbh Robert Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
JP2003510643A (ja) * 1999-09-20 2003-03-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号を補正する処理回路、受信機、通信システム、携帯装置、及びその方法
US6377916B1 (en) * 1999-11-29 2002-04-23 Digital Voice Systems, Inc. Multiband harmonic transform coder
JP3609323B2 (ja) * 2000-05-08 2005-01-12 日本電信電話株式会社 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
DE10102159C2 (de) 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0846375B1 (de) * 1995-10-06 1999-08-25 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Verfahren und vorrichtung zur skalierbaren codierung von audiosignalen
WO1998057436A2 (en) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Source coding enhancement using spectral-band replication

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GRILL,B., BRANDENBURG,K.: A two-or three-stage bit rate scalable audio coding system. In: Proceeding AES, 99th Convention 1995 October 6-9, New York, Nr.4132
GRILL,B., BRANDENBURG,K.: A two-or three-stage bitrate scalable audio coding system. In: Proceeding AES, 99th Convention 1995 October 6-9, New York, Nr.4132 *
PURNHAGEN,H.: Der MPEG-4-Audio-Standart - Ein Überblick. In: Rundfunktechnische Mitteilungen, Heft 2, Jg.44, 2000, S.37-47 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4303872A1 (de) * 2022-07-07 2024-01-10 Technische Universität München Kodierungsvorrichtung und kodierungsverfahren zur mehrkanalkodierung von vibrotaktilen signalen sowie dekodierung und dekodierungsverfahren

Also Published As

Publication number Publication date
EP1636791B1 (de) 2007-03-07
EP1636791A1 (de) 2006-03-22
DE602004005197T2 (de) 2007-06-28
CN1809872A (zh) 2006-07-26
DE602004005197D1 (de) 2007-04-19
WO2005001813A1 (en) 2005-01-06
US7275031B2 (en) 2007-09-25
US20060167683A1 (en) 2006-07-27
CN1809872B (zh) 2010-06-02
HK1083664A1 (en) 2006-07-07
JP2009513992A (ja) 2009-04-02

Similar Documents

Publication Publication Date Title
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
DE60214599T2 (de) Skalierbare audiokodierung
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE19730129C2 (de) Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE60117471T2 (de) Breitband-signalübertragungssystem
DE19537338C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE60225276T2 (de) Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm
EP1495464B1 (de) Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten
DE69732761T2 (de) Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE102006051673A1 (de) Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
DE60311334T2 (de) Verfahren und Vorrichtung zur Kodierung und Dekodierung eines digitalen Informationssignals
WO1999017587A1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
DE60112407T2 (de) Verfahren und vorrichtung zur konvertierung eines audiosignals zwischen unterschiedlichen datenkompressionsformaten
DE102007029381A1 (de) Digitalsignal-Verarbeitungsvorrichtung, Digitalsignal-Verarbeitungsverfahren, Digitalsignal-Verarbeitungsprogramm, Digitalsignal-Wiedergabevorrichtung und Digitalsignal-Wiedergabeverfahren
DE602004009926T2 (de) Vorrichtung und verfahren zum einbetten eines wasserzeichens unter verwendung von subbandfilterung
DE19742201C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE19829284C2 (de) Verfahren und Vorrichtung zum Verarbeiten eines zeitlichen Stereosignals und Verfahren und Vorrichtung zum Decodieren eines unter Verwendung einer Prädiktion über der Frequenz codierten Audiobitstroms
DE69803457T2 (de) Audiokodierer
DE4209382C1 (de)
EP1028539B1 (de) Verfahren zum Transkodieren eines Audiodatenstroms
DE10119980C1 (de) Verfahren zur Codierung von Audiodaten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8130 Withdrawal