-
Die
vorliegende Erfindung bezieht sich auf Wellenfeldsynthesesysteme
und insbesondere auf die Vermeidung von Artefakten aufgrund von
Lautsprecherarrays mit einer begrenzten Anzahl von Lautsprechern.
-
Es
besteht ein steigender Bedarf an neuen Technologien und innovativen
Produkten im Bereich der Unterhaltungselektronik. Dabei ist es eine
wichtige Voraussetzung für
den Erfolg neuer multimedialer Systeme, optimale Funktionalitäten bzw.
Fähigkeiten anzubieten.
Erreicht wird das durch den Einsatz digitaler Technologien und insbesondere
der Computertechnik. Beispiele hierfür sind die Applikationen, die einen
verbesserten realitätsnahen
audiovisuellen Eindruck bieten. Bei bisherigen Audiosystemen liegt ein
wesentlicher Schwachpunkt in der Qualität der räumlichen Schallwiedergabe von
natürlichen,
aber auch von virtuellen Umgebungen.
-
Verfahren
zur mehrkanaligen Lautsprecherwiedergabe von Audiosignalen sind
seit vielen Jahren bekannt und standardisiert. Alle üblichen
Techniken besitzen den Nachteil, dass sowohl der Aufstellungsort
der Lautsprecher als auch die Position des Hörers dem Übertragungsformat bereits eingeprägt sind.
Bei falscher Anordnung der Lautsprecher im Bezug auf den Hörer leidet
die Audioqualität
deutlich. Ein optimaler Klang ist nur in einem kleinen Bereich des
Wiedergaberaums, dem so genannten Sweet Spot, möglich.
-
Ein
besserer natürlicher
Raumeindruck sowie eine stärkere
Einhüllung
bei der Audiowiedergabe kann mit Hilfe einer neuen Technologie erreicht werden.
Die Grundlagen dieser Technologie, die so genannte Wellenfeldsynthese
(WFS; WFS = Wave-Field Synthesis), wurden an der TU Delft erforscht
und erstmals in den späten
80er-Jahren vorgestellt (Berkhout, A.J.; de Vries, D.; Vogel, P.: Acoustic
control by Wavefield Synthesis. JASA 93, 1993).
-
Infolge
der enormen Anforderungen dieser Methode an Rechnerleistung und Übertragungsraten wurde
die Wellenfeldsynthese bis jetzt nur selten in der Praxis angewendet.
Erst die Fortschritte in den Bereichen der Mikroprozessortechnik
und der Audiocodierung gestatten heute den Einsatz dieser Technologie
in konkreten Anwendungen. Erste Produkte im professionellen Bereich
werden nächstes
Jahr erwartet. In wenigen Jahren sollen auch erste Wellenfeldsynthese-Anwendungen für den Konsumerbereich
auf den Markt kommen.
-
Die
Grundidee von WFS basiert auf der Anwendung des Huygens'schen Prinzips der
Wellentheorie:
Jeder Punkt, der von einer Welle erfasst wird,
ist Ausgangspunkt einer Elementarwelle, die sich kugelförmig bzw.
kreisförmig
ausbreitet.
-
Angewandt
auf die Akustik kann durch eine große Anzahl von Lautsprechern,
die nebeneinander angeordnet sind (einem so genannten Lautsprecherarray),
jede beliebige Form einer einlaufenden Wellenfront nachgebildet
werden. Im einfachsten Fall, einer einzelnen wiederzugebenden Punktquelle
und einer linearen Anordnung der Lautsprecher, müssen die Audiosignale eines
jeden Lautsprechers mit einer Zeitverzögerung und Amplitudenskalierung
so gespeist werden, dass sich die abgestrahlten Klangfelder der
einzelnen Lautsprecher richtig überlagern. Bei
mehreren Schallquellen wird für
jede Quelle der Beitrag zu jedem Lautsprecher getrennt berechnet und
die resultierenden Signale addiert. In einem Raum mit reflektierenden
Wänden
können
auch Reflexionen als zusätzliche
Quellen über
das Lautsprecherarray wiedergegeben werden. Der Aufwand bei der
Berechnung hängt
daher stark von der Anzahl der Schallquellen, den Reflexionsei genschaften
des Aufnahmeraums und der Anzahl der Lautsprecher ab.
-
Der
Vorteil dieser Technik liegt im Besonderen darin, dass ein natürlicher
räumlicher
Klangeindruck über
einen großen
Bereich des Wiedergaberaums möglich
ist. Im Gegensatz zu den bekannten Techniken werden Richtung und
Entfernung von Schallquellen sehr exakt wiedergegeben. In beschränktem Maße können virtuelle
Schallquellen sogar zwischen dem realen Lautsprecherarray und dem
Hörer positioniert
werden.
-
Obgleich
die Wellenfeldsynthese für
Umgebungen gut funktioniert, deren Beschaffenheiten bekannt sind,
treten doch Unregelmäßigkeiten
auf, wenn sich die Beschaffenheit ändert bzw. wenn die Wellenfeldsynthese
auf der Basis einer Umgebungsbeschaffenheit ausgeführt wird,
die nicht mit der tatsächlichen
Beschaffenheit der Umgebung übereinstimmt.
-
Die
Technik der Wellenfeldsynthese kann jedoch ebenfalls vorteilhaft
eingesetzt werden, um eine visuelle Wahrnehmung um eine entsprechende räumliche
Audiowahrnehmung zu ergänzen.
Bisher stand bei der Produktion in virtuellen Studios die Vermittlung
eines authentischen visuellen Eindrucks der virtuellen Szene im
Vordergrund. Der zum Bild passende akustische Eindruck wird in der
Regel durch manuelle Arbeitsschritte in der sogenannten Postproduktion
nachträglich
dem Audiosignal aufgeprägt oder
als zu aufwendig und zeitintensiv in der Realisierung eingestuft
und daher vernachlässigt.
Dadurch kommt es üblicherweise
zu einem Widerspruch der einzelnen Sinnesempfindungen, der dazu
führt, daß der entworfene
Raum, d. h. die entworfene Szene, als weniger authentisch empfunden
wird.
-
In
der Fachveröffentlichung „Subjective
experiments on the effects of combining spatialized audio and 2D
video projection in audio-visual systems", W. de Bruijn und M. Boone, AES convention
paper 5582, 10. bis 13. Mai 2002, München, werden subjektive Experimente
bezüglich
der Auswirkungen des Kombinierens von räumlichem Audio und einer zweidimensionalen
Videoprojektion in audiovisuellen Systemen dargestellt. Insbesondere
wird hervorgehoben, daß zwei
in einer unterschiedlichen Entfernung zu einer Kamera stehende Sprecher,
die nahezu hintereinander stehen, von einem Betrachter besser verstanden
werden können,
wenn mit Hilfe der Wellenfeldsynthese die zwei hintereinander stehenden
Personen als unterschiedliche virtuelle Schallquellen aufgefaßt und rekonstruiert
werden. In diesem Fall hat sich durch subjektive Tests herausgestellt,
daß ein
Zuhörer
die beiden gleichzeitig sprechenden Sprecher getrennt voneinander
besser verstehen und unterscheiden kann.
-
In
einem Tagungsbeitrag zum 46. internationalen wissenschaftlichen
Kolloquium in Ilmenau vom 24. bis 27. September 2001 mit dem Titel „Automatisierte
Anpassung der Akustik an virtuelle Räume", U. Reiter, F. Melchior und C. Seidel,
wird ein Ansatz vorgestellt, Tonnachbearbeitungsprozesse zu automatisieren.
Hierzu werden die für
die Visualisierung notwendigen Parameter eines Film-Sets, wie z.
B. Raumgröße, Textur
der Oberflächen
oder Kameraposition und Position der Akteure auf ihre akustische Relevanz
hin überprüft, woraufhin
entsprechende Steuerdaten generiert werden. Diese beeinflussen dann
automatisiert die zur Postproduktion eingesetzten Effekt- und Nachbearbeitungsprozesse,
wie z. B. die Anpassung der Sprecherlautstärkenabhängigkeit von der Entfernung
zur Kamera oder die Nachhallzeit in Abhängigkeit von Raumgröße und Wandbeschaffenheit.
Hierbei besteht das Ziel darin, den visuellen Eindruck einer virtuellen
Szene für
eine gesteigerte Realitätsempfindung
zu verstärken.
-
Es
soll ein „Hören mit
den Ohren der Kamera" ermöglicht werden,
um eine Szene echter erscheinen zu lassen. Hierbei wird eine möglichst
hohe Korrelation zwischen Schallereignisort im Bild und Hörereignisort
im Surroundfeld angestrebt. Das bedeutet, daß Schallquellenpositionen ständig einem Bild
angepaßt
sein sollen. Kameraparameter, wie z. B. Zoom, sollen in die Tongestaltung
ebenso mit einbezogen werden wie eine Position von zwei Lautsprechern
L und R. Hierzu werden Trackingdaten eines virtuellen Studios zusammen
mit einem zugehörigen
Timecode vom System in eine Datei geschrieben. Gleichzeitig werden
Bild, Ton und Timecode auf einer MAZ aufgezeichnet. Das Camdump-File
wird zu einem Computer übertragen,
der daraus Steuerdaten für
eine Audioworkstation geniert und synchron zum von der MAZ stammenden
Bild über
eine MIDI-Schnittstelle ausgibt. Die eigentliche Audiobearbeitung
wie Positionierung der Schallquelle im Surroundfeld und Einfügen von
frühen
Reflexionen und Nachhall findet innerhalb der Audioworkstation statt. Das
Signal wird für
ein 5.1-Surround-Lautsprechersystem aufbereitet.
-
Kamera-Tracking-Parameter
genauso wie Positionen von Schallquellen im Aufnahme-Setting können bei
realen Film-Sets
aufgezeichnet werden. Solche Daten können auch in virtuellen Studios
erzeugt werden.
-
In
einem virtuellen Studio steht ein Schauspieler oder Moderator allein
in einem Aufnahmeraum. Insbesondere steht er vor einer blauen Wand, die
auch als Blue-Box oder Blue-Panel
bezeichnet wird. Auf diese Blauwand ist ein Muster aus blauen und
hellblauen Streifen aufgebracht. Das besondere an diesem Muster
ist, daß die
Streifen unterschiedlich breit sind und sich somit eine Vielzahl
von Streifen-Kombinationen
ergeben. Aufgrund der einmaligen Streifen-Kombinationen auf der Blauwand ist es bei
der Nachbearbeitung, wenn die Blauwand durch einen virtuellen Hintergrund
ersetzt wird, möglich,
genau zu bestimmen, in welche Richtung die Kamera blickt. Mit Hilfe
dieser Informationen kann der Rechner den Hintergrund für den aktuellen
Kamerablickwinkel ermitteln. Ferner werden Sensoren an der Kamera
ausgewertet, die zusätzliche
Kameraparameter erfassen und ausgeben. Typische Parameter einer Kamera,
die mittels Sensorik erfaßt
werden, sind die drei Translationsgrade x, y, z, die drei Rotationsgrade,
die auch als Roll, Tilt, Pan be zeichnet werden, und die Brennweite
bzw. der Zoom, der gleichbedeutend mit der Information über den Öffnungswinkel
der Kamera ist.
-
Damit
die genaue Position der Kamera auch ohne Bilderkennung und ohne
aufwendige Sensortechnik bestimmt werden kann, kann man auch ein Tracking-System
einsetzen, das aus mehreren Infrarot-Kameras besteht, die die Position
eines an der Kamera befestigten Infrarot-Sensors ermitteln. Somit ist
auch die Position der Kamera bestimmt. Mit den von der Sensorik
gelieferten Kameraparametern und den von der Bilderkennung ausgewerteten
Streifen-Informationen kann ein Echtzeitrechner nun den Hintergrund
für das
aktuelle Bild berechnen. Hierauf wird der Blau-Farbton, den der
blaue Hintergrund hatte, aus dem Bild entfernt, so daß statt
dem blauen Hintergrund der virtuelle Hintergrund eingespielt wird.
-
In
der Mehrzahl der Fälle
wird ein Konzept verfolgt, bei dem es darum geht, einen akustischen Gesamteindruck
der visuell abgebildeten Szenerie zu bekommen. Dieses lässt sich
gut mit dem aus der Bildgestaltung stammenden Begriff der „Totalen" umschreiben. Dieser „totale" Klangeindruck bleibt
meist über
alle Einstellungen in einer Szene konstant, obwohl sich der optische
Blickwinkel auf die Dinge meist stark ändert. So werden optische Details
durch entsprechende Einstellungen herausgehoben oder in den Hintergrund
gestellt. Auch Gegenschüsse
bei der filmischen Dialoggestaltung werden vom Ton nicht nachvollzogen.
-
Daher
besteht der Bedarf, den Zuschauer akustisch in eine audiovisuelle
Szene einzubetten. Hierbei bildet die Leinwand oder Bildfläche die
Blickrichtung und den Blickwinkel des Zuschauers. Dies bedeutet,
daß der
Ton dem Bild in der Form nachgeführt
werden soll, daß er
stets mit dem gesehenen Bild übereinstimmt.
Dies wird insbesondere für
virtuelle Studios noch wichtiger, da es typischerweise keine Korrelation
zwischen dem Ton der Moderation beispielsweise und der Umgebung
gibt, in der sich der Moderator gerade befindet. Um einen audiovisuellen Gesamteindruck
der Szene zu bekommen, muß ein zum
gerenderten Bild passender Raumeindruck simuliert werden. Eine wesentliche
subjektive Eigenschaft bei einem solchen klanglichen Konzept ist
in diesem Zusammenhang der Ort einer Schallquelle, wie ihn ein Betrachter
beispielsweise einer Kinoleinwand empfindet.
-
Im
Audiobereich läßt sich
also durch die Technik der Wellenfeldsynthese (WFS) ein guter räumlicher
Klang für
eine großen
Hörerbereich
erzielen. Wie es ausgeführt
worden ist, basiert die Wellenfeldsynthese auf dem Prinzip von Huygens,
nach welchem sich Wellenfronten durch Überlagerung von Elementarwellen
formen und aufbauen lassen. Nach mathematisch exakter theoretischer
Beschreibung müßten unendlich
viele Quellen in unendlich kleinem Abstand für die Erzeugung der Elementarwellen
genutzt werden. Praktisch werden jedoch endlich viele Lautsprecher
in einem endlich kleinen Abstand zueinander genutzt. Jeder dieser
Lautsprecher wird gemäß dem WFS-Prinzip
mit einem Audiosignal von einer virtuellen Quelle, das ein bestimmtes
Delay und einen bestimmten Pegel hat, angesteuert. Pegel und Delays
sind in der Regel für
alle Lautsprecher unterschiedlich.
-
Wie
es bereits ausgeführt
worden ist, arbeitet das Wellenfeldsynthesesystem auf der Basis
des Huygens-Prinzips und rekonstruiert eine gegebene Wellenform
beispielsweise einer virtuellen Quelle, die in einem bestimmten
Abstand zu einem Vorführbereich
bzw. zu einem Hörer
in dem Vorführbereich
angeordnet ist durch eine Vielzahl von Einzelwellen. Der Wellenfeldsynthesealgorithmus
erhält
somit Informationen über
die tatsächliche
Position eines Einzellautsprechers aus dem Lautsprecherarray, um dann
für diesen
Einzellautsprecher ein Komponentensignal zu berechnen, das dieser
Lautsprecher dann letztendlich abstrahlen muß, damit beim Zuhörer eine Überlagerung
des Lautsprechersignals von dem einen Lautsprecher mit den Lautsprechersignalen
der anderen aktiven Lautsprecher eine Rekonstruktion dahingehend
durch führt,
daß der
Hörer den Eindruck
hat, daß er
nicht von vielen Einzellautsprechern „beschallt" wird, sondern lediglich von einem einzigen
Lautsprecher an der Position der virtuellen Quelle.
-
Für mehrere
virtuelle Quellen in einem Wellenfeldsynthesesetting wird der Beitrag
von jeder virtuellen Quelle für
jeden Lautsprecher, also das Komponentensignal der ersten virtuellen
Quelle für
den ersten Lautsprecher, der zweiten virtuellen Quelle für den ersten
Lautsprecher, etc. berechnet, um dann die Komponentensignale aufzuaddieren,
um schließlich das
tatsächliche
Lautsprechersignal zu erhalten. Im Falle von beispielsweise drei
virtuellen Quellen würde
die Überlagerung
der Lautsprechersignale aller aktiven Lautsprecher beim Hörer dazu
führen,
daß der
Hörer nicht
den Eindruck hat, daß er
von einem großen
Array von Lautsprechern beschallt wird, sondern daß der Schall,
den er hört,
lediglich von drei an speziellen Positionen positionierten Schallquellen kommt,
die gleich den virtuellen Quellen sind.
-
Die
Berechnung der Komponentensignale erfolgt in der Praxis meist dadurch,
daß das
einer virtuellen Quelle zugeordnete Audiosignal je nach Position
der virtuellen Quelle und Position des Lautsprechers zu einem bestimmten
Zeitpunkt mit einer Verzögerung
und einem Skalierungsfaktor beaufschlagt wird, um ein verzögertes und/oder
skaliertes Audiosignal der virtuellen Quelle zu erhalten, das das
Lautsprechersignal unmittelbar darstellt, wenn nur eine virtuellen
Quelle vorhanden ist, oder das nach Addition mit weiteren Komponentensignalen
für den
betrachteten Lautsprecher von anderen virtuellen Quellen dann zum
Lautsprechersignal für
den betrachteten Lautsprecher beiträgt.
-
Typische
Wellenfeldsynthesealgorithmen arbeiten unabhängig davon, wie viele Lautsprecher
im Lautsprecherarray vorhanden sind. Die der Wellenfeldsynthese
zugrundeliegende Theorie besteht darin, daß jedes beliebige Schallfeld
durch ei ne unendlich hohe Anzahl von Einzellautsprechern exakt rekonstruiert
werden kann, wobei die einzelnen Einzellautsprecher unendlich nahe
zueinander angeordnet sind. In der Praxis kann jedoch weder die
unendlich hohe Anzahl noch die unendlich nahe Anordnung realisiert
werden. Statt dessen existiert eine begrenzte Anzahl von Lautsprechern,
die zudem in bestimmten vorgegebenen Abständen zueinander angeordnet
sind. Damit wird in realen Systemen immer nur eine Annäherung an
die tatsächliche
Wellenform erreicht, die stattfinden würde, wenn die virtuelle Quelle tatsächlich vorhanden
wäre, also
eine reale Quelle sein würde.
-
Ferner
existieren verschiedene Szenarien, dahingehend, daß das Lautsprecherarray
nur, wenn ein Kinosaal betrachtet wird, z. B. auf der Seite der Kinoleinwand
angeordnet ist. In diesem Fall würde das
Wellenfeldsynthesemodul Lautsprechersignale für diese Lautsprecher erzeugen,
wobei die Lautsprechersignale für
diese Lautsprecher normalerweise dieselben sein werden wie für entsprechende Lautsprecher
in einem Lautsprecherarray, das sich nicht nur über die Seite eines Kinos beispielsweise erstreckt,
an der die Leinwand angeordnet ist, sondern das auch links, rechts
und hinter dem Zuhörerraum
angeordnet ist. Dieses „360°"-Lautsprecherarray wird natürlich eine
bessere Annäherung
an ein exaktes Wellenfeld schaffen als lediglich ein einseitiges
Array, beispielsweise vor den Zuschauern. Dennoch sind die Lautsprechersignale
für die
Lautsprecher, die sich vor den Zuschauern befinden, in beiden Fällen die
gleichen. Dies bedeutet, daß ein
Wellenfeldsynthesemodul typischerweise keine Rückkopplung dahingehend erhält, wie
viele Lautsprecher vorhanden sind bzw. ob es sich um ein einseitiges
oder mehrseitiges oder gar um ein 360°-Array handelt oder nicht. Anders
ausgedrückt
berechnet eine Wellenfeldsyntheseeinrichtung ein Lautsprechersignal für einen
Lautsprecher aufgrund der Position des Lautsprechers und unab hängig davon,
welche weiteren Lautsprecher noch vorhanden sind oder nicht vorhanden
sind.
-
Nachfolgend
wird anhand von 9 auf
eine Artefaktproblematik eingegangen, die sich ergibt, wenn sich
eine virtuelle Quelle 900 in einem Zuhörraum 902 befindet,
der durch ein um den Raum angeordnetes Lautsprecherarray 904 definiert
ist, das bei dem in 9 gezeigten
Ausführungsbeispiel
Arraygruppen 904a, 904b, 904c und 904d aufweist.
-
Durch
eine in 9 nicht gezeigte
Berechnungseinrichtung werden für
die zu den Lautsprecher-Unterarrays 904a, 904b, 904c, 904d gehörigen Lautsprecher,
von denen einer beispielhaft als 906 bezeichnet ist, Treibersignale
erzeugt. Zur Rekonstruktion einer virtuellen Quelle 900,
die bei dem in 9 gezeigten
Bild als punktförmig
strahlende Quelle angenommen wird, werden die Treibersignale für die einzelnen
Lautsprecher 904 so geliefert, daß die von den Lautsprechern
abgegebenen Schallsignale bzw. Wellenfronten auf die virtuelle Position
der virtuellen Quelle 900 fokussiert werden. Selbstverständlich gibt
jeder Lautsprecher 904 zunächst in seiner Hauptstrahlungsrichtung,
also typischerweise senkrecht zur Lautsprechermembran, ein Schallsignal
ab. Aufgrund der gegenseitigen Überlagerungen der
Schallsignale der einzelnen Lautsprecher, die durch die auf den
Gesetzen der Wellenfeldsynthese basierenden Treibersignale bewirkt
wird, findet jedoch eine Fokussierung der Wellenfronten auf die
virtuelle Position der virtuellen Quelle 900 statt, wie
es durch die von den einzelnen Lautsprechern ausgehenden gestrichelten
Linien (z. B. 910) dargestellt ist. Der Lautsprecher, von
dem die gestrichelte Linie 910 ausgeht, erzeugt ebenso
wie alle anderen Lautsprecher ein Lautsprechersignal, das zu der
virtuellen Quelle hinläuft, und
zwar so, daß eine
zu der gestrichelten Linie 910 zugehörige durchgezogene Linie, die
mit einer Pfeilspitze abgeschlossen ist und in 9 mit 912 bezeichnet ist, gewissermaßen das Nutzsignal
der virtuellen Quelle darstellt.
-
Entsprechend
ist die zu der virtuellen Quelle 900 hinlaufende Wellenfront
durch eine weitere gestrichelte Linie 914 dargestellt,
die zu einem Nutzsignal 916 der virtuellen Quelle 900 führt, wie
es durch die mit einem Pfeil abgeschlossene durchgezogene Linie 916 dargestellt
ist. Dies bedeutet, daß sich
in dem Zuhörerraum 902 prinzipiell
zwei Wellenfelder überlagern.
Das eine Wellenfeld sind bei dem in 9 gezeigten
Ausführungsbeispiel
sämtliche
gestrichelte Linien, die die Fokussierung der Lautsprechersignale
auf die Position der virtuellen Quelle 900 darstellen sollen.
Zum anderen existiert das „Nutz"-Wellenfeld, das
durch die in 9 mit einem Pfeil
abgeschlossenen durchgezogenen Linien (z. B. 912 und 916)
dargestellt ist. Aufgrund der Überlagerung
dieser beiden Wellenfelder, nämlich
einerseits des „Erzeugungs-Wellenfelds" und anderseits des „Nutz-Wellenfelds" entstehen im gesamten
Zuhörerraum 902 Artefakte.
Diese Artefakte sind systembedingt, da die virtuelle Quelle 900 innerhalb
des Arrays positioniert ist und da an der Position der virtuellen Quelle
kein Lautsprecher vorgesehen ist, der eine Punktstrahlcharakteristik
hat.
-
In
anderen Worten ausgedrückt
würde zur Erzeugung
des Nutzsignals auf der Seite der virtuellen Quelle 900,
auf der in 9 die durchgezogene Linie 916 eingezeichnet
ist, ein Signal des Lautsprecher-Unterarrays 904a und ein
Lautsprechersignal von zumindest den unteren Teilen der Lautsprecherarrays 904b und 904d erzeugt
werden. Um jedoch andererseits auf der Seite der virtuellen Quelle,
auf der die durchgezogene Linie 912 eingezeichnet ist, ein
Signal der virtuellen Quelle 900 als Nutzsignal zu erzeugen,
würde eine
Wellenfront von dem Lautsprecher-Unterarray 904c sowie
von zumindest Teilen der Lautsprecher-Arrays 904d und 904b,
die typischerweise oberhalb der virtuellen Quelle sein werden, erzeugt
werden. Damit kommt es, wie es ausgeführt worden ist, im gesamten
Zuhörerraum 902 zu Artefakten,
da der Zuhörer
sowohl das Erzeugungs-Wellenfeld, das mit den gestrichelten Linien
in 9 skizziert ist,
als auch das Nutz-Wellenfeld hören
wird, das in 9 mit den
durchgezogenen Linien gekennzeichnet ist.
-
Eigentlich
möchte
der Zuhörer
jedoch lediglich das Nutz-Wellenfeld,
also das Wellenfeld, das durch die durchgezogenen Linien, die mit
einem Pfeil abgeschlossen sind, hören, während er natürlich kein Interesse
an dem Erzeugungs-Wellenfeld
hat, das durch die gestrichelten Linien in 9 dargestellt ist. Da der Zuhörer jedoch,
wie es ausgeführt
worden ist, beide Wellenfelder hört,
kommt es zu unerwünschten Artefakten.
-
Die
Fachveröffentlichung
von Berkhout, A.J., u.a. „Acoustic
control by wave field Synthesis",
Journal of the Acoustic Society of America, Bd. 93, 1993, Nr. 5,
Mai 1993, Seiten 2764-2778, bezieht sich darauf, wie man mit ungünstigen
Seiteneffekten, wie beispielsweise Lokalisierungsproblemen und Artefakten des
Nachhallfeldes, umgehen kann. Zu diesem Zweck wird eine Messung
der Wellenfelder der Schallquellen durch Richtmikrophone vorgenommen. Dann
wird eine elektronische Extrapolation vorgenommen, um dann eine
Neuemission durch eines oder mehrere Lautsprecher-Arrays vorzunehmen.
-
Die
Aufgabe der vorliegenden Erfindung besteht darin, ein Wellenfeldsynthesekonzept
mit zumindest reduzierten Artefakten zu schaffen.
-
Diese
Aufgabe wird durch eine Wellenfeldsynthesevorrichtung nach Patentanspruch
1 oder ein Verfahren zum Treiben eines Arrays von Lautsprechern
nach Patentanspruch 15 gelöst.
-
Der
vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß eine Reduktion
bzw. Eliminierung von Artefakten aufgrund des „Erzeugungs-Wellenfelds", wie es Bezug nehmend auf 9 erläutert worden
ist, dadurch erreicht wird, daß lediglich
eine Teil-Rekonstruktion des Wellenfelds einer virtuellen Quelle
durchgeführt
wird, indem nicht alle Lautsprecher des Lautsprecherarrays mit Treibersignalkomponenten
versorgt werden, sondern indem zunächst relevante Lautsprecher
des Lautsprecherarrays auf der Basis der Position der virtuellen
Quelle ermittelt werden, wonach für die als relevant ermittelten
Lautsprecher Treibersignalkomponenten auf der Basis des Audiosignals
für die
virtuelle Quelle berechnet werden, und wobei dann lediglich die
relevanten Lautsprecher mit für
dieselben berechneten Treibersignalkomponenten bedient werden, während die nicht-relevanten
Lautsprecher nicht mit Treibersignalkomponenten aufgrund des der
virtuellen Quelle zugeordneten Audiosignals bedient werden.
-
Damit
wird lediglich ein Teil des Nutz-Wellenfeldes einer virtuellen Quelle
rekonstruiert, wobei dieses zu rekonstruierende Teil-Wellenfeld
beliebig bestimmbar ist. Insbesondere wird erfindungsgemäß abhängig von
einer bestimmten Zuhörerposition
eine Schallemission der Lautsprecher unterdrückt, die derart bezüglich der
Zuhörerposition
und der virtuellen Quelle angeordnet sind, daß sich die Zuhörerposition
zwischen der virtuellen Quelle und den Lautsprechern befindet.
-
Die
Lautsprecher, bei denen dies der Fall ist, sind nicht-relevante Lautsprecher
und werden somit auch nicht angesteuert, um in dem Teilraum, in
dem sich die Zuhörerposition
befindet, das Erzeugungs-Wellenfeld zu unterdrücken, so daß der Zuhörer an seiner Zuhörerposition
nur noch das Nutz-Wellenfeld der virtuellen Quelle wahrnimmt und
somit einen Artefakt-freien Hörgenuß haben
wird.
-
Dies
führt jedoch
dazu, daß auf
der entgegengesetzten Seite der virtuellen Quelle, also auf der Seite
der virtuellen Quelle, wo die relevanten Lautsprecher sitzen, nur
noch das Erzeugungs-Wellenfeld vorhanden ist, daß jedoch dort das Nutz-Wellenfeld
deaktiviert wird. Ein Zuhörer
wird daher auf dieser Seite einen deutlich reduzierten Hörgenuß haben da
hier nur das Erzeugungs-Wellenfeld existiert, nicht jedoch das Nutz-Wellenfeld
bezüglich
einer virtuellen Quelle.
-
Nachdem
typischerweise jedoch mehrere virtuellen Quellen an mehreren Positionen
vorhanden sein werden, und nachdem es oft der Fall sein wird, daß die virtuelle
Position nicht in der Mitte des Zuhörerraums sein wird, sondern
an einem Rand, ist die Verringerung des Höreindrucks auf der „schlechten" Seite des Zuhörerraums,
also in dem Bereich des Zuhörerraums,
der sich bezüglich
der virtuellen Quelle auf der entgegengesetzten Seite der zur Relevanzermittlung
herangezogenen definierten Zuhörerposition
befindet, nicht so gravierend, so daß dieser Qualitätsverlust
im Hinblick auf den Gesamtgewinn auf den gesamten Zuhörerraum
bzw. auf die Mehrheit der Zuhörer
bezogen hinnehmbar ist.
-
In
anderen Worten ausgedrückt
ist die Einrichtung zum Ermitteln der relevanten Lautsprecher des
Lautsprecherarrays auf der Basis der Position der virtuellen Quelle
und der definierten Positionen der Lautsprecher wirksam, um Artefakte
aufgrund von Lautsprechersignalen des „Erzeugungs-Wellenfelds" zu reduzieren, die
sich entgegengesetzt zu einer Richtung von der virtuellen Quelle
zu der definierten Zuhörerposition
bewegen.
-
Bei
einem bevorzugten Ausführungsbeispiel der
vorliegenden Erfindung werden – für Quellen
außerhalb
des Zuhörerraums – sämtliche
Lautsprecher als nicht-relevant für eine virtuellen Quelle ermittelt, bei
denen ein Winkel zwischen ihrer Hauptstrahlungsrichtung und der
Richtung von der virtuellen Quelle durch diesen Lautsprecher größer als
90 Grad ist. Dies bedeutet, daß ein
Vektor von der virtuellen Quelle zum Lautsprecher keine Richtungskomponente
hat, die parallel zu einer Hauptstrahlungsrichtung eines Lautsprechers
ist. Ist dies der Fall, so wird der Lautsprecher als nicht-relevant
ermittelt, da dieser Lautsprecher dann nicht in der Lage sein wird,
zu der Rekonstruktion eines Wellenfelds beizutragen, das sich von
der virtuellen Quelle zur Zuhörerposition ausbreiten
soll und nicht umgekehrt.
-
An
dieser Stelle sei darauf hingewiesen, dass für die vorstehenden Betrachtungen
ein gewissermaßen
halbkreisförmiges
Strahlungsfeld des Lautsprechers betrachtet wird, in dem seine Hauptstrahlungsrichtung
liegt, das also vor dem Lautsprecher ist. Eventuelle zusätzliche
Abstrahlungen nach hinten werden dabei nicht berücksichtigt. Hat also eine solche
zusätzliche
Abstrahlung „nach
hinten" eine Richtungskomponente,
so wird diese ignoriert und spielt somit bei der Bestimmung der
Lautsprecher keine Rolle.
-
Bei
einem bevorzugten Ausführungsbeispiel der
vorliegenden Erfindung, bei dem als Lautsprecherarray ein Linienarray
verwendet wird, mit dem eine sogenannte Receiver-Linie in dem Zuhörerraum erzeugt
werden kann, die prinzipiell beliebige Formen annehmen kann, wie
es in der Dissertation mit dem Titel „Sound Reproduction by Wave
Field Synthesis",
Edwin N. G. Verheijen, 1998, dargelegt ist, wird der Zuhörerraum
auf der Basis der Receiver-Linie, für die die Wellen feldrekonstruktion
optimal ist, in zwei Halbräume
aufgeteilt. Eine Linie, die parallel zur Receiver-Linie ist und
durch die virtuelle Position läuft,
teilt den Zuhörerraum
in einen ersten und in einen zweiten Halbraum. In dem Halbraum,
in dem sich die Zuhörerposition
befindet, werden sämtliche
Lautsprecher als nicht-relevant ermittelt, um in diesem Halbraum,
in dem ein guter Audioeindruck sein soll, das Erzeugungs-Wellenfeld
aufgrund der virtuellen Quelle zu deaktivieren. Im anderen Halbraum
dagegen werden alle Lautsprecher als relevant ermittelt, um das
in dem Halbraum, in dem sich die Zuhörerposition befindet, für einen
guten Audioeindruck nötige Nutz-Wellenfeld
der virtuellen Quelle zu erzeugen.
-
Die
vorstehenden Betrachtungen beziehen sich auf eine virtuelle Quelle
mit einer virtuellen Position im Zuhörerraum. Befindet sich dagegen
eine virtuellen Quelle an einer virtuellen Position außerhalb des
Zuhörerraums,
so wird es bevorzugt, sämtliche Lautsprecher,
die jenseits der Receiver-Linie
liegen, als nicht-relevante Lautsprecher zu ermitteln. Gleichzeitig
werden Lautsprecher als nicht-relevant bei einem bevorzugten Ausführungsbeispiel
der vorliegenden Erfindung ermittelt, bei denen der Winkel zwischen
der Lautsprecherachse, also der Hauptstrahlungsrichtung, und einer
Linie durch die virtuelle Quelle einerseits und den betrachteten
Lautsprecher andererseits nicht größer als 90 Grad ist, um wiederum
das Erzeugungs-Wellenfeld für
Komponenten der virtuellen Quelle außerhalb des Raums, die von
dem Zuhörerraum
abgewandt sind, zu eliminieren, derart, daß im Zuhörerraum lediglich das Nutz-Wellenfeld der
virtuellen Quelle vorhanden ist. Anders ausgedrückt werden wiederum die Lautsprecher
deaktiviert, die Lautsprechersignale emittieren, die eine Richtung
haben, die zu der Richtung von der virtuellen Quelle zu der Zuhörerposition
entgegengesetzt gerichtet ist.
-
Bevorzugte
Ausführungsbeispiele
der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf
die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
-
1 ein
Blockschaltbild einer erfindungsgemäßen Wellenfeldsynthesevorrichtung;
-
2 ein
Prinzipschaltbild einer Wellenfeldsyntheseumgebung;
-
3 eine
detailliertere Darstellung der in 2 gezeigten
Wellenfeldsyntheseumgebung;
-
4 eine Darstellung der Situation bei einer
virtuellen Quelle außerhalb
des Zuhörerraums zur
Kennzeichnung der relevanten Lautsprecher und der nicht-relevanten
Lautsprecher für
die virtuelle Quelle;
-
5 eine
Darstellung der Winkelbeziehung zwischen einer virtuellen Quelle
und einer Lautsprecherachse;
-
6 eine
Darstellung der Situation bei einer virtuellen Quelle innerhalb
des Zuhörerraums;
-
7 eine
detailliertere Darstellung der Situation einer virtuellen Quelle
innerhalb des Zuhörerraums;
-
8 ein
prinzipielles Blockschaltbild eines Wellenfeldsynthesesystems mit
Wellenfeldsynthesemodul und Lautsprecherarray in einem Vorführbereich;
und
-
9 eine
Prinzipdarstellung zur Erläuterung
der Rekonstruktion eines Wellenfelds einer punktförmig strahlenden
virtuellen Quelle.
-
1 zeigt
ein Blockschaltbild einer erfindungsgemäßen Wellenfeldsynthesevorrichtung.
Die Wellenfeldsynthesevorrichtung dient zum Treiben eines Arrays
von Lautsprechern mit Treibersignalen. Die Lautsprecher sind, wie
es anhand von 8 noch erläutert werden wird, an unterschiedlichen
definierten Positionen eines Zuhörerraums
angeordnet, wie es auf dem Gebiet der Wellenfeldsynthese bekannt
ist. Ein Treibersignal für
einen Lautsprecher basiert einerseits auf einem Audiosignal, das
einer virtuellen Quelle zugeordnet ist, die eine virtuelle Position
bezüglich
des Lautsprecherarrays hat, und andererseits auf der definierten
Position des Lautsprechers, für
den das Treibersignal bestimmt ist.
-
An
dieser Stelle sei darauf hingewiesen, daß in einem Wellenfeldsynthese-Setting
typischerweise mehrere virtuelle Quellen existieren werden, die
an verschiedenen virtuellen Positionen angeordnet sind. Die Wellenfeldsynthesevorrichtung
ist ausgebildet, um in diesem Fall für jede virtuelle Quelle eine
Treibersignalkomponente für
einen Lautsprecher zu berechnen, wobei dann die Treibersignalkomponenten für einen
betrachteten Lautsprecher, die aufgrund der verschiedenen virtuellen
Quellen berechnet worden sind, zusammengefaßt werden, um schließlich das Treibersignal
für den
Laut sprecher zu erhalten, in das somit mehrere virtuelle Quellen
bzw. die mehreren virtuellen Quellen zugeordneten Audiosignale eingehen.
-
Die
in 1 gezeigte erfindungsgemäße Wellenfeldsynthesevorrichtung
umfaßt
eine Einrichtung 10 zum Ermitteln von relevanten Lautsprechern des
Lautsprecherarrays. Die Einrichtung 10 ist ausgebildet,
um die Ermittlung auf der Basis einer virtuellen Position der virtuellen
Quelle durchzuführen, die über einen
ersten Eingang 12 zugeführt
wird. Ferner arbeitet die Einrichtung 10 zum Ermitteln
auf der Basis der Position des gerade betrachteten Lautsprechers,
die bei dem in 1 gezeigten Prinzipblockschaltbild über einen
weiteren Eingang 14 der Einrichtung zugeführt wird.
Es sei darauf hingewiesen, daß die
Positionen der Lautsprecher im Lautsprecher-Array typischerweise
fest vorgegeben sind und beispielsweise innerhalb der Einrichtung 10 in
Form einer Tabelle beispielsweise abgespeichert sein werden, also
nicht unbedingt über
einen eigenen Eingang 14 zugeführt werden müssen. Schließlich arbeitet
die Einrichtung 10 zum Ermitteln von relevanten Lautsprechern
auf der Basis einer betrachteten Zuhörerposition, die über einen
weiteren Eingang 16 zugeführt werden kann. Auch an dieser
Stelle sei darauf hingewiesen, daß die Zuhörerposition bzw. bei einem bevorzugten
Ausführungsbeispiel
ein Halbraum von Zuhörerpositionen,
die Artefakt-frei bedient werden sollen, nicht jedesmal sich ändern wird,
sondern ebenfalls fest eingestellt sein kann. Je nach Ausführungsform
kann somit die Zuhörerposition
bzw. die mehreren Zuhörerpositionen,
die sich dort befinden, wo das Erzeugungs-Wellenfeld deaktiviert
wird, ständig ändern oder
aber fest vorgegeben sein.
-
Wie
es später
noch erläutert
werden wird, wird es bevorzugt, auf der Basis der Receiver-Linie, die
wiederum ebenfalls vorzugsweise durch den Mittelpunkt des Zuhörerraums
gelegt wird, die definierte Zuhörerposition
für jede
virtuelle Quelle einerseits und jede Position jeder virtuellen Quelle
andererseits zu bestimmen, derart, daß der Zuhörerpositionseingang 16 verwendet
wird, um die relevanten Lautsprecher des Lautsprecherarrays zu ermitteln.
-
Die
Einrichtung 10 ist ausgebildet, um Artefakte aufgrund von
Lautsprechern zu reduzieren oder zu eliminieren, die Lautsprechersignale
ausgeben, die sich entgegengesetzt zu einer Richtung von der virtuellen
Quelle zu der Zuhörerposition
bewegen. An dieser Stelle sei darauf hingewiesen, daß bei einem Ausführungsbeispiel
der vorliegenden Erfindung nicht nur die Lautsprecher deaktiviert
werden, die genau entgegengesetzt zu der Richtung von der virtuellen
Quelle zu der Zuhörerposition
emittieren, sondern daß ebenfalls
Lautsprecher als nicht-relevant ermittelt werden, deren Emissionsrichtung
eine Komponente hat, die entgegengesetzt zu der Richtung von der
virtuellen Quelle zu der Zuhörerposition
ist, oder die nur eine Komponente haben, die senkrecht zu der Richtung
von der virtuellen Quelle zu der Zuhörerposition ist.
-
Die
Einrichtung 10 ist ausgebildet, um die relevanten Lautsprecher
zu identifizieren, und um diese Informationen über einen Ausgang 18 einer
Einrichtung 20 zum Berechnen der Treibersignalkomponenten
für die
relevanten Lautsprecher zu übermitteln.
Die Einrichtung 20 ist als übliches Wellenfeldsynthesemodul
ausgebildet, dahingehend, daß sie auf
der Basis der Wellenfeldsynthesetechnik Treibersignalkomponenten
für Lautsprecher
berechnet, wobei sich die Treibersig nalkomponenten für die Lautsprecher
untereinander in einer Verzögerung
(Delay) und einer Skalierung, also einer Dämpfung/Verstärkung, unterscheiden
werden, wobei jedoch abgesehen von der Delay einerseits und der
Skalierung andererseits die Folge von Abtastwerten in einer Treibersignalkomponente
dieselbe sein wird, wie sie für eine
virtuelle Quelle vorgegeben ist, also gleich dem Audiosignal sein
wird, das der virtuellen Quelle zugeordnet ist.
-
Die
Einrichtung 20 zum Berechnen ist ausgebildet, um die Treibersignalkomponenten
für die
relevanten Lautsprecher an einem Ausgang 22 auszugeben
und einer Einrichtung 24 zuzuführen. Die Einrichtung 24 dient
zum Liefern der Treibersignalkomponenten für eine virtuelle Quelle zu
den relevanten Lautsprechern, während
keine Treibersignalkomponenten für
die virtuelle Quelle an nicht-relevante Lautsprecher übermittelt
werden, um damit das „Erzeugungs-Wellenfeld", das anhand der 9 erläutert worden
ist, in einem Bereich des Zuhörerraums zu
unterdrücken,
in dem sich die definierte Zuhörerposition
befindet.
-
Nachfolgend
wird Bezug nehmend auf die 2 und 3 auf
die allgemeine Funktionalität des
Wellenfeldsynthesemoduls allgemein bzw. auf das Berechnen der Treibersignale
für die
Lautsprecher eingegangen, also die Berechnung der Lautsprechersignale
auf der Basis der Treibersignalkomponenten bzw. Komponentensignale
erläutert.
Zunächst
wird jedoch noch anhand von 8 eine übliche Wellenfeldsynthese-Gesamtumgebung dargestellt.
-
Bevor
detailliert auf die vorliegende Erfindung eingegangen wird, wird
nachfolgend anhand von 8 der prinzipielle Aufbau eines
Wellenfeldsynthesesystems dargestellt. Das Wellenfeldsynthesesystem
hat ein Lautsprecherarray 800, das bezüglich eines Vorführbereichs 802 platziert
ist. Im einzelnen umfaßt
das in 8 gezeigte Lautsprecherarray, das ein 360°-Array ist,
vier Arrayseiten 800a, 800b, 800c und 800d.
Ist der Vorführbereich 802 z.
B. ein Kinosaal, so wird bezüglich
der Konventionen vorne/hinten oder rechts/links davon ausgegangen,
daß sich
die Kinoleinwand auf derselben Seite des Vorführbereichs 802 befindet,
an der auch das Teil-Array 800c angeordnet ist. In diesem
Fall würde
der Betrachter, der an dem hier so genannten Optimal-Punkt P in dem Vorführbereich 802 sitzt,
nach vorne, also auf die Leinwand, sehen. Hinter dem Zuschauer würde sich
dann das Teil-Array 800a befinden, während sich links vom Zuschauer
das Teil-Array 800d befinden würde, und während sich rechts vom Zuschauer
das Teil-Array 800b befinden würde. Jedes Lautsprecherarray
besteht aus einer Anzahl von verschiedenen Einzellautsprechern 808,
die jeweils mit eigenen Lautsprechersignalen angesteuert werden,
die von einem Wellenfeldsynthesemodul 810 über einen
in 8 lediglich schematisch gezeigten Datenbus 812 bereitgestellt
werden. Das Wellenfeldsynthesemodul ist ausgebildet, um unter Verwendung
der Informationen über
z. B. Art und Lage der Lautsprecher bezüglich des Vorführbereichs 802,
also von Lautsprecher-Informationen (LS-Infos), und gegebenenfalls
mit sonstigen Inputs Lautsprechersignale für die einzelnen Lautsprecher 808 zu
berechnen, die jeweils von den Audiotracks für virtuelle Quellen, denen
ferner Positionsinformationen zugeordnet sind, gemäß den bekannten
Wellenfeldsynthesealgorithmen abgeleitet werden. Das Wellenfeldsynthesemodul
kann ferner noch weitere Eingaben erhalten, wie beispielsweise Informationen über die
Raumakustik des Vorführbereichs
etc.
-
Die
nachfolgenden Ausführungen
zur vorliegenden Erfindung können
prinzipiell für
jeden Punkt P in dem Vorführbereich
durchgeführt
werden. Der Optimal-Punkt kann somit an jeder beliebigen Stelle im
Vorführbereich 802 liegen.
Es kann auch mehrere Optimal-Punkte, z. B. auf einer Optimal-Linie,
geben. Um jedoch möglichst
gute Verhältnisse
für möglichst viele
Punkte im Vorführbereich 802 zu
erhalten, wird es bevorzugt, den Optimal-Punkt bzw. die Optimal-Linie
in der Mitte bzw. am Schwerpunkt des Wellenfeldsynthesesystems,
das durch die Lautsprecher-Teilarrays 800a, 800b, 800c, 800d definiert
ist, anzunehmen.
-
Eine
detailliertere Darstellung des Wellenfeldsynthesemoduls 800 wird
nachfolgend anhand der 2 und 3 Bezug
nehmend auf das Wellenfeldsynthesemodul 200 in 2 bzw.
auf die in 3 detailliert dargestellte Anordnung
gegeben.
-
2 zeigt
eine Wellenfeldsyntheseumgebung, in der die vorliegende Erfindung
implementiert werden kann. Zentrum einer Wellenfeldsyntheseumgebung
ist ein Wellenfeldsynthesemodul 200, das diverse Eingänge 202, 204, 206 und 208 sowie
diverse Ausgänge 210, 212, 214, 216 umfaßt. Über Eingänge 202 bis 204 werden
dem Wellenfeldsynthesemodul verschieden Audiosignale für virtuelle
Quellen zugeführt.
So empfängt
der Eingang 202 z. B. ein Audiosignal der virtuellen Quelle
1 sowie zugeordnete Positionsinformationen der virtuellen Quelle.
In einem Kinosetting beispielsweise wäre das Audiosignal 1 z. B.
die Sprache eines Schauspielers, der sich von einer linken Seite
der Leinwand zu einer rechten Seite der Leinwand und möglicherweise
zusätzlich
noch vom Zuschauer weg bzw. zum Zuschauer hin bewegt. Das Audiosignal
1 wäre
dann die tatsächliche Sprache
dieses Schauspielers, während
die Positionsinformationen als Funktion der Zeit die zu einem bestimmten
Zeitpunkt aktuelle Position des ersten Schauspielers im Aufnahmesetting
darstellt. Dagegen wäre
das Audiosignal n die Sprache beispielsweise eines weiteren Schauspielers,
der sich gleich oder anders als der erste Schauspieler bewegt. Die aktuelle
Position des anderen Schauspielers, dem das Audiosignal n zugeordnet
ist, wird durch mit dem Audiosignal n synchronisierte Positionsinformationen dem
Wellenfeldsynthesemodul 200 mitgeteilt. In der Praxis existieren
verschiedene virtuelle Quellen je nach Aufnahmesetting, wobei das
Audiosignal je der virtuellen Quelle als eigener Audiotrack dem Wellenfeldsynthesemodul 200 zugeführt wird.
-
Wie
es vorstehend dargelegt worden ist, speist ein Wellenfeldsynthesemodul
eine Vielzahl von Lautsprechern LS1, LS2, LS3, LSm durch Ausgabe
von Lautsprechersignalen über
die Ausgänge 210 bis 216 zu
den einzelnen Lautsprechern. Dem Wellenfeldsynthesemodul 200 werden über den
Eingang 206 die Positionen der einzelnen Lautsprecher in
einem Wiedergabesetting, wie beispielsweise einem Kinosaal mitgeteilt.
Im Kinosaal befinden sich um den Kinozuschauer herum gruppiert viele
einzelne Lautsprecher, die in Arrays vorzugsweise derart angeordnet
sind, daß sich
sowohl vor dem Zuschauer, also beispielsweise hinter der Leinwand,
als auch hinter dem Zuschauer sowie rechts und links des Zuschauers
Lautsprecher befinden. Ferner können
dem Wellenfeldsynthesemodul 200 noch sonstige Eingaben
mitgeteilt werden, wie beispielsweise Informationen über die
Raumakustik etc., um in einem Kinosaal die tatsächliche während des Aufnahmesettings
herrschende Raumakustik simulieren zu können.
-
Allgemein
gesagt wird das Lautsprechersignal, das beispielsweise dem Lautsprecher
LS1 über den
Ausgang 210 zugeführt
wird, eine Überlagerung von
Komponentensignalen der virtuellen Quellen sein, dahingehend, daß das Lautsprechersignal
für den
Lautsprecher LS1 eine erste Komponente, die auf die virtuelle Quelle
1 zurückgeht,
eine zweite Komponente, die auf die virtuelle Quelle 2 zurückgeht,
sowie eine n-te Komponente, die auf die virtuelle Quelle n zurückgeht,
umfassen. Die einzelnen Komponentensignale werden linear superponiert, also
nach ihrer Berechnung addiert, um die lineare Superposition am Ohr
des Zuhörers
nachzubilden, der in einem realen Setting eine lineare Überlagerung der
von ihm wahrnehmbaren Schallquellen hören wird.
-
Nachfolgend
wird Bezug nehmend auf 3 eine detailliertere Ausgestaltung
des Wellenfeldsynthesemoduls 200 dargelegt. Das Wellenfeldsynthesemodul 200 hat
einen stark pa rallelen Aufbau dahingehend, daß ausgehend von dem Audiosignal
für jede
virtuelle Quelle und ausgehend von den Positionsinformationen für die entsprechende
virtuelle Quelle zunächst
Verzögerungsinformationen
Vi sowie Skalierungsfaktoren SFi berechnet
werden, die von den Positionsinformationen und der Position des gerade
betrachteten Lautsprechers, z. B. dem Lautsprecher mit der Ordnungsnummer
j, also LSj, abhängen.
Die Berechnung einer Verzögerungsinformation
Vi sowie eines Skalierungsfaktors SFi aufgrund der Positionsinformationen einer
virtuellen Quelle und der Lage des betrachteten Lautsprechers j
geschieht durch bekannte Algorithmen, die in Einrichtungen 300, 302, 304, 306 implementiert
sind. Auf der Basis der Verzögerungsinformationen
Vi(t) und SFi(t)
sowie auf der Basis des der einzelnen virtuellen Quelle zugeordneten
Audiosignals ASi(t) wird für einen
aktuellen Zeitpunkt tA ein diskreter Wert
AWi(tA) für das Komponentensignal
Kij in einem letztendlich erhaltenen Lautsprechersignal
berechnet. Dies erfolgt durch Einrichtungen, 310, 312, 314, 316,
wie sie in 3 schematisch dargestellt sind. 3 zeigt ferner
gewissermaßen
eine „Blitzlichtaufnahme" zum Zeitpunkt tA für
die einzelnen Komponentensignale. Die einzelnen Komponentensignale
werden dann durch einen Summierer 320 summiert, um den
diskreten Wert für
den aktuellen Zeitpunkt tA des Lautsprechersignals
für den
Lautsprecher j zu ermitteln, der dann für den Ausgang (beispielsweise
der Ausgang 214, wenn der Lautsprecher j der Lautsprecher LS3
ist), dem Lautsprecher zugeführt
werden kann.
-
Wie
es aus 3 ersichtlich ist, wird zunächst für jede virtuelle Quelle einzeln
ein aufgrund einer Verzögerung
und einer Skalierung mit einem Skalierungsfaktor zu einem aktuellen
Zeitpunkt gültiger
Wert berechnet, wonach sämtliche
Komponentensignale für
einen Lautsprecher aufgrund der verschiedenen virtuellen Quellen
summiert werden. Wäre
beispielsweise nur eine virtuelle Quelle vorhanden, so würde der
Summierer entfallen, und das am Ausgang des Summierers in 3 anliegende
Signal würde
z. B. dem Signal entspre chen, das von der Einrichtung 310 ausgegeben
wird, wenn die virtuelle Quelle 1 die einzige virtuelle Quelle ist.
-
An
dieser Stelle sei darauf hingewiesen, daß an dem Ausgang 322 von 3 der
Wert eines Lautsprechersignals erhalten wird, das eine Überlagerung
der Komponentensignale für
diesen Lautsprecher aufgrund der verschiedenen virtuellen Quellen 1,
2, 3, ..., n ist. Eine Anordnung, wie sie in 3 gezeigt
ist, wäre
prinzipiell für
jeden Lautsprecher 808 im Wellenfeldsynthesemodul 810 vorgesehen,
es sei denn, daß,
was aus praktischen Gründen
bevorzugt wird, immer z. B. 2, 4 oder 8 zusammenliegende Lautsprecher
mit demselben Lautsprechersignal angesteuert werden.
-
Bei
einem bevorzugten Ausführungsbeispiel der
vorliegenden Erfindung wird unterschieden, ob sich die virtuelle
Quelle innerhalb des Zuhörerraums befindet,
oder ob sich die virtuelle Quelle außerhalb des Zuhörerraums
befindet. Die Situation der virtuellen Quelle innerhalb des Zuhörerraums
wird anhand von 4 dargestellt, während die
Situation der virtuellen Quelle innerhalb des Zuhörerraums
anhand von 6 erläutert werden wird.
-
In 4 ist ein Zuhörerraum 902 dargestellt, wobei
sich jedoch die virtuelle Quelle 900 außerhalb des Zuhörerraums
befindet. Ferner ist in 4 eine Receiver-Linie 400 dargestellt,
die derart definiert ist, daß auf
ihr eine optimale Wellensynthese stattfindet. Bei einem bevorzugten
Ausführungsbeispiel
der vorliegenden Erfindung wird die Receiver-Linie 400,
die für
jede virtuelle Quelle einzeln berechnet wird, so definiert, daß sie einerseits
durch den Mittelpunkt 402 des Zuhörerraums verläuft und
andererseits senkrecht zu einer Linie 404 ist, die sich
von der virtuellen Quelle 900 zu dem Mittelpunkt 402 des
Zuhörerraums
erstreckt. Die Receiver-Linie 400 bildet die Grenze zwischen den
relevanten Lautsprechern, die sich auf der zur virtuellen Quelle 900 zugewandten Seite
der Receiver-Linie 400 befinden, und den nicht-relevanten
Lautsprechern, die sich auf der anderen Seite der Receiver-Linie
befinden. Die Bestimmung der oberhalb der Receiver-Linie 400 liegenden Lautsprecher
als relevante Lautsprecher (vorzugsweise noch unter Berücksichtigung
des 90°-Kriteriums
für virtuelle
Quellen außerhalb
des Raums, auf das später
noch eingegangen wird) stellt sicher, daß zumindest sämtliche
Lautsprecher des Lautsprecher-Unterarrays 904a, die Lautsprechersignale emittieren,
die eine Komponente parallel zur Linie 404 haben, die jedoch
entgegengesetzt zu der Richtung von der virtuellen Quelle 900 zu
dem Mittelpunkt des Zuhörerraums
gerichtet ist, nicht mit Treibersignalkomponenten beaufschlagt werden.
Da sich die virtuelle Quelle an der in 4 gezeigten
Position befindet, ist eine Artefakt-reduzierte oder sogar Artefakt-freie
Wiedergabe dann erreicht, wenn der Zuhörer, der beispielsweise auf
der Receiver-Linie und insbesondere im Mittelpunkt des Zuhörerraums
als definierter Zuhörerposition
angeordnet ist, spürt,
daß der
Schall aus der Richtung der virtuellen Quelle 900 kommt
und nicht gewissermaßen „von hinten", wenn der Zuhörer an der
definierten Zuhörerposition 402 in Richtung
der virtuellen Quelle 900 sieht. So stellt es ein Artefakt
dar, daß der
Zuhörer,
obgleich er die virtuelle Quelle vor sich sieht, eine Wellenfront
wahrnimmt, die sich von seinem Rücken
zu seiner Vorderseite ausbreitet.
-
Ferner
sei darauf hingewiesen, daß für sämtliche
Lautsprecher, die jenseits der Receiver-Linie liegen, also für die Lautsprecher
auf der Seite der Receiver-Linie 400, die von der virtuellen
Quelle 900 weggewandt ist, eine Anwendung der üblichen
Wellenfeldsynthese-Formen zur Berechnung der Skalierung problematisch
ist.
-
Weiterhin
wird es für
Quellen außerhalb
des Raumes bevorzugt, daß nur
die Lautsprecher als relevante Lautsprecher ermittelt werden, bei
denen der Winkel zwischen einer Lautsprecherachse 500 und einer
Linie von der virtuellen Quelle 900 zu dem Lautsprecher
nicht größer als
90 Grad ist, da dieser Lautsprecher sonst keinen Artefakt-freien
Beitrag für
die virtuelle Quelle 900 liefern wird, wie es anhand von 5 dargestellt
ist. So wird es bevorzugt, nur die Lautsprecher als relevante Lautsprecher
zu ermitteln, bei denen der Winkel α, wie er in 5 eingezeichnet
ist, kleiner oder gleich 90 Grad ist.
-
Nachfolgend
wird anhand von 6 auf die Situation eingegangen,
bei der sich die virtuelle Quelle 900 im Zuhörerraum
befindet. Insofern ähnelt
die Situation in 6 der in 9 dargestellten
allgemeinen Problematik. Analog zu 9 ist auch
in 6 das „Erzeugungs-Wellenfeld" mit gestrichelten Linien
dargestellt, während
das „Nutz-Wellenfeld" mit durchgezogenen
Linien, die mit einer Pfeilspitze abgeschlossen sind, dargestellt
ist. Ferner ist in 6 ebenfalls der Mittelpunkt 402 des
Zuhörerraums
als Beispiel für
eine definierte Zuhörerposition
eingezeichnet. Wieder ist ein Lautsprecher des unteren Lautsprecher-Unterarrays 904a als
Artefakt-erzeugender Lautsprecher dargestellt. Insbesondere ist bei
dem in 6 gezeigten Beispiel der Zuhörerraum beispielhaft durch
eine Teilungslinie 600 in einen Artefakt-freien Bereich 600a,
in dem sich nach erfindungsgemäßer Bestimmung
der relevanten Lautsprecher lediglich das Nutz-Wellenfeld befindet,
und in einen Artefakt-Bereich 600b aufgeteilt, in dem sich lediglich
das Er zeugungs-Wellenfeld befindet, in dem jedoch aufgrund der Deaktivierung
der Artefakt-erzeugenden Lautsprecher für die virtuelle Quelle kein Nutz-Wellenfeld
der virtuellen Quelle 900 befindet, sondern lediglich das
Erzeugungs-Wellenfeld, das richtungsmäßig entgegengesetzt zu dem
Nutz-Wellenfeld ist.
-
Die
im Hinblick auf 5 dargestellte 90-Grad-Grenze
existiert bei dem in 6 gezeigten Szenario, bei dem
sich die virtuelle Quelle 900 innerhalb des Zuhörerraums 902 befindet,
nicht, da prinzipiell alle Lautsprecher einen Beitrag liefern können.
-
Da
sich aber aufgrund der Artefakte der sich mit entsprechenden Richtungen
ausbreitenden Wellenfelder erfindungsgemäß der Hörer nicht zwischen den Lautsprechern
und der virtuellen Quelle befinden soll, um nicht das „Erzeugungs"-Wellenfeld zu hören, wird bei der Ermittlung
der relevanten Lautsprecher vorgegangen, wie es nachfolgend anhand
von 7 dargestellt wird. Wieder wird die Receiver-Linie 400 herangezogen,
um die relevanten Lautsprecher von den nicht-relevanten Lautsprechern zu trennen.
Im einzelnen wird wieder, wie es anhand von 4 bereits
erläutert
wird, vorzugsweise die Receiver-Linie für die virtuelle Quelle 900 derart
positioniert, daß sie durch
den Mittelpunkt 402 des Zuhörerraums bzw. des Wellenfeldsynthese-Lautsprecherarrays
verläuft. Ferner
wird wieder die Linie 404 von der virtuellen Quelle 900 zu
dem Mittelpunkt 402, der beispielsweise die definierte
Zuhörerposition
ist, konstruiert, um dann eine Teilungslinie 600 zu bilden,
die parallel zu der Receiver-Linie 400 ist, die jedoch
durch die virtuelle Position der virtuellen Quelle 900 verläuft, wie
es anhand von 7 ersichtlich ist. Damit wird
der Zuhörerraum
wieder in den Artefakt-freien Bereich 600a und den Artefakt-behafteten Bereich 600b aufgeteilt, wobei
der Artefakt-freie
Bereich 600a der Bereich des Zuhörerraums bezüglich der
Teilungslinie 600 ist, in dem sich die definierte Zuhörerposition 402 befindet,
während
der Artefakt-behaftete Bereich 600b der Bereich des Zuhörerraums
ist, in dem sich der definierte Zuhörer nicht befindet.
-
Die
Basis für
die Definition der Teilungslinie 600 und damit der relevanten
Lautsprecher einerseits und der nicht-relevanten Lautsprecher andererseits
ist somit bei dem in 7 gezeigten Ausführungsbeispiel
die Festlegung der Receiver-Linie für die Wellenfeldsynthese, die
relativ frei erfolgen kann. Wie es ausgeführt worden ist, ist die Linie,
für die
es keinen Amplitudenfehler gibt, die Receiverlinie, während es
vor und hinter der Receiver-Linie aufgrund der Tatsache, daß das Lautsprecherarray
nicht vollständig
dreidimensional ist, einen geringen Fehler aus systematischen Gründen geben
wird.
-
Ferner
wird bei dem in 7 gezeigten Ausführungsbeispiel
der Mittelpunkt des Arrays als Zuhörerposition gewählt, durch
den insbesondere die Receiver-Linie gehen soll, derart, daß wenigstens
in der Mitte des Zuhörerraums
kein Amplitudenfehler vorhanden ist. Darüber hinaus wird es bevorzugt,
die Receiverlinie als gerade auszuführen, obgleich beliebige Receiver-Linienformen
möglich
sind, wie es ausgeführt
worden ist.
-
Ferner
wird es bevorzugt, die Teilungslinie 600 senkrecht zur
Geraden 404 von der virtuellen Quelle zum Mittelpunkt 402 auszuführen, derart,
daß die
Berechnungsmöglichkeit
für die
Wellenfeldsynthese aufgrund der damit vereinfachten geometrischen
Verhältnisse
effizienter ausführbar
ist.
-
Ferner
wird es bevorzugt, als Begrenzung für die relevanten Lautsprecher
wiederum die Linie zu wählen,
die parallel zur Receiver-Linie, aber durch die virtuelle Quelle
statt durch den Arraymittelpunkt läuft.
-
Wie
es bereits ausgeführt
worden ist, wird es bevorzugt, für
jede neue Position einer virtuellen Quelle die Situation der Lautsprecher
zu bestimmen, also die Unterscheidung zwischen relevanten und nicht-relevanten
Lautsprechern durchzuführen,
um eine optimale Artefakt-reduzierte Situation zumindest im größten Bereich
des Zuhörerraums
zu erreichen. Dies führt
jedoch dazu, daß bei
der Bewegung virtueller Quellen Lautsprecher aufgrund der Änderung der
Grenze zwischen relevanten und nicht-relevanten Lautsprechern an-
oder abgeschaltet werden. Zur Reduzierung von dabei potentiell auftretenden
leichten Knackgeräuschen
insbesondere bei Bewegungen von virtuellen Quellen im Zuhörerraum
und bei sinusförmigen
Audiosignalen wird es bevorzugt, im Falle daß ein Lautsprecher zu einem
vorherigen Zeitpunkt noch kein relevanter Lautsprecher war, jedoch aufgrund
einer sich bewegenden virtuellen Quelle zu einem relevanten Lautsprecher
geworden ist, diesen „neuerdings" relevanten Lautsprecher „weich" einzuschalten.
-
In
anderen Worten ausgedrückt
soll der Pegel eines neuerdings für relevant erkannten Lautsprechers
langsam auf seinen Nennpegel gebracht werden. Der Nennpegel ist
hierbei der Pegel bzw. die Skalierung, die die Einrichtung zum Berechnen
der Treibersignalkomponenten aufgrund der üblichen Wellenfeldsynthesegesetze
ermittelt. Damit wird sicherge stellt, daß keine Pegelsprünge auftreten,
insbesondere dann, wenn beispielsweise bei Quellen innerhalb des
Zuhörerraums
sich die Position stark verändert
und somit von einem Zeitpunkt zum nächsten ein Lautsprecher auf
einmal eine starke Signalkomponente aufgrund einer virtuellen Quelle
haben wird, die zum vorherigen Zeitpunkt noch nicht vorhanden war.
-
Je
nach Implementierung kann das „weiche" Einschalten dahingehend
stattfinden, daß innerhalb eines
Zeitraums von z. B. 10 Zeitpunkten, also 10 zeitlichen Abtastwerten
des Audiosignals, von einem Null-Pegel zum Zeitpunkt des Einschaltens
des Lautsprechers, also zum Zeitpunkt der Bestimmung, daß der Lautsprecher
relevant ist, auf den Nenn-Pegel, der
sich aufgrund der Wellenfeldsyntheseberechnungen ergibt, gegangen
wird.
-
Die
detaillierte Wahl der „Einschaltzeitdauer", also ob es sich
hier um, wie vorstehend ausgeführt,
10 Zeitpunkte handeln wird oder auch nur um zwei Zeitpunkte oder
sogar um 20 Zeitpunkte, wird insbesondere von der konkreten Implementierung abhängen, da
auch noch sonstige Anforderungen der Wellenfeldsynthese betrachtet
werden müssen, nämlich daß der Gesamtpegel
der virtuellen Quelle trotzdem stimmen sollte, und daß die Lokalisierbarkeit
der virtuellen Quelle nicht verloren gehen darf, wenn zu stark auf
den Pegel der Treibersignalkomponenten aufgrund einer virtuellen
Quelle eingewirkt wird.
-
In
diesem Zusammenhang sei darauf hingewiesen, daß die erfindungsgemäßen Manipulationen dazu
führen
können,
daß Treibersignalkomponenten für nicht-relevante
Lautsprecher, die, wie es oben ausgeführt worden sind, nicht zu den
Laut sprechern bereitgestellt werden, die jedoch von einer Wellenfeldsyntheseeinrichtung
berechnet werden können, dazu
führen
werden, daß es
zu einem insgesamt wahrgenommenen reduzierten Pegel des Audiosignals
von der virtuellen Quelle kommt. Dieser Problematik kann dahingehend
gegengewirkt werden, daß die
Treibersignalkomponenten für
die relevanten Lautsprecher angehoben werden, um insgesamt wieder
einen bestimmten Soll-Pegel der virtuellen Quelle gewissermaßen am „Ohr" des Zuhörers au
erreichen. In diesem Zusammenhang wird es bevorzugt, Treibersignalkomponenten
für Lautsprecher,
die sich gerade noch im Einschaltvorgang befinden, die also noch
nicht beispielsweise 10 Zeitpunkte hintereinander relevant waren,
von einer solchen Pegelanhebung auszunehmen, derart, daß zwar einerseits
der Pegel der virtuellen Quelle ohne Pegelschwankungen wahrgenommen
wird, daß jedoch
andererseits das „weiche" Einschalten nicht
gefährdet
wird.
-
Bezüglich des
weichen Einschaltens sei darauf hingewiesen, daß die Amplitude der Treibersignalkomponente
für einen
Lautsprecher, der sich gerade im Einschaltvorgang befindet, über eine
vorbestimmte Anzahl von Zeitpunkten stufenförmig, linear, sinusförmig oder
auf eine beliebige andere Art und Weise monoton angehoben werden
kann, je nach vorhandenen Rechenressourcen und Implementierungswünschen.