Generierung von 3D-Audio mittels eines Raytracing Verfahrens

Diplomarbeit von Frank Ullmann

Aufgabenstellung

Aufgabe meiner Diplomarbeit ist die Erzeugung von 3D-Audio mittels eines Raytracing-Verfahrens. Durch dieses Raytracing-Verfahren können die Wege der Schallwellen simuliert und ein räumlicher Klang berechnet werden. Als Eingabe erwartet das Programm die Abmessungen des Raumes und die Position der Schallquelle und des Hörers. Ferner muß eine Mono-WAV-Datei angegeben werden, die mit Hilfe von sogenannten HRTFs (Head Related Transfer Functions) in eine Stereo-WAV-Datei konvertiert wird, die über Kopfhörer ausgegeben einen 3D-Audio-Effekt repräsentiert.

Was ist Audio 3D?

Das Ziel bei der Entwicklung von 3D-Audio basiert auf der Möglichkeit, die Position von Schallquellen in der dritten Dimension zu bestimmen. Denn während zum Beispiel bei dem herkömmlichen Stereo – Sound lediglich eine rechts – links – Ortung möglich ist, garantiert der dreidimensionale Sound eine realistische räumliche Lokalisierung der Schallquelle(n).

Um wirklichkeitsgetreue dreidimensionale Ergebnisse zu erzielen, bedarf es dabei einer genaueren Untersuchung des menschlichen Hörens. Im Gegensatz zu dem Sehen, welches der Wissenschaft längst genau bekannt ist, streiten sich die Wissenschaftler noch bei der Vorgehensweise des Gehirns bei der Ortung einer oder mehreren Schallquellen. Denn während beim Sehen die dreidimensionale Welt in zwei Abbildungen geometrisch aufgeteilt wird und dann im Gehirn durch die leichten Differenzen beider Bilder wieder ein räumlicher Effekt entsteht, verläuft die Wahrnehmung des Schalls wesentlich komplizierter.

Die beiden wichtigsten Aspekte bei der Ortung einer Schallquelle sind zum einen die Pegelunterschiede des eintreffenden Schalls links und rechts und zum anderen die leichten zeitlichen Differenzen. Liegt zum Beispiel die Schallquelle direkt zur rechten Seite, so wird das rechte Ohr einen höheren Schallpegel orten als das linke Ohr. Außerdem erreicht aufgrund der Schallgeschwindigkeit von lediglich 340 Metern pro Sekunde dieser Schall das rechte Ohr um ein Bruchteil einer Sekunde eher als das linke Ohr. Diese beiden Aspekte bestimmen weitestgehend die grobe Richtung, aus der der Schall kommt. Von der Wissenschaft wird heute angenommen, daß das Gehirn speziell für höhere Frequenzen eher die Pegeldifferenzen beider Ohren auswertet, während für tiefe Frequenzen mehr die unterschiedlichen Signallaufzeiten zur Ortung herangezogen werden.

Was sind HRTFs?

HRTFs (Head Related Transfer Functions) sind Hauptbestandteil der Simulation räumlichen Klanges. Sie bestehen aus einer Vielzahl von Finite Impulse Response Filtern (FIR-Filter : digitale akustische Filter, die das Frequenzspektrum mit Hilfe einer mathematischen Formel verändern können) und simulieren die natürliche Filterung von Schall, die an dem äußeren Ohr stattfindet. Anatomisch bedingt wird nämlich der Schall, der das menschliche Ohr erreicht, durch z.B. Kopfschatten oder Reflexionen an der Schulter bzw. an dem Körper verändert. Die HRTFs versuchen nun diese Beeinflussung des Schalls durch entsprechende Filterung zu simulieren und so dem Gehirn ein räumliches Klangerlebnis vorzutäuschen. Aus diesem Grund besitzen die HRTFs außer der Frequenzabhängigkeit auch noch eine Richtungsabhängigkeit, denn die anatomisch bedingten Schallveränderungen hängen stark von der Schalleinfallsrichtung ab.

Abbildung 1 zeigt ein Beispiel dieser HRTFs. Auf dem linken Diagramm erkennt man das noch unveränderte Eingangssignal. Es besitzt bei allen Frequenzen die gleiche Intensität. Liegt nun die Schallquelle dieses Signals genau in einem horizontalen 90-Grad-Winkel, d.h. direkt rechts vom Hörer, so müssen die Intensitäten der einzelnen Frequenzen nach dem rechten Diagramm für jedes einzelne Ohr abgeändert werden. Dies erreicht man, in dem man das Eingangssignal durch den für diese Richtung entsprechenden HRTF – Filter schickt. Sehr gut zu erkennen sind die deutlichen Unterschiede bei hohen Frequenzen, denn während das linke Ohr (durchgezogene Linie) durch Kopfschatten eine hohe Dämpfung bei diesen Frequenzen erfährt, fallen die Intensitäten am rechten Ohr (gepunktete Linie) weitaus größer aus.

Für die Berechnung der Schalleinfallsrichtung dient nun der Raytracing-Ansatz. Dieser berechnet alle möglichen Strahlen, die von der Schallquelle aus den Kopf des Hörers treffen. Wird ein weiterer Treffer gefunden, so kann durch die beiden leicht zu berechnenden Winkel (horizontal und vertikal) die entsprechende HRTF-Tabelle geladen und mit dessen Hilfe die Eingangs-WAV-Datei dementsprechend verändert werden.

Ziel der Arbeit

Ziel meiner Diplomarbeit war die Simulation von dreidimensionalen Sound durch die Kombination von graphischen Aspekten (Raytracing) und akustischen Aspekten (Filter). Da im voraus bereits bekannt war, daß dies einen enormen Rechenaufwand mit sich zieht, wurde bewußt auf eine Online – Berechnung des dreidimensionalen Sounds verzichtet. Das Augenmerk lag vielmehr auf dem Versuch, solch eine Berechnung überhaupt erst zu programmieren und im Falle eines Erfolges, diese in ein qualitativ hochwertiges Maß zu bringen.

Im Gegensatz zu den bisher bereits existierenden Arbeiten zu diesem Thema (s.u.) sollte diese Diplomarbeit also nicht in Echtzeit den dreidimensionalen Sound berechnen können, sondern viel mehr Wert auf die Qualität legen. Denn durch eine evtl. Echtzeit-Berechnung müßten bei einem solchen Rechenaufwand Abstriche bzgl. der Qualität in Kauf genommen werden. Testdurchläufe zeigten nun, daß ein Pentium 133 mit 32 MB Hauptspeicher für die Berechnung eines 10 Sekunden-Samples in CD-Qualität ca. 80 Minuten benötigt.

Ge­ne­rie­rung von 3D-Au­dio mit­tels ei­nes Ray­tra­cing Ver­fah­rens

Aufgabenstellung

Was ist Audio 3D?

Was sind HRTFs?

Ziel der Arbeit

Verwandte Arbeiten / Literatur im Internet

Generierung von 3D-Audio mittels eines Raytracing Verfahrens