Ent­wick­lung ei­nes Pro­gramms zur Ge­ne­rie­rung ei­nes ste­reo­gra­phi­schen Bild­paa­res aus ei­nem zwei­di­men­si­o­na­len Bild

Diplomarbeit von Lucas Wenke

Ziel

Ziel dieser Diplomarbeit ist es, aus einem einzigen Bild ein Stereobildpaar zu erzeugen, so daß der Betrachter in die Lage versetzt wird, die einzelnen Objekte der dargestellten Szene mit einem räumlichen Abstand wahrzunehmen. Unter Bilder gibt es ein Beispiel dafür.

Die Schwierigkeit der Transformation liegt nun darin, daß bei einem einzigen zweidimensionalen Bild keinerlei Tiefeninformation vorhanden ist. Deshalb liegt auch die Betonung auf  "ein Bild", da es bereits erfolgreiche Bemühungen gab, Objekte bzw. Szenen, von denen mehrere verschiedene Ansichten vorlagen, dreidimensional zu rekonstruieren.
Um dieses Ziel zu erreichen, muß zuerst ein Verfahren entwickelt und verifiziert werden. Wie es sich zeigen wird, kann das Verfahren nicht automatisch ausgeführt werden, d.h. man benötigt einen Operator, der die hauptsächlichen Schritte ausführt. Um den erforderlichen Aufwand in einem praktikablen Maß zu halten, ergibt sich die Notwendigkeit, Werkzeuge zu entwickeln, mit denen die gestellten Aufgaben so gut und so schnell wie möglich gelöst werden können.

In dieser Arbeit wird also ein Verfahren zur Generierung eines Stereobildpaares aus einem zweidimensionalen Bild entwickelt sowie ein Programm geschrieben, das den Anwender des Verfahrens bei seiner Arbeit weitestgehend unterstützt.

Motivation

Eine der nächsten Innovationen beim Fernsehen dürfte die Erweiterung des Bildes auf drei Dimensionen sein. Diese Behauptung stützt sich hauptsächlich auf die Entwicklung der stereographisch basierten Darstellungsgeräte. Zwar gibt es noch andere Möglichkeiten, dreidimensionale Bilder zu erzeugen, sie sind aber bei weitem noch nicht so flexibel und ausgereift. Einer der Gründe liegt sicherlich in der Stereographie selbst, ein anderer darin, daß dieses Darstellungsverfahren massiv im Bereich der virtuellen Welten (VR) zum Einsatz kommt. Dementsprechend wird geforscht und entwickelt, was zu immer preiswerteren und besseren Produkten führt. So ist es also nur noch eine Frage der Zeit, bis solche Erzeugnisse in den low-cost (Consumer) Markt vordringen. In der Tat gibt es bereits einige Hersteller, die diesen Marktbereich bedienen.

In einer ganz anderen Nische wird diese Technik bereits erfolgreich angewendet, und zwar in der Fernerkundung bzw. Fernsteuerung von Maschinen und Robotern oder auch in der Medizin. (Man denke nur an Pathfinder/Sojourner oder endoskopische Chirurgie). Dazu mußte jedoch erst das Problem der Stereobildübertragung gelöst werden. Das tat man durch Modifikation eines „normalen“ Videosignals, in das das „zweite“ zusätzliche Bild integriert wurde, bzw. man nahm direkt zwei Kanäle. Abgesehen davon bietet das hier vorgestellte Verfahren eine an, die das Stereobildpaar bis fast auf die Größe eines einzelnen Bildes herunterbricht.

Technisch wäre es also kein Problem, dem Endverbraucher ein 3D-Medium anzubieten und ihm Stereobilder zu übermitteln. Das Problem liegt eher darin, daß man keine Stereobilder - oder gar "Stereofilme" - hat, die man senden könnte. Im VR ist es der Rechner, der das Stereobildpaar erzeugt, bei der Fernerkundung hat man eine Stereokamera vor Ort, Filme aber werden und wurden, bis auf wenige Ausnahmen, nicht stereoskopisch gedreht.

Und genau hier setzt die Idee an:
Eine Software, die vorhandenes zweidimensionales Bildmaterial in dreidimensionales konvertieren könnte, würde dazu beitragen, diese Lücke zu schließen. Die Frage ist nur, ob es auch möglich ist, unter wirtschaftlich vertretbarem Aufwand vorhandenes zweidimensionales Filmmaterial nachträglich mit einem 3D-Effekt zu versehen. Nur dann ist es sinnvoll, zum Beispiel beliebte Spielfilme aufzuwerten, um sie neu vermarkten zu können.

Daß man mit der Nachbearbeitung von bereits vorhandenen und bekannten Filmen Erfolg haben kann, hat Georg Lucas erst kürzlich mit seiner Star-Wars-Trilogie gezeigt. Dabei hat er ja „nur“ die Qualität verbessert. Einen ähnlichen Effekt konnte auch bei der digitalen Audionachbearbeitung beobachtet werden. Durch sie wurde es möglich, die Alterserscheinungen der analogen Masterbänder in den Plattenarchiven zu eliminieren. Das wiederum versetzte die Produzenten in die Lage, auch die älteren Titel wieder zu vermarkten. - Diese beiden Beispiele zeigen, daß sich der mehr oder weniger große Aufwand der digitalen Nachbearbeitung durchaus wirtschaftlich lohnen kann, zumal die stereographische Nachbearbeitung zu einem völlig neuen Seh-Erlebnis führt.

Kernaussage:

3D-Fernsehen ist technisch machbar und auch für den Endverbraucher bezahlbar.
Manko: Es ist kaum Material zum Senden vorhanden.
=> Mit dem hier vorgestellten Verfahren/Programm könnte dieser Markt erschlossen werden ...

Zusammenfassung

Im Verlauf der Diplomarbeit gelang es, alle aufgestellten Ziele zu erreichen. Zusätzlich konnten bereits erste konkrete Erfahrungen in der Anwendung des Verfahrens gesammelt werden, die unter anderem bereits in der Implementation des Programmes berücksichtigt wurden. Zu nennen wäre da z.B. die Unterteilung des Verfahrens in die Schritte „Ausschneiden“ und „Wiedereinfügen“, deren Trennung im Programm nicht mehr gegeben ist. Ein weiteres unterschätztes Problem war die Rekonstruktion des Hintergrundes hinter der ausgeschnittenen Fläche. Bei der jetzigen Methode können unter Umständen stark störende Artefakte auftreten. Da sie aber mit wesentlich geringerem Aufwand zu realisieren ist als alle anderen Rekonstruktionsalgorithmen, wurde sie beibehalten.

Auf der theoretischen Seite gelang es, eine Funktion herzuleiten, die den Zusammenhang zwischen der Tiefe eines Punktes und dem Abstand seines korrespondierenden Punktepaares beschreibt. Auch die Positionierung des Punktepaares im Stereobildpaar konnte durch eine Formel belegt werden.

Im Laufe der Arbeit kristallisierte sich eine weitere Anwendung des Verfahrens heraus. Mit ihm, genauer gesagt mit dem zweiten Schritt, ist es nämlich auch möglich, ein Stereobildpaar auf gut die Hälfte zu komprimieren.

Waren bei Verwendung der bislang zur Verfügung stehenden Standardgraphiksoftware für die Bearbeitung eines Bildes noch fünf bis sechs Stunden erforderlich, so benötigt man mit dem hier erarbeiteten Programm nur noch fünf bis zehn Minuten. Wie sich diese Leistung noch weiter steigern ließe, zeigt der Abschnitt Ausblick.