SmHJHX

Am Freitag, den 25.10. werden wir ab 15.00 Uhr bis ca. 18 Uhr umfangreiche technische Wartungsarbeiten durchführen. Vielen Dank für Ihr Verständnis.

Andreas Bethke vom DBSV: KI in der Audiodeskription – Grenzen und Chancen


Andreas Bethke ist in seiner Funktion als Geschäftsführer des Deutschen Blinden- und Sehbehindertenverbands (DBSV) auch Ausrichter des Deutschen Hörfilmpreises, der jedes Jahr herausragende Leistungen im Bereich der Audiodeskription würdigt. Im Vorfeld der morgigen Verleihung (25.3.) macht er sich in einem Gastbeitrag Gedanken darüber, warum der zunehmende Einsatz von KI-Stimmen in der Audiodeskription zu hörbaren Rückschritten führen kann.

Unknown   scaled e x
Andreas Bethke, DBSV-Geschäftsführer (Credit: DBSV)

Der Deutsche Hörfilmpreis, der am 25. März 2025 in Berlin verliehen wird, widmet sich seit 2002 der Förderung von Barrierefreiheit im Bereich der audiovisuellen Medien, insbesondere für blinde und sehbehinderte Menschen. Die Idee, Filme für Menschen mit Seheinschränkungen zugänglich zu machen, entstand in den 1990er Jahren, als die Technologie der Audiodeskription begann, sich auch in Deutschland zu etablieren, und erste Hörfilme produziert wurden. Eine Audiodeskription (AD) beschreibt in knappen Worten zentrale Elemente der Handlung sowie Gestik, Mimik und Dekor. Diese Bildbeschreibungen werden in den Dialogpausen eingesprochen.

Der Deutsche Hörfilmpreis wurde vor 23 Jahren ins Leben gerufen, um herausragende Leistungen im Bereich der Audiodeskription zu würdigen. Dem Deutschen Blinden- und Sehbehindertenverband (DBSV) als Ausrichter des Preises geht es stets darum, für die Notwendigkeit des barrierefreien Zugangs zu audiovisuellen Medien zu sensibilisieren. Getreu dem Motto: Um Filme zu lieben, muss man sie nicht sehen. 

Der Deutsche Hörfilmpreis hat sich zu einer Preisverleihung entwickelt, die über die umfangreiche Medienberichterstattung eine große Öffentlichkeit erreicht und deren Gala Gäste aus Film, Medien, Wirtschaft, Politik und der Blinden- und Sehbehindertenselbsthilfe zusammenbringt.

Uns ist es mit den Verleihungen des Deutschen Hörfilmpreises und den Angeboten auf den Plattformen hörfilm.info und Kinofüralle.de gelungen, das Thema Audiodeskription stärker ins öffentliche Bewusstsein zu rücken und den Zugang für blinde und sehbehinderte Filmfans zu verbessern. Das Hörfilmangebot ist inzwischen in Deutschland deutlich ausgebaut. Allen voran gibt es bei den öffentlich-rechtlichen Sendern und Mediatheken ein umfassendes Angebot. Diverse Streaminganbieter haben nachgezogen. Leider gibt es bei den deutschen privaten Medien nach wie vor nur wenige Angebote mit Audiodeskription. Insgesamt aber ist die Tendenz steigend. Der positive Trend hin zu mehr Barrierefreiheit wurde auch unterstützt durch gesetzliche Bestimmungen und Empfehlungen. So stärkt das neue Filmförderungsgesetz durch die Erweiterung des § 46 FFG die Zugänglichkeit zu barrierefreien Filmfassungen spürbar. Wir freuen uns, dass nun künftig die barrierefreie Fassung eines Films auf allen Endkopien vorliegen und in der gesamten Verwertungskette des Films, also im Kino, aber auch bei Streamingdiensten und im TV, zugänglich gemacht werden muss. Das sieht der DBSV als einen ganz wichtigen Beitrag an, für mehr Teilhabe blinder und sehbehinderter Menschen am Filmgeschehen und damit auch an gesellschaftlicher Inklusion.

Bei allem Engagement für mehr Barrierefreiheit gilt es aber seit kurzem auch, das bereits Erreichte gegen eine Entwicklung zu schützen, die möglicherweise zu einem deutlich hörbaren Rückschritt führt.

In einer Welt, in der Künstliche Intelligenz (KI) überall Einzug hält, ist es kaum überraschend, dass das auch in der Filmindustrie geschieht, zum Beispiel durch KI-Stimmen, die Texte vorlesen oder Schauspieler und Schauspielerinnen im Synchronisationsprozess ersetzen oder eben auch die Audiodeskription übernehmen. Die KI spart Zeit und Kosten und erscheint besonders reizvoll für all jene, die sich eher verpflichtet fühlen, Audiodeskriptionen anzubieten, als dass sie die Audiodeskription als kreativ-künstlerische Ergänzung ihres Films wahrnehmen.

Diese technologischen Fortschritte werfen allerdings eine Reihe von Fragen auf, die nicht unbeachtet bleiben dürfen.

Denn der wohl größte Nachteil und gleichzeitig kaum zu behebende Mangel von KI-Stimmen ist der Verlust an Emotionalität und Nuancen. Sprecher und Sprecherinnen bringen nicht nur ihre Stimmen in eine Rolle oder Beschreibung ein, sondern auch ihre Persönlichkeit, Tonalitäten und Emotionen. Diese menschliche Interaktion mit dem audiovisuellen Material und seiner besonderen Stimmung ist ein wesentlicher Bestandteil der Audiodeskription. Ein menschlicher Sprecher reagiert subtil auf den Film und transportiert das vollständige Spektrum dargestellter, menschlicher Emotionen in seiner Stimme, die von einer Maschine (zumindest bis auf Weiteres) nicht nachgebildet werden kann. Ein AD-Sprecher kann auch in rasanten Situationen schneller mitgehen und die Stimme in ruhigeren Szenen ausdehnen. Ob eine KI stets korrekt die feine Tonalität von komplexen Filmgemälden zu interpretieren in der Lage sein wird, dürfte selbst unter den größten KI-Fans fraglich sein. Das aber würde die Wahrnehmung des Films durch blinde und sehbehinderte Filmfans in seiner Gesamtheit spürbar beeinträchtigen und das Hörerlebnis erheblich leiden lassen.

Und noch ein Grund spricht gegen den Einsatz von KI-Stimmen in der Audiodeskription: Filme sind oft Ausdruck einer bestimmten Kultur oder einer besonderen Verfasstheit – eines bestimmten Landes, eines soziokulturellen Umfelds oder einer bestimmten Zeit oder schlicht des jeweiligen Genres. Die Audiodeskription – wie übrigens auch die Synchronisierung – trägt dazu bei, dass der Film auch in dieser Hinsicht authentisch bleibt. KI-Stimmen, die auf Algorithmen und vorgefertigten Modellen basieren, können kulturelle Feinheiten nicht in der gleichen Weise vermitteln. Es bestünde sogar die Gefahr einer sprachlichen Gleichmacherei, die nicht auf kulturelle, genrebasierte oder sonstige Eigenheiten Rücksicht nimmt. Das aber ist für das Verständnis und die emotionale Bindung der Zuhörenden von elementarer Bedeutung.

Natürlich gibt es Szenarien, in denen KI als Werkzeug zur Unterstützung von Audiodeskriptionen sinnhaft und nützlich sein kann – etwa bei sachlichen Formaten von kurzer Verwertungsdauer wie Nachrichten oder bestimmten Dokumentationen. Hier eröffnet die KI sogar die Chance, Formate, die bislang wegen ihrer Kurzfristigkeit oder Schnelligkeit selten oder nie Audiodeskriptionen erfahren haben, barrierefrei zugänglich zu machen.

Doch wenn es um die Audiodeskription eines künstlerischen Filmwerkes geht, sollte der Mensch nach wie vor im Zentrum stehen. Es ist die Verbindung zwischen der Stimme und den Stimmungen, die er vermittelt, die den Film für die Zuhörenden lebendig macht. KI mag viele Dinge revolutionieren, aber in der Welt der Kunst, insbesondere der Filmkunst, sollte der menschliche Faktor nicht aus dem Blick geraten.