Die menschliche Stimme im KI-Zeitalter – Wer kontrolliert eigentlich unsere Stimmen?

von Ann Vielhaben (Kommentare: 0)

In: Blog, Branchenwissen & Mentoring

Die Diskussion über künstliche Stimmen hat die Medien­branche längst erreicht. Was vor wenigen Jahren noch wie Zukunfts­musik klang, ist heute Teil vieler Produktions­prozesse: KI kann Stimmen generieren, Texte sprechen und sogar Stimmprofile imitieren.

Damit stellt sich eine grund­legende Frage: Wer entscheidet eigentlich über die Nutzung menschlicher Stimmen?

Als Sprecherin arbeite ich seit über 20 Jahren Jahren mit meiner Stimme – in Hörbüchern, für Synchronisationen, Werbung, Games und viele andere Formate. Für mich ist sie nicht nur ein Arbeitsmittel, sondern das zentrale Werkzeug meiner künstlerischen Arbeit und meines persönlichen Ausdrucks.

Gerade deshalb beschäftigt viele Kolleginnen und Kollegen derzeit eine Entwicklung, die weit über technische Innovation hinausgeht: Sprach­aufnahmen sollen zunehmend auch als Trainings­material für KI-Systeme genutzt werden. Oft geschieht das in Vertrags­lauseln oder Plattform­modellen, die für Sprecherinnen und Sprecher kaum transparent sind.

Die Frage ist also nicht nur, was technisch möglich ist.
Die entscheidende Frage lautet: Wer behält die Kontrolle über menschliche Stimmen?

Wenn Stimmen zu Trainingsdaten werden sollen

Anfang 2026 sorgten neue Vertrags­klauseln in der Synchron­branche für große Aufmerksamkeit. Sie sollten es ermöglichen, Sprach­aufnahmen künftig auch für das Training künstlicher Intelligenz zu verwenden.

Viele Sprecherinnen und Sprecher reagierten darauf mit deutlicher Kritik. Die Sorge: Wenn Stimmen einmal als Trainings­material genutzt werden, könnten daraus künstliche Versionen entstehen, die langfristig die Arbeit der ursprünglichen Sprecher ersetzen.

Besonders sichtbar wurde diese Debatte im Zusammen­hang mit großen Streaming­produktionen. Für viele Kolleginnen und Kollegen stellte sich plötzlich eine sehr grundlegende Frage: Wer kontrolliert eigentlich die weitere Nutzung unserer Stimmen?

Das Gutachten von Spirit Legal

Der Verband Deutscher Sprecher:innen (VDS), dessen Mitglied ich bin, ließ entsprechende Vertrags­klauseln rechtlich prüfen. Ein Gutachten der Kanzlei Spirit Legal kam zu dem Ergebnis, dass zentrale Teile solcher Regelungen rechtlich problematisch sein können.

Ein wichtiger Kritikpunkt: Die Klauseln definieren oft nicht klar,

  • in welchem Umfang Sprachaufnahmen für KI genutzt werden dürfen
  • ob Sprecher der Nutzung ausdrücklich zustimmen müssen
  • und welche Vergütung dafür vorgesehen ist.

Damit berührt die Debatte grundlegende Fragen des Persönlichkeits- und Urheber­rechts. Denn eine Stimme ist nicht nur ein technisches Signal – sie ist ein persönliches Merkmal eines Menschen und zugleich das berufliche Werkzeug vieler Kreativer.

Hier geht zum Rechtsgutachten.

Wenn Sprecher ihre Stimmen selbst für KI freigeben

Gleichzeitig gibt es auch Kolleginnen und Kollegen, die sich bewusst dafür entscheiden, ihre Stimme für KI-Systeme zur Verfügung zu stellen.

Platt­ormen wie etwa ElevenLabs ermöglichen es Spreche­rinnen und Sprechern, sogenannte Stimmklone zu erstellen und diese anschließend zu lizenzieren. Die Idee dahinter: Die eigene Stimme wird digital reproduziert und kann von Nutzern für verschiedene Projekte eingesetzt werden.

Auf den ersten Blick wirkt dieses Modell attraktiv.

In der Praxis wirft es jedoch viele Fragen auf.

Zum einen ist die Vergütung derzeit häufig sehr gering – gemessen an der möglichen Nutzung der Stimme. Zum anderen bieten viele Platt­formen umfangreiche kostenlose Nutzungs­möglichkeiten für sogenannte Free-User-Accounts. Das bedeutet, dass Stimmen teilweise sehr weit verbreitet eingesetzt werden können, ohne dass dafür eine angemessene Vergütung entsteht.

Hinzu kommt ein strukturelles Problem: Sobald eine Stimme einmal digital reproduziert wurde, lässt sich ihre Nutzung nur noch schwer kontrollieren.

Meine persönliche Haltung

Ich beobachte diese Entwicklungen sehr genau.

Unter den derzeitigen Bedingungen halte ich es jedoch nicht für erstrebenswert, meine eigene Stimme in solche Systeme einzuspeisen.

Nicht, weil ich technische Innovation grundsätzlich ablehne. KI wird zweifellos Teil der Medien­produktion bleiben.

Aber Innovation darf nicht bedeuten, dass kreative Arbeit entwertet wird. Wenn Stimmen zur Entwicklung künstlicher Systeme genutzt werden, braucht es dafür klare Regeln, transparente Nutzungsmodelle und eine faire Vergütung.

Genau dafür setzen sich derzeit viele Sprecherinnen und Sprecher ein – auch im Verband Deutscher Sprecher:innen (VDS).

Warum klare Regeln notwendig sind

Die entscheidende Frage ist deshalb nicht, ob KI in der Audioproduktion eingesetzt wird.

Die entscheidende Frage lautet: unter welchen Bedingungen.

Aus meiner Sicht braucht es dafür mindestens drei grundlegende Voraus­setzungen:

  • die ausdrückliche Zustimmung der Sprecher­innen und Sprecher
  • transparente Nutzungs­bedingungen
  • faire Vergütungsmodelle.

Erst wenn diese Voraus­setzungen erfüllt sind, kann der Einsatz von KI-Stimmen auch für diejenigen fair sein, deren Stimmen die Grundlage solcher Systeme bilden.

Die menschliche Stimme im KI-Zeitalter

Die Medien­produktion wird sich weiter verändern. Neue Techno­logien haben die Branche immer wieder geprägt – vom Tonfilm über digitale Aufnahme­technik bis hin zu Streaming­plattformen.

Auch KI wird Teil dieser Entwicklung sein.

Doch bei aller technischen Innovation sollte eines nicht aus dem Blick geraten: Die menschliche Stimme ist mehr als eine Sammlung von Audiodaten.

Sie ist Ausdruck von Persönlich­keit, Erfahrung und Interpreta­tion.

Warum klare Regeln jetzt entscheidend sind

Die Diskussion über KI-Stimmen ist deshalb mehr als nur eine technische Debatte.
Sie ist eine Frage von Verantwortung, Fairness und Respekt gegenüber kreativer Arbeit.

Denn am Ende geht es nicht nur darum, was technisch möglich ist – sondern darum, wie wir als Branche mit den Stimmen der Menschen umgehen, die diese Branche tragen.

Die menschliche Stimme ist kein Rohstoff der Technolo­gie – sie ist Teil der Identität eines Menschen. Und genau so sollte sie auch behandelt werden.

Zurück

Einen Kommentar schreiben

Was ist die Summe aus 3 und 3?