Alle Beiträge
9 Min. Lesezeit

Untertitel erstellen: Schritt-für-Schritt-Anleitung für barrierefreie Videos

Seit dem 28. Juni 2025 gilt in Deutschland das Barrierefreiheitsstärkungsgesetz (BFSG). In Österreich setzt das Barrierefreiheitsgesetz (BaFG) dieselbe EU-Richtlinie um. Unternehmen, die digitale Produkte oder Dienstleistungen an Verbraucher richten, müssen ihre Inhalte barrierefrei gestalten – einschließlich Videos auf der eigenen Website. Untertitel sind dabei eine der zentralen Anforderungen.

Trotzdem haben viele Unternehmen noch nicht umgestellt. Häufig fehlt nicht der Wille, sondern das Wissen: Welche Untertitel sind „barrierefrei"? Welches Format brauche ich? Und wie erstelle ich sie effizient, ohne jedes Video manuell zu bearbeiten?

Diese Anleitung führt Sie durch den gesamten Prozess – von den gesetzlichen Anforderungen bis zur fertigen Untertiteldatei.

Was BFSG und BaFG für Videos bedeuten

In Deutschland verpflichtet das BFSG seit Juni 2025 Unternehmen mit B2C-Angeboten, Videos barrierefrei zu gestalten. In Österreich setzt das BaFG dieselbe EU-Richtlinie um. Konkret bedeutet das: Untertitel für aufgezeichnete Videos, Audiodeskription für rein visuelle Inhalte und Transkripte als schriftliche Vollversion. Der technische Standard ist WCAG 2.1 Konformitätsstufe AA.

Das Barrierefreiheitsstärkungsgesetz setzt die europäische Richtlinie (EU) 2019/882 (European Accessibility Act) in deutsches Recht um. In Österreich geschieht dies durch das Barrierefreiheitsgesetz (BaFG). Für Unternehmen ist deshalb weniger die Abkürzung entscheidend als die praktische Umsetzung: Digitale Dienstleistungen müssen für Menschen mit Behinderungen nutzbar sein. Der technische Standard dahinter ist die WCAG 2.1 Konformitätsstufe AA.

Für Videos bedeutet das konkret drei Pflichten:

  • Untertitel für alle aufgezeichneten Videos mit gesprochenem Inhalt (WCAG 1.2.2)
  • Audiodeskription für visuelle Inhalte, die nicht aus dem Ton erschließbar sind (WCAG 1.2.3)
  • Transkripte als schriftliche Vollversion des gesprochenen Inhalts (WCAG 1.2.1)

Betroffen sind B2C-Angebote – also Websites, Shops und Apps, die sich an Verbraucher richten. Kleinunternehmen mit weniger als zehn Mitarbeitern und maximal zwei Millionen Euro Jahresumsatz sind ausgenommen. Für alle anderen drohen bei Verstößen Bußgelder. Für österreichische Unternehmen gelten dieselben inhaltlichen Anforderungen über das BaFG.

Standard-Untertitel vs. barrierefreie Untertitel

Standard-Untertitel geben nur den gesprochenen Text wieder. Barrierefreie Untertitel (SDH) beschreiben zusätzlich relevante Geräusche, Musik, Sprecherwechsel und die emotionale Tonlage. Nur barrierefreie Untertitel erfüllen die WCAG-Anforderungen und damit die Anforderungen barrierefreier Videoangebote.

Nicht jeder Untertitel erfüllt die Anforderungen barrierefreier Videoangebote nach BFSG bzw. BaFG. Plattformen wie YouTube erzeugen automatische Untertitel – diese reichen für die gesetzliche Konformität in der Regel nicht aus. Der Unterschied liegt im Detail:

  • Standard-Untertitel geben nur den gesprochenen Text wieder. Sie helfen bei leisem Ton oder fremder Sprache, sind aber für gehörlose Menschen unvollständig.
  • Barrierefreie Untertitel (SDH) beschreiben zusätzlich relevante Geräusche ([Türklingel], [Applaus]), Musik ([spannende Musik]), Sprecherwechsel und die emotionale Tonlage. Sie machen den gesamten akustischen Kontext zugänglich.

Die WCAG verlangt barrierefreie Untertitel. Das bedeutet: Sprecherkennzeichnung, synchrone Einblendung, Beschreibung nicht-sprachlicher Audioinhalte und ausreichend Lesezeit pro Einblendung.

Untertitel erstellen: Schritt für Schritt

Der effizienteste Weg führt über eine KI-gestützte Transkription als Basis, die anschließend für Untertitelzwecke angepasst wird. Der Workflow besteht aus fünf Schritten:

  • 1. Audio vorbereiten: Extrahieren Sie die Tonspur aus Ihrem Video oder laden Sie die Videodatei direkt in ein Transkriptionstool hoch. Gängige Formate wie MP4, MOV, MP3, WAV und M4A werden von den meisten Diensten unterstützt. Je besser die Audioqualität, desto genauer die Transkription – Hintergrundgeräusche und Hall reduzieren die Erkennungsrate erheblich.
  • 2. Transkription erstellen lassen: Moderne KI-Modelle transkribieren Audio in wenigen Minuten mit über 95 % Genauigkeit bei Standardsprachen (Radford et al., 2022). Achten Sie darauf, dass das Tool Sprechererkennung (Diarization) unterstützt – bei Videos mit mehreren Personen ist die Zuordnung „wer spricht" für barrierefreie Untertitel Pflicht. Das Ergebnis ist ein zeitgestempeltes Transkript mit Sprecherwechseln.
  • 3. Transkript nachbearbeiten: Prüfen Sie das KI-Transkript auf Fehler, insbesondere bei Eigennamen, Fachbegriffen und Abkürzungen. Ergänzen Sie Beschreibungen für relevante Geräusche und Musik in eckigen Klammern. Achten Sie darauf, dass jeder Untertitelblock maximal zwei Zeilen umfasst und lang genug eingeblendet bleibt (Faustregel: mindestens eine Sekunde pro fünf Wörter).
  • 4. Untertiteldatei exportieren: Exportieren Sie das bearbeitete Transkript als SRT- oder VTT-Datei. Beide Formate enthalten Zeitstempel und Text und werden von allen gängigen Videoplattformen und Playern unterstützt. Welches Format Sie wählen, hängt vom Einsatzzweck ab (siehe nächster Abschnitt).
  • 5. Untertitel einbinden: Laden Sie die Untertiteldatei auf Ihrer Videoplattform hoch oder brennen Sie die Untertitel fest ins Video ein. Für Websites empfiehlt sich die zuschaltbare Variante (Closed Captions), damit Nutzer die Untertitel selbst aktivieren können.

SRT, VTT oder eingebrannt: Welches Format wann

Die Wahl des Untertitelformats hängt davon ab, wo und wie Sie das Video einsetzen:

  • SRT (SubRip): Der Industriestandard. Wird von YouTube, Vimeo, LinkedIn, WordPress und nahezu allen Videoschnittprogrammen unterstützt. Enthält Sequenznummer, Start-/Endzeit und Text. Ideal für die meisten Anwendungsfälle.
  • VTT (WebVTT): Der Web-Standard für HTML5-Video. Unterstützt zusätzlich Styling-Optionen wie Schriftfarbe, Positionierung und CSS-Klassen. Empfehlenswert, wenn Sie Videos in einem eigenen Player auf Ihrer Website einbetten und die Darstellung kontrollieren möchten.
  • Eingebrannt (Open Captions): Die Untertitel werden fest ins Video gerendert und sind immer sichtbar. Notwendig für Social-Media-Videos (Instagram Reels, TikTok), da diese Plattformen keine zuschaltbaren Untertitel unterstützen. Nachteil: Nachträgliche Korrekturen erfordern ein neues Rendering.

Für barrierefreie Videoangebote auf der eigenen Website empfiehlt sich SRT oder VTT als zuschaltbare Untertitel. Für Social Media ist Einbrennen die einzige Option.

Häufige Fehler bei Untertiteln

Selbst gut gemeinte Untertitel verfehlen die Barrierefreiheitsanforderungen, wenn typische Fehler unterlaufen:

  • Fehlende Sprecherkennzeichnung: Bei Videos mit mehreren Personen muss erkennbar sein, wer spricht. Ohne Kennzeichnung sind Diskussionen, Interviews und Dialoge nicht nachvollziehbar.
  • Zu schnelle Einblendung: Untertitel, die nur eine halbe Sekunde sichtbar sind, können nicht gelesen werden. Die WCAG empfiehlt maximal 20 Zeichen pro Sekunde.
  • Fehlender Kontrast: Weiße Schrift auf hellem Hintergrund ist unleserlich. WCAG verlangt ein Kontrastverhältnis von mindestens 4,5:1. Ein halbtransparenter schwarzer Balken hinter dem Text löst das Problem.
  • Keine Geräuschbeschreibungen: Wenn ein Alarmton ertönt oder jemand lacht und das für den Kontext relevant ist, muss es beschrieben werden – sonst fehlt gehörlosen Zuschauern eine entscheidende Information.
  • Automatische Untertitel ohne Korrektur: KI-generierte Untertitel enthalten Fehler. Eigennamen, Fachbegriffe und Zahlen werden regelmäßig falsch erkannt. Ohne menschliche Prüfung sind die Untertitel nicht zuverlässig.

Datenschutz bei der Untertitel-Erstellung

Unternehmensvideos enthalten oft vertrauliche Informationen – Produktankündigungen, interne Schulungen, Kundenstimmen oder Mitarbeiterinterviews. Wer die Audio-Spur zur Transkription an einen externen Dienst übergibt, sollte prüfen, wo die Daten verarbeitet und gespeichert werden.

Die DSGVO stellt klare Anforderungen an die Verarbeitung: Auftragsverarbeitungsvertrag, Verarbeitungsort innerhalb der EU und angemessene technische Schutzmaßnahmen. Besonders bei vertraulichen Inhalten bietet clientseitige Verschlüsselung den stärksten Schutz – der Transkriptionsdienst sieht dabei zu keinem Zeitpunkt den Klartext-Inhalt.

Checkliste: Barrierefreie Untertitel nach BFSG/BaFG

  • Alle Videos mit gesprochenem Inhalt haben Untertitel
  • Untertitel geben den gesprochenen Text vollständig und korrekt wieder
  • Sprecherwechsel sind gekennzeichnet
  • Relevante Geräusche und Musik sind in eckigen Klammern beschrieben
  • Untertitel sind synchron zum Audio (kein merklicher Versatz)
  • Einblendedauer ist ausreichend (mindestens 1 Sekunde pro 5 Wörter)
  • Schrift ist lesbar (ausreichende Größe, Kontrast mindestens 4,5:1)
  • Untertitel sind als SRT/VTT-Datei zuschaltbar oder fest eingebrannt
  • Automatische Transkription wurde manuell geprüft und korrigiert
  • Datenschutz bei der Transkription ist gewährleistet (AVV, EU-Verarbeitung, Verschlüsselung)

Fazit

BFSG und BaFG machen barrierefreie Untertitel für viele Unternehmensvideos zu einem echten Compliance-Thema – und das ist mehr als eine bürokratische Hürde. Barrierefreie Videos erreichen ein breiteres Publikum, verbessern die Nutzererfahrung und stärken die Auffindbarkeit in Suchmaschinen. Der effizienteste Weg führt über eine KI-gestützte Transkription mit anschließender manueller Prüfung und Export als SRT- oder VTT-Datei. Entscheidend ist, dass die Untertitel nicht nur den Text wiedergeben, sondern den gesamten akustischen Kontext – Sprecher, Geräusche, Stimmung – für alle zugänglich machen.

Hinweis: Dieser Beitrag dient der allgemeinen Information und ersetzt keine Rechtsberatung im Einzelfall.