Transkription im Vergleich
Wie präzise ist scryp bei deutschsprachiger Transkription - und wie sicher sind Ihre Daten im Vergleich zu den großen Cloud-Diensten? Hier die Ergebnisse unseres Benchmarks.
Transkriptions-Genauigkeit für Deutsch
Word Error Rate (WER) - niedriger ist besser. Accuracy = 100 % − WER.
← Tabelle seitlich scrollen →
| Anbieter | Allgemein (Accuracy) | Fachdomäne (Accuracy) | WER Allgemein |
|---|---|---|---|
| scrypSX-3 | 97.2 % | 96.1 % | 2.8 % |
| OpenAIWhisper Large v3 | 91.8 % | 83.5 % | 8.2 % |
| Google STTCloud Speech-to-Text | 88.5 % | 80.2 % | 11.5 % |
| Azure SpeechMicrosoft Cognitive | 87.9 % | 78.7 % | 12.1 % |
| AWS TranscribeAmazon Standard | 85.7 % | 75.9 % | 14.3 % |
Testdatensatz & Methodik
- Grundlage ist ein eigener Testdatensatz aus öffentlich verfügbaren österreichischen Audio-Aufnahmen in den Domänen Allgemein, Gesundheit und Recht.
- Alle Anbieter wurden mit identischen Audiodateien und einheitlicher Auswertungsmethodik getestet (Word Error Rate nach Standard-Normalisierung).
- Die Spalte Fachdomäne zeigt den Durchschnitt über Gesundheits- und Rechtsaufnahmen. Bei Fachvokabular steigt die Fehlerrate bei allen Anbietern - bei Modellen ohne domänenspezifisches Training jedoch deutlich stärker.
- Ergebnisse können je nach Audioqualität, Sprecheranzahl, Dialekt und konkretem Einsatzszenario abweichen.
Warum scryp bei sensiblen Inhalten anders aufgebaut ist
Diese Punkte beschreiben die Architektur von scryp selbst. Sie sind bewusst präzise formuliert und nicht als pauschale Aussage über jeden anderen Anbieter zu verstehen.
Verschlüsselung auf Ihrem Gerät
Dateien werden vor dem Upload im Browser verschlüsselt. Gespeicherte Inhalte liegen dauerhaft nur verschlüsselt vor.
Klare EU-Architektur
Transkription in Österreich, verschlüsselte Speicherung in Deutschland. Damit ist nachvollziehbar, wo welcher Verarbeitungsschritt stattfindet.
Eigene Verarbeitungsinfrastruktur
Für die Transkription werden keine externen KI-Drittanbieter eingebunden. Das reduziert zusätzliche Datenflüsse und Abhängigkeiten.
Produktiver Browser-Workflow
Bearbeiten, Exportieren, Teilen und Audio-Sync sind direkt im Produkt integriert statt nur über einzelne API-Bausteine abbildbar.
Quellen & Dokumentation
Anbieterfunktionen wurden anhand offizieller Dokumentation geprüft. Genauigkeitswerte basieren auf dem oben beschriebenen Testdatensatz.
Modelle & Genauigkeit
- Radford et al. (2022): Robust Speech Recognition via Large-Scale Weak Supervision - OpenAI Whisper Paper
- OpenAI Whisper Repository - Modelle und Sprachen
- faster-whisper (SYSTRAN) - CTranslate2-basierte Whisper-Implementierung
- pyannote.audio 3.x - Speaker Diarization Pipeline
- Mozilla Common Voice - Offener Sprachdatensatz
Anbieter-Dokumentation
- Google Cloud Speech-to-Text - Funktionsübersicht und Spracherkennung
- Google Cloud Speech-to-Text - Speaker Diarization
- Microsoft Azure Speech Service - Übersicht und Dokumentation
- Azure Speech - Real-time diarization quickstart
- Amazon Transcribe - Entwicklerhandbuch
- Amazon Transcribe - Speaker partitioning (Diarization)
Bereit für sichere Transkription?
Testen Sie scryp kostenlos - verschlüsselt ab der ersten Sekunde.