Was ist automatische Transkription?

Automatische Transkription ist der Prozess der Erstellung einer schriftlichen Transkription von gesprochener oder aufgezeichneter Sprache durch den Einsatz von Computern und ohne direktes menschliches Eingreifen. Eine genaue automatische Transkription erfordert eine hochwertige Transkriptionssoftware und ein Gerät, das akustische Eingaben genau empfangen kann. Im Allgemeinen ist es auch erforderlich, dass die zu transkribierende Sprache oder Aufzeichnung einigermaßen frei von Verzerrungen und Störungen durch Hintergrundgeräusche ist. Es wurden auch Versuche unternommen, Musik mit Hilfe von Computern zu transkribieren, auf denen eine spezielle Transkriptionssoftware läuft. Die Musiktranskription beinhaltet das Aufschreiben der Noten eines bestimmten Musikstücks, insbesondere wenn es keine bereits vorhandene Notation für diese Musik gibt, wie dies bei improvisierten Soli der Fall ist.

Für eine erfolgreiche automatische Transkription ist eine gute Transkriptionssoftware erforderlich. Die Software ist dafür verantwortlich, die auditiven Eingaben zu verarbeiten, einen kontinuierlichen Sprachstrom in einzelne Wörter aufzuteilen, diese Wörter zu erkennen und sie im Text korrekt darzustellen. Ein Fehler in irgendeiner Phase dieses Prozesses führt im Allgemeinen zu einem Transkript, das sich etwas vom Ausgangsmaterial unterscheidet. Eine gute automatische Transkriptionssoftware sollte in der Lage sein, die feinen Unterschiede zwischen ähnlichen Wörtern zu erkennen und verschiedene Sprachstile und -geschwindigkeiten auszugleichen. Schwer verständliche Akzente sind selbst für die beste Transkriptionssoftware problematisch.

Manche Leute verwenden automatische Transkriptionssoftware, weil sie das Diktieren dem direkten Tippen oder Schreiben ihres Textes vorziehen. Einige Formen automatischer Transkriptionssoftware eignen sich für diesen Zweck besonders gut, da sie die Stimmen der Personen „lernen“, deren Wörter sie transkribieren. In solchen Fällen wird die automatische Transkription nicht verwendet, um Sprachtranskripte aus einer Vielzahl unterschiedlicher Quellen zu erstellen, sodass die Software nicht für eine Vielzahl von Sprachmustern offen sein muss. Diesen Optimierungsprozess, der bei längerer Nutzung der Software durch eine Person oder bei einer Vorkalibrierung erfolgen kann, zuzulassen, kann die Genauigkeit und potenzielle Geschwindigkeit des Diktats erheblich steigern.

Computer sind leider nicht so gut geeignet, menschliche Sprache konsistent und genau zu erkennen wie Menschen. Sie können beispielsweise kontextbezogene Hinweise nicht verwenden, wenn sie ein bestimmtes Wort nicht verstehen. Daher ist es häufig erforderlich, dass ein Mensch Transkripte, die durch automatische Transkription erstellt wurden, Korrektur liest. Kleinere Formatierungsfehler und verschiedene Fehler bei der Transkription sind in vielen Fällen üblich, es sei denn, die transkribierte Sprache ist sehr klar. Dennoch kann die Verwendung einer computergestützten Transkription schnell eine solide Grundlage für ein Transkript bilden, das vor der Einreichung oder Verwendung nur ein begrenztes menschliches Eingreifen erfordert.