Was ist Audiotranskription?

Audiotranskription ist der Prozess, bei dem gesprochene Wörter in geschriebenen Text umgewandelt werden. In der Vergangenheit saß eine Person und schrieb Wörter so, wie sie gesprochen wurden. Inzwischen gibt es Tonaufnahmen verschiedener Art und verschiedene Transkriptionsmethoden. Analoge und digitale Aufnahmemethoden ermöglichen es einer Person, die während des Gesprächs nicht anwesend ist, den Text trotzdem zu transkribieren. Darüber hinaus lesen viele Softwarepakete Audiodateien und konvertieren sie schnell in Text, ohne sie tatsächlich abspielen zu müssen.

Die Audiotranskription war viele Jahre lang ein spezialisierter und mühsamer Beruf. Personen, die Sprache transkribierten, mussten zum Zeitpunkt des Vortrags anwesend sein, was häufig bedeutete, dass Unternehmen Personen einstellen mussten, die in fortgeschrittenen Techniken wie der Kurzschrift geschult waren. Dies beschränkte auch die Transkriptionsdienste auf diejenigen, die Zugang zu einem ausgebildeten Transkriptor hatten.

Mit der Erfindung der Tonaufnahmen hat sich dieses Feld dramatisch verändert. Mit einer Aufnahme könnte der Transkribierer von überall dort arbeiten, wo die Aufnahme geliefert werden könnte. Darüber hinaus war keine Transkription mehr erforderlich, da die Aufnahme umgekehrt und mehrmals angehört werden konnte. Eine einzelne Transkriptorin konnte auch für eine Vielzahl von Kunden gleichzeitig arbeiten, da sie bei den Reden nicht mehr anwesend sein musste.

Mit der Zunahme der Computernutzung und der Internetgeschwindigkeiten blieb der Bereich der Audiotranskription weitgehend gleich. Anstelle von Kassetten wurden Dateien oft per E-Mail verschickt, anstatt sie mit der normalen Post zu versenden. Die Geschwindigkeit des Prozesses nahm zu, die Methoden jedoch nicht.

Dies änderte sich Ende der 90er Jahre mit dem zunehmenden Einsatz von Spracherkennungs- und Diktiersoftware. Der Job des Transkribierens ging immer mehr in Richtung Computerunterstützung und dann vollständiger Automatisierung. Es kamen Softwarepakete heraus, die die Informationen in einer Audiodatei lesen und die Wellenmuster des Sprechers verwenden konnten, um eine Textversion einer Rede zu erstellen. Dies würde eher Sekunden als die Minuten oder Stunden eines menschlichen Schreibers dauern.

Die computerautomatisierte Audiotranskription weist einige Mängel auf, die schwer zu beheben sind, von denen der größte ein relativer Mangel an korrigierender Sprache ist. Wenn ein menschlicher Transkribierer Text anhört, kann er leichte Fehler in der Sprache korrigieren, um ihn besser lesbar zu machen. Während einige Transkriptionen wörtlich sind, was bedeutet, dass es genau das ist, was die Person gesagt hat, ist dies bei den meisten nicht der Fall. Ohne korrigierende Sprache muss ein Mensch die Transkription häufig auf Fehler überprüfen, bevor sie verwendet wird.

Der andere gemeinsame Fehler der computerbasierten Audiotranskription liegt in der Sprache des Menschen. Da Menschen beim Sprechen eine große Bandbreite an Tönen und Mustern haben, ist es äußerst schwierig, ein Computerprogramm zu erstellen, das den gesamten Bereich genau lesen und übersetzen kann. Dies bedeutet, dass ein gewisses Maß an Fehlern in fast allen Transkriptionssoftwares üblich ist. Der gängigste Weg, diesen Fehler zu umgehen, ist erlerntes Sprechen, bei dem das Programm und ein einzelner Sprecher so gut zusammenarbeiten, dass sich das Programm auf die Muster der einzelnen Person konzentriert.