?Qu? es la transcripci?n autom?tica?

La transcripci?n autom?tica es el proceso de producir una transcripci?n escrita del habla hablada o grabada mediante el uso de computadoras y sin intervenci?n humana directa. La transcripci?n autom?tica precisa requiere un software de transcripci?n de alta calidad y un dispositivo que pueda recibir informaci?n auditiva con precisi?n. En general, tambi?n es necesario que el discurso o la grabaci?n que se transcriba est? razonablemente libre de distorsi?n e interferencia del ruido de fondo. Tambi?n se han intentado transcribir m?sica con el uso de computadoras que ejecutan software de transcripci?n especializado. La transcripci?n de m?sica implica escribir las notas de una pieza musical dada, particularmente cuando no hay una notaci?n preexistente para esa m?sica, como es el caso de los solos improvisados.

Un buen software de transcripci?n es necesario para una transcripci?n autom?tica exitosa. El software es responsable de procesar la entrada auditiva, separando un flujo continuo de lenguaje en palabras separadas, reconociendo esas palabras y represent?ndolas correctamente en el texto. Una falla en cualquier etapa de este proceso generalmente da como resultado una transcripci?n que difiere algo del material fuente. Un buen software de transcripci?n autom?tica deber?a ser capaz de reconocer las sutiles diferencias entre palabras similares y compensar los diversos estilos y velocidades del habla. Los acentos dif?ciles de entender tienden a ser problem?ticos incluso para el mejor software de transcripci?n.

Algunas personas usan software de transcripci?n autom?tica porque prefieren el dictado a escribir o escribir directamente su texto. Algunas formas de software de transcripci?n autom?tica son particularmente buenas para este prop?sito porque pueden «aprender» las voces de las personas cuyas palabras est?n transcribiendo. En tales casos, la transcripci?n autom?tica no se utiliza para crear transcripciones de voz de una variedad de fuentes diferentes, por lo que no es necesario que el software est? abierto a una amplia variedad de patrones de voz. Permitir este proceso de optimizaci?n, que puede ocurrir durante el uso extendido del software por una persona o durante una calibraci?n preliminar, puede aumentar en gran medida la precisi?n y la velocidad potencial del dictado.

Desafortunadamente, las computadoras no son tan adecuadas para reconocer de manera consistente y precisa el habla humana como los humanos. No pueden, por ejemplo, utilizar pistas contextuales si no comprenden una palabra en particular. Como tal, a menudo es necesario que un humano revise las transcripciones creadas a trav?s de la transcripci?n autom?tica. Los errores menores en el formato y varios errores en la transcripci?n son, en muchos casos, comunes a menos que el discurso transcrito sea muy claro. A?n as?, el uso de la transcripci?n computarizada puede crear r?pidamente una base s?lida para una transcripci?n que solo requiere una intervenci?n humana limitada antes de su presentaci?n o uso.

Inteligente de activos.