O que ? transcri??o de ?udio?

Transcri??o de ?udio ? o processo de pegar as palavras faladas e transform?-las em texto escrito. No passado, uma pessoa se sentava e escrevia as palavras como foram ditas. Agora, existem grava??es de ?udio de v?rios tipos e v?rios m?todos de transcri??o. Os m?todos de grava??o anal?gica e digital permitir?o que uma pessoa que n?o est? presente durante a conversa ainda transcreva o texto. Al?m disso, muitos pacotes de software l?em arquivos de ?udio e os convertem rapidamente em texto sem precisar reproduzi-los.

Por muitos anos, a transcri??o de ?udio foi uma profiss?o especializada e tediosa. As pessoas que transcreviam a fala tinham que estar presentes no momento da fala, o que geralmente significa que as empresas teriam que contratar pessoas treinadas em t?cnicas avan?adas, como taquigrafia. Isso tamb?m limitava os servi?os de transcri??o para aqueles que tinham acesso a um transcritor treinado.

Com a inven??o das grava??es de ?udio, esse campo mudou drasticamente. Com uma grava??o, o transcritor pode funcionar de qualquer lugar onde a grava??o possa ser entregue. Al?m disso, a transcri??o n?o precisava mais de taquigrafia, pois a grava??o podia ser revertida e ouvida v?rias vezes. Um ?nico transcritor tamb?m poderia trabalhar para uma infinidade de clientes simultaneamente, j? que ela n?o precisava mais estar presente nos discursos.

Com o aumento do uso do computador e da velocidade da Internet, o campo da transcri??o de ?udio permaneceu praticamente o mesmo. Os arquivos, em vez de fitas, eram frequentemente enviados por email, em vez de serem enviados por correio normal. A velocidade do processo aumentou, mas os m?todos n?o.

Isso mudou no final dos anos 90 com o uso crescente do software de reconhecimento de voz e ditado. O trabalho de transcrever foi cada vez mais em dire??o ? assist?ncia com o computador e depois ? automa??o total. Foram lan?ados pacotes de software que podiam ler as informa??es dentro de um arquivo de ?udio e usar os padr?es de ondas do alto-falante para criar uma vers?o em texto de um discurso. Isso levaria segundos e n?o minutos ou horas de um transcritor humano.

A transcri??o de ?udio automatizada por computador tem algumas falhas dif?ceis de superar, a maior das quais ? a relativa falta de fala corretiva. Quando um transcritor humano ouve texto, pode corrigir pequenos erros no discurso para torn?-lo mais leg?vel. Embora algumas transcri??es sejam literalmente, o que significa que ? exatamente o que a pessoa disse, a maioria n?o ?. Sem a fala corretiva, o ser humano geralmente precisar? verificar se h? erros na transcri??o antes de ser usada.

A outra falha comum da transcri??o de ?udio baseada em computador est? no pr?prio discurso dos humanos. Como as pessoas t?m uma enorme variedade de tons e padr?es quando falam, ? excepcionalmente dif?cil criar um programa de computador capaz de ler e traduzir com precis?o toda a faixa. Isso significa que uma certa quantidade de erro ? comum em quase todos os softwares de transcri??o. A maneira mais comum de solucionar essa falha ? atrav?s do discurso aprendido, em que o programa e um ?nico palestrante trabalham juntos o suficiente para que o programa se concentre nos padr?es de uma ?nica pessoa.

Inteligente de ativos.