¿Qué es un sintetizador de voz?

El sintetizador de voz es un dispositivo que se utiliza para traducir caracteres de texto en sonidos que se aproximan al sonido del habla humana. Dependiendo del nivel de sofisticación del dispositivo individual, los sonidos producidos pueden ser algo forzados y artificiales, o sonar muy parecidos a la voz de una persona real. El concepto de síntesis de voz ha existido durante siglos, pero solo en las últimas décadas el proceso ha estado disponible para el público en general.

Hay ejemplos de intentos de producir artificialmente patrones de habla humana que se remontan al siglo XI. Los primeros intentos solían utilizar materiales para reproducir las cuerdas vocales humanas y aplicar varios tipos de estimulación para producir sonidos. Con el tiempo, los diseños permitieron producir sonidos que imitaban la pronunciación de las vocales. A finales del siglo XVIII, algunos diseños también pudieron producir sonidos que se parecían mucho a las consonantes.

El verdadero progreso con el sintetizador de voz moderno comenzó en la década de 1930. Bell Laboratories produjo un sintetizador que fue apodado vocoder. Los datos se ingresaron con el uso de un teclado, se analizaron por el sistema y se emitieron los sonidos apropiados para formar palabras. Si bien la entonación y la inflexión de las palabras eran algo primitivas, el dispositivo produjo palabras claramente inteligibles. Una versión refinada de este dispositivo, el voder, se presentó al público en la Feria Mundial de 1939.

En la década de 1950, el trabajo en un sintetizador de voz que usaba imágenes visuales así como texto ingresado produjo resultados parcialmente exitosos. Al mismo tiempo, los avances en tecnología comenzaron a refinar la calidad del sonido. Cuando las comunicaciones de voz automatizadas se volvieron más frecuentes en la década de 1970, había varios sintetizadores de voz que eran capaces de producir sonidos que estaban muy cerca de los patrones del habla humana. En poco tiempo, los dispositivos se estaban utilizando para producir productos tales como mensajes pregrabados en contestadores automáticos y productos de lectura para personas con discapacidad visual.

La llegada de la computadora personal también abrió la puerta a más mejoras para el sintetizador de voz. Al incluir el dispositivo en un sistema informático doméstico, las personas con discapacidades de lectura o visión limitada pueden disfrutar utilizando una variedad de programas informáticos. Hoy en día, la calidad de la voz en la mayoría de los modelos del sintetizador de voz está muy alejada de los sonidos robóticos producidos por los dispositivos creados a principios del siglo XX. Hoy en día, muchas versiones son capaces de producir patrones de voz que son casi indistinguibles del habla humana.