El análisis del habla es una técnica computarizada que se utiliza para analizar el contenido del habla. No es simplemente una herramienta de conversión de voz a tecnología. En cambio, está diseñado para detectar patrones en el habla, incluidos el contenido y el tono.
El uso más simple de la analítica del habla es medir la frecuencia con la que se usan frases particulares. Antes del análisis de voz, esto solo era posible transcribiendo una grabación y luego usando una computadora o una búsqueda manual para buscar frases en particular. Con el análisis de voz, un sistema informático se puede preprogramar para «escuchar» una palabra en particular e incluso puede producir información en tiempo real.
Existen múltiples usos para dicha tecnología. Una empresa con un centro de llamadas podría analizar las conversaciones que el personal tiene con los clientes para detectar patrones en las quejas. Por ejemplo, mientras que los registros de llamadas pueden mostrar que un producto en particular causa muchas quejas o consultas, el análisis de voz puede mostrar que un aspecto particular del producto, como una línea en las instrucciones, se menciona con frecuencia. Una autoridad policial o un servicio de seguridad podría analizar las llamadas telefónicas que monitorea para ver si los sospechosos mencionan una frase en particular.
Se pueden utilizar análisis de voz más sofisticados para analizar el tono e incluso el contexto. Por ejemplo, una empresa de telemercadeo normalmente hará un seguimiento del porcentaje de llamadas que hace que resulten en una venta, pero no necesariamente tendrá estadísticas que demuestren por qué las personas rechazaron la oferta. El análisis del tono puede mostrar que el número de personas que responden con un tono de enojo es desproporcionadamente alto en un momento determinado del día. Esto puede sugerir que el problema no es tanto que el producto no sea atractivo, sino que a las personas les molesta que las llamen después de una hora determinada y es más probable que sean hostiles a un intento de venta independientemente del producto.
Hay varios tipos diferentes de análisis del habla, cada uno de los cuales aporta mayor precisión a los resultados y aumenta tanto el tiempo que lleva escanear el habla como la cantidad de habla necesaria para detectar un patrón. El tipo más simple es el fonético, que descompone el habla en sonidos individuales. Si bien es poco sofisticado, esto facilita la búsqueda de nuevas frases sin tener que volver a escanear el discurso desde cero. La detección de palabras clave busca palabras completas desde el principio. El reconocimiento de voz continuo de vocabulario extenso tiene como objetivo transcribir eficazmente todo el discurso, de modo que una conversación completa esté disponible para su análisis.