¿Qué es la coincidencia aproximada?

La coincidencia aproximada es un método utilizado en algunos programas informáticos, sobre todo en los diseñados para traducir automáticamente texto entre diferentes idiomas. Funciona en situaciones en las que la base de datos utilizada por el software no coincide exactamente con un fragmento de texto. En cambio, la base de datos busca coincidencias cercanas, y la revisión humana generalmente verifica que esta coincidencia sea aceptablemente precisa.

La mayoría de los programas de traducción automática simplemente comparan el texto con una base de datos de traducciones anteriores. Esta base de datos se conoce generalmente como memoria de traducción (TM). Cada traducción nueva y confirmada se agrega a la base de datos, lo que significa que las futuras traducciones suelen ser más precisas y rápidas.

Normalmente, la traducción basada en MT funciona con oraciones completas. Por ejemplo, si un usuario aprobó previamente una oración particular en francés como una traducción precisa de «La tienda está abierta entre las 9 a. M. Y las 5 p. M. De lunes a viernes, pero cierra a las 2 p. M. El miércoles», la próxima vez que el software se le pide que traduzca esa oración, automáticamente usará la misma redacción en francés que antes.

La herramienta de coincidencia aproximada funciona con situaciones en las que una frase en particular no ha aparecido antes en documentos traducidos por el sistema. La herramienta implica que el creador del software o el usuario final establezcan un nivel de coincidencia aproximada aceptable en forma de coincidencia porcentual. Si la frase está lo suficientemente cerca de una traducida previamente para cumplir con este porcentaje de coincidencia, el software informará al usuario de la coincidencia, le dará la traducción anterior y le pedirá al usuario que confirme o edite la traducción propuesta.

Para seguir con el ejemplo anterior, si el umbral de coincidencia aproximada se estableció en el 90% y el nuevo documento en inglés contenía la frase «La tienda abre entre las 9 a. M. Y las 5 p. M. De lunes a viernes, pero cierra a las 2 p. M. Los miércoles», el software sugeriría la traducción utilizada anteriormente y el usuario probablemente haría clic para aprobarla. Si el nuevo documento tuviera la frase «La tienda está abierta entre las 9 a. Palabra francesa para jueves. Si el nuevo documento tuviera la frase: «La tienda está abierta de 5 a. M. A 2 p. M. Todos los días de la semana, excepto los miércoles, que cierra a las 9 p. M.», El software no consideraría esto como una coincidencia aproximada, a pesar de que el significado es el mismo. y por lo tanto no ofrecería una traducción automática para la oración, dejando que el usuario la traduzca manualmente.