Che cos’è la corrispondenza fuzzy?

La corrispondenza fuzzy è un metodo utilizzato in alcuni programmi per computer, in particolare quelli progettati per tradurre automaticamente il testo tra lingue diverse. Funziona in situazioni in cui il database utilizzato dal software non ha una corrispondenza esatta per una parte di testo. Invece, il database cerca corrispondenze ravvicinate, con la revisione umana che di solito controlla che questa corrispondenza sia accettabilmente accurata.

La maggior parte dei programmi di traduzione automatizzata confronta semplicemente il testo con un database di traduzioni precedenti. Questo database è generalmente noto come memoria di traduzione (TM). Ogni traduzione nuova e confermata viene aggiunta al database, il che significa che le traduzioni future sono generalmente più accurate e più rapide.

Normalmente, la traduzione basata sulla TM funziona con intere frasi. Ad esempio, se un utente ha precedentemente approvato una particolare frase in francese come traduzione accurata di “Il negozio è aperto dalle 9:5 alle 2:XNUMX nei giorni feriali, ma chiude alle XNUMX:XNUMX il mercoledì”, la volta successiva che il software viene chiesto di tradurre quella frase, utilizzerà automaticamente la stessa formulazione francese di prima.

Lo strumento di corrispondenza fuzzy funziona con situazioni in cui una frase particolare non è emersa in documenti tradotti dal sistema in precedenza. Lo strumento coinvolge il creatore del software o l’utente finale che imposta un livello di corrispondenza fuzzy accettabile sotto forma di corrispondenza percentuale. Se la frase è abbastanza vicina a quella tradotta in precedenza per soddisfare questa percentuale di corrispondenza, il software avviserà l’utente della corrispondenza, fornirà la traduzione precedente e chiederà all’utente di confermare o modificare la traduzione proposta.

Per seguire l’esempio precedente, se la soglia di corrispondenza fuzzy è stata impostata al 90% e il nuovo documento inglese conteneva la frase “Il negozio apre tra le 9:5 e le 2:9 nei giorni feriali, ma chiude alle 5:2 il mercoledì”, il software suggerirebbe la traduzione utilizzata in precedenza e l’utente probabilmente farebbe clic per approvarla. Se il nuovo documento avesse la frase “Il negozio è aperto dalle 9:5 alle 2:XNUMX nei giorni feriali, ma chiude alle XNUMX:XNUMX il giovedì”, il software suggerirebbe la traduzione utilizzata in precedenza e l’utente correggerebbe questa traduzione per concludere con il Parola francese per giovedì. Se il nuovo documento avesse la frase “Il negozio è aperto dalle XNUMX:XNUMX alle XNUMX:XNUMX tutti i giorni feriali tranne il mercoledì, quando chiude alle XNUMX:XNUMX”, il software non considererebbe questa corrispondenza sfocata, nonostante il significato sia lo stesso, e quindi non offrirebbe una traduzione automatica per la frase, lasciando all’utente la traduzione manuale.