Che cos’è la lettura automatica delle labbra?

La lettura labiale non è certo una nuova forma di comunicazione: è uno strumento primario della comunità dei non udenti, per non parlare di un’abilità utile per trasmettere messaggi attraverso una festa rumorosa o sopra la testa dei bambini. Una nuova forma di tecnologia, tuttavia, sta tentando di meccanizzare questo antico metodo di comunicazione. La lettura automatica delle labbra, nota anche come lettura vocale automatica, è un ramo in crescita della tecnologia di riconoscimento vocale. In teoria, monitorando i movimenti delle labbra di un parlante e altri elementi correlati, programmi per computer appositamente progettati possono interpretare i messaggi verbali anche quando l’interferenza del rumore o altri ostacoli impediscono a una voce umana di essere ascoltata correttamente.

Di solito, la lettura automatica delle labbra richiede un video dell’oratore. Le forme ei ritmi formati dalle labbra sono spesso i fattori più importanti nell’interpretazione, ma anche una varietà di altri movimenti può aiutare a decifrare il messaggio di chi parla. Le espressioni facciali e i movimenti della testa possono essere fattori determinanti. Se è disponibile un audio utile, il processo di lettura automatica delle labbra è notevolmente facilitato, perché gli indizi contestuali della parte udibile possono suggerire parole o frammenti di discorso non udibili.

Lo sviluppo della tecnologia di lettura automatica delle labbra si basa sulla capacità di identificare parole isolate che utilizzano gli stessi movimenti delle labbra ogni volta che vengono pronunciate. La stima della geometria delle labbra (LGE) è uno dei sistemi informatici più avanzati in uso che monitora e interpreta tali modelli. Gli scienziati hanno sviluppato un notevole sistema di lettura automatica delle labbra e riconoscimento vocale per la lingua olandese, ma in generale il campo ha ancora molto spazio per progressi.

La lettura automatica delle labbra ha ricevuto una recente ondata di interesse e attenzione grazie alla sua implementazione su home video archiviati di Adolf Hitler. Filmati da Eva Braun durante la guerra, i film un tempo muti hanno preso vita quando la tecnologia di riconoscimento vocale è stata applicata al filmato. Indipendentemente dal fatto che le interpretazioni siano del tutto accurate o meno, il programma di lettura automatica delle labbra ha fornito uno sguardo a una figura storica che senza dubbio creerà un interesse continuo nel campo della lettura automatica delle labbra.