Che cos’è il riconoscimento delle entità denominate?

Sebbene dal punto di vista dell’utente finale il processo di immissione dei dati in un computer sia abbastanza semplice, il processo avvia effettivamente molti altri processi più piccoli. Per ogni dato, il computer deve tradurre quell’informazione in una lingua che capisce. I computer utilizzano un linguaggio interno noto come binario in cui si forma una raccolta di caratteri “1” e “0” per indicare al computer cosa fare. Il riconoscimento di entità denominate è un metodo per snellire il processo di traduzione dall’input ai dati, aiutando il computer a suddividere le frasi nelle loro parti componenti.

Quando si immettono dati utilizzando la maggior parte dei programmi per computer o delle pagine Web, il programma o la pagina Web generalmente richiede di inserire un’informazione specifica in ciascun campo, ad esempio i campi “Nome” o “Indirizzo”. Un programma di riconoscimento di entità denominate elimina la maggior parte di ciò, consentendo all’utente finale di inserire invece stringhe – frasi – di testo, fornendo un’interfaccia più naturale. Il programma prende i dati che hai inserito e li ordina in parti che può capire più facilmente.

Prendi una frase come “Joe ha ordinato quattro staia di banane”. In un programma tradizionale, l’utente finale dovrebbe inserire “Joe” nel campo “Nome dipendente”, “Banane” nel campo “Tipo di acquisto”, “quattro” nel campo “Quantità” e “moggi” in il campo “Unità”. In una configurazione di riconoscimento dell’entità denominata, l’utente finale immette semplicemente l’intera frase come scritta. Non appena l’utente fa clic su Invia, il computer ordina la frase in parti, eseguendo la stessa suddivisione dei dati che l’utente avrebbe utilizzato in precedenza.

Sebbene questo sia molto più snello di un tradizionale programma di input progettato dai campi, c’è un sostanziale inconveniente: il potenziale fallimento dell’algoritmo di traduzione. Algoritmi di riconoscimento di entità nominate meno intelligenti potrebbero “capire” la frase solo in un modo specifico. In altre parole, se il dipendente riformulasse la frase e scrivesse “Quattro staia di banane sono stati ordinati da Joe”, il programma potrebbe avere difficoltà a comprendere e ordinare le parti. Per questo motivo, anche se l’utente finale non è più responsabile dell’inserimento dei dati nei campi, non è ancora così libero come potrebbe sembrare a prima vista il sistema.