La coreferenza è un fenomeno nel linguaggio in cui più parole o frasi hanno lo stesso referente. Ciò significa che entrambi si riferiscono alla stessa persona, luogo, cosa o altro nome applicabile. Questo elemento di analisi linguistica aiuta a studiare i modi in cui viene utilizzata la lingua. È anche utile nello studio più moderno dell’elaborazione del linguaggio naturale, che funge da base per vari modelli di computer che analizzano il parlato.
Alcuni semplici esempi di coreferenze aiuteranno i principianti a capire cosa costituisce questo tipo di schema linguistico. Ad esempio, se qualcuno dice “pensavi di poter raggiungere l’obiettivo”, i due casi del pronome “tu” si riferiscono entrambi alla stessa persona, e quindi questa è una forma di coreferenza. In questi esempi, le due parole non devono essere le stesse. Ad esempio, qualcuno che dice “John pensava di poter raggiungere l’obiettivo”, sta ancora generando una coreferenza con le parole “John” e “he”, che, ancora una volta, si riferiscono alla stessa persona.
In termini di linguistica tecnica, la coreferenza è un esempio di una sorta di anafora, che è un caso in cui un’espressione si riferisce a un’altra. Alcuni esperti suddividono questo in due sottocategorie, dove anafora è un caso di un’espressione che si riferisce a un’espressione successiva e un altro termine, catafora, è usato per un’espressione che si riferisce a un’espressione precedente. In quanto categoria di anafora, la coreference mostra anche come alcune espressioni, in particolare i pronomi, possano essere piuttosto ambigue e necessitano di un contesto per l’elaborazione.
Quando la coreferenza viene utilizzata al servizio dell’elaborazione del linguaggio naturale, può avere un aspetto molto diverso rispetto a quando fa parte di uno studio generale del discorso. I computer utilizzano algoritmi altamente avanzati per ottenere l’elaborazione del linguaggio naturale in tutte le sue forme. È necessaria una logica estremamente intricata e complessa per analizzare il discorso da un punto di vista tecnologico, semplicemente perché gran parte del linguaggio ruota attorno alla capacità di un essere umano di interpretare le parole e le frasi di un altro.
Per aggirare la difficoltà di replicare la comprensione del linguaggio naturale con i computer, i progettisti e gli sviluppatori potrebbero utilizzare un concetto chiamato risoluzione di coreferenza. Questa tecnica consente alla tecnologia di diventare più intelligente in termini di elaborazione del linguaggio naturale lavorando con le coreferenze in un modo particolare. Alcuni esperti descriverebbero il processo di risoluzione della coreferenza come un processo in cui il computer etichetta tutte le espressioni e poi le organizza o le classifica in un risultato coerente.