Une expression de référence est un mot ou une expression dont le but est d’identifier une personne, un lieu ou une chose en particulier. Il s’agit généralement d’un nom, d’un syntagme nominal ou d’un pronom. En linguistique, l’identification des expressions de référence et leur relation avec les objets du monde réel auxquels elles se réfèrent fait partie de l’étude de la pragmatique, qui décrit la relation entre le langage et les situations du monde réel que le langage décrit. La génération d’expressions de référence est un sous-domaine de la génération de langage naturel, qui utilise des ordinateurs pour produire un texte qui imite le plus possible le langage humain.
En termes grammaticaux, tous les noms se réfèrent à des personnes, des lieux, des choses ou des idées, mais tous ne sont pas des expressions de référence. Par exemple, la phrase Un beagle est une race de chien contient trois noms : beagle, race et chien. Chacun d’entre eux, cependant, fait référence à une classe de choses, plutôt qu’à une chose spécifique, et donc aucune n’est une expression de référence. Pour le formuler différemment, le but de la phrase est de donner des informations sur les beagles en général plutôt que d’attirer l’attention du lecteur sur un beagle en particulier. En revanche, dans la phrase Ce chien est un beagle, ce chien est une expression de référence car il désigne un chien en particulier et donne des informations à son sujet.
En anglais, une expression de référence contiendra souvent l’article défini, the, ou un pronom démonstratif tel que that ou these, de sorte que la phrase distingue un objet particulier de tous les autres similaires. Par exemple, l’expression ce mammouth indiquerait clairement un mammouth particulier et serait donc une expression de référence, alors que un mammouth ne le ferait pas. Parfois, cependant, la structure grammaticale d’une seule phrase n’est pas suffisante pour déterminer si une phrase est une expression de référence. Dans la phrase Le mammouth se nourrissait principalement d’herbes, le mammouth peut faire référence à un mammouth en particulier, ou il peut s’agir d’une description des mammouths en général, selon son contexte.
Une application pratique de la pragmatique est la génération de langage naturel. Pour créer des expressions de référence qui indiquent clairement et sans ambiguïté le référent visé, les programmeurs en langage naturel doivent tenir compte à la fois des problèmes grammaticaux et contextuels. Par exemple, un langage généré par ordinateur comme le langage humain ne devrait pas contenir de pronoms qui pourraient se référer grammaticalement ou logiquement à plus d’un nom ou objet du monde réel. De cette façon, la génération d’expressions référentes est le revers de la résolution d’anaphores, qui utilise divers algorithmes pour déterminer les référents des pronoms dans un texte généré par ordinateur ou par l’homme.