Corpus linguistique l’?tude de la langue ? l’aide d’exemples de la vie r?elle. Ce n’est pas une branche de la linguistique mais une m?thodologie ou une approche. Corpus, le mot latin pour ?corps?, fait r?f?rence ? l’ensemble des textes naturels, et l’approche consiste ? d?couvrir les mod?les d’utilisation de la langue ? travers l’analyse du corpus. La linguistique de corpus conna?t un retour en force, car les programmes informatiques ont r?volutionn? l’approche.
Le journal parental du discours d’un enfant lorsqu’il acquiert le langage pour la premi?re fois est un exemple simple d’un corpus qui peut ensuite ?tre ?tudi? pour apprendre les mod?les de langage. L’enseignement des langues ?trang?res dans la premi?re moiti? du 20e si?cle utilisait souvent des corpus de la langue cible pour compiler des listes de vocabulaire pour les ?tudiants. L’?minent linguiste Noam Chomsky ne consid?rait pas l’utilisation de corpus comme un outil valable, car il croyait que la comp?tence linguistique ?tait plus importante que les donn?es de performance. Au d?but, la linguistique de corpus reposait en grande partie sur l’hypoth?se qu’il existe un nombre limit? de phrases dans une langue naturelle et que ces phrases peuvent ?tre collect?es et ?valu?es.
Apr?s ?tre tomb?e en disgr?ce dans les ann?es 60 et 70, la linguistique de corpus conna?t un renouveau d? ? l’utilisation m?thodologique de l’ordinateur. Le programme de concordance est le nom du logiciel le plus couramment utilis? par les linguistes. Alors que la recherche de mod?les dans un corpus de millions de mots prendrait trop de temps pour un ?tre humain et que les r?sultats seraient moins que pr?cis, un ordinateur peut rechercher et r?cup?rer des informations en quelques secondes seulement. Il peut calculer la fr?quence, trier les donn?es et exploiter les corpus d’une mani?re qui ?tait impossible dans le pass?.
L’analyse bas?e sur le corpus peut examiner comment le registre affecte la langue?; les mod?les d’utilisation de la langue, tels que la fa?on dont les hommes et les femmes utilisent diff?remment les questions sur les ?tiquettes?; la mesure dans laquelle les mod?les de langage sont utilis?s?; et les facteurs qui influent sur la variabilit? de l’utilisation de la langue. L’enseignement peut b?n?ficier de la linguistique de corpus dans la conception du programme, le d?veloppement des mat?riaux utilis?s et le type d’activit?s utilis?es en classe. Les ?l?ves pourraient b?n?ficier de l’approche en ?tant en mesure de d?terminer plus clairement les diff?rentes utilisations et significations des mots courants, les diff?rences inh?rentes ? la langue ?crite et parl?e, ainsi que les phrases et les collocations qu’ils pourraient utiliser. Le corpus de donn?es qu’est le corpus est constamment mis ? jour et est le produit d’interactions sociales r?elles. Ainsi, les corpus sont des donn?es naturalistes facilement accessibles et les r?sultats peuvent ?tre g?n?ralis?s.