Cos’è la linguistica del corpus?

Linguistica del corpus lo studio del linguaggio usando esempi di vita reale. Non è una branca della linguistica ma una metodologia o un approccio. Corpus, la parola latina per “corpo”, si riferisce al corpo dei testi naturali e l’approccio prevede la scoperta di modelli di utilizzo del linguaggio attraverso l’analisi del corpus. La linguistica del corpus sta tornando in auge, poiché i programmi per computer hanno rivoluzionato l’approccio.

I diari dei genitori sul discorso di un bambino quando acquisisce la lingua per la prima volta è un semplice esempio di corpus che può quindi essere studiato per apprendere gli schemi linguistici. L’insegnamento delle lingue straniere nella prima metà del 20 ° secolo usava spesso corpora della lingua di destinazione per compilare elenchi di vocaboli per gli studenti. L’eminente linguista Noam Chomsky non considerava l’uso dei corpora uno strumento valido, poiché riteneva che la competenza linguistica fosse più importante dei dati sulle prestazioni. La linguistica dei primi corpus era in gran parte basata sul presupposto che ci sia un numero limitato di frasi in un linguaggio naturale e che tali frasi possano essere raccolte e valutate.

Dopo essere caduto in disgrazia negli anni ’60 e ’70, la linguistica dei corpora sta vivendo una rinascita a causa dell’uso metodologico del computer. Il programma di concordanza è il nome del software più comunemente usato dai linguisti. Mentre la ricerca di schemi in un corpus di milioni di parole richiederebbe troppo tempo per un essere umano e i risultati sarebbero meno che precisi, un computer può cercare e recuperare informazioni in pochi secondi. Può calcolare la frequenza, ordinare i dati e sfruttare i corpora in modi impossibili in passato.

L’analisi basata sul corpus può esaminare in che modo il registro influenza il linguaggio; modelli di utilizzo del linguaggio, come il modo in cui maschi e femmine fanno un uso diverso delle domande dei tag; la misura in cui vengono utilizzati i modelli linguistici; e i fattori che influenzano la variabilità dell’uso del linguaggio. L’insegnamento può trarre vantaggio dalla linguistica del corpus nella progettazione del programma, nello sviluppo dei materiali utilizzati e nel tipo di attività utilizzate in classe. Gli studenti potrebbero trarre vantaggio dall’approccio essendo in grado di determinare più chiaramente i diversi usi e significati delle parole comuni, le differenze insite nella lingua scritta e parlata e le frasi e le collocazioni che potrebbero utilizzare. Il corpus di dati che costituisce il corpus viene costantemente aggiornato ed è il prodotto di interazioni sociali nella vita reale. Pertanto, i corpora sono dati naturalistici a cui è possibile accedere facilmente e che i risultati possono essere generalizzati.