La determinazione del contenuto si verifica quando una persona, un gruppo o un programma decide quali informazioni devono essere incluse o escluse all’interno di un documento o testo. È correlato ai concetti relativi alla strutturazione del documento. È anche legato alla generazione del linguaggio naturale e alla linguistica computazionale. Ogni area di studio utilizza la determinazione del contenuto per esaminare come vengono scelte le informazioni.
Quando si valuta cosa inserire in un documento o testo, il compilatore avrà condotto la sua ricerca o gli saranno stati forniti tutti i dati disponibili. La determinazione del contenuto copre i modi in cui queste informazioni vengono ridotte al documento finale. Questo viene fatto determinando qual è l’angolo o l’obiettivo del testo e quali informazioni all’interno del testo sono pertinenti a questo.
La seconda considerazione sulla determinazione del contenuto è il suo stile. Questo tende a dipendere dalla natura del pubblico previsto. L’intelletto del pubblico e la familiarità con l’argomento alterano la densità lessicale e la complessità delle informazioni impartite. Gli accademici tenderanno a produrre testi più densi rispetto alle riviste di gossip, per esempio. Altre considerazioni includono la dimensione del formato, se sarà un libro, un articolo o un messaggio di testo.
Ogni stato di determinazione del contenuto è fatto da un essere umano. C’è il ricercatore e lo scrittore, che spesso, ma non sempre, sono la stessa persona, e poi l’editore o gli editori. Ogni livello ha un’opinione su quale contenuto è rilevante per l’obiettivo del testo. I linguisti computazionali e gli ingegneri informatici hanno cercato modi per riprodurre questo sistema utilizzando programmi per computer invece di affidarsi agli esseri umani.
Ci sono tre tecniche computazionali impiegate dai computer per quanto riguarda la determinazione del contenuto. La ‘tecnica dello schema’ si basa sull’esame di testi scritti. Utilizza i testi pre-esaminati come base per le informazioni da includere nel testo prodotto. Il metodo “statistico” determina automaticamente il contenuto in base a una serie di statistiche generali. Il “ragionamento esplicito” utilizza l’intelligenza artificiale (AI) per esaminare e filtrare le informazioni.
L’obiettivo generale della determinazione del contenuto è capire come vengono prodotti i documenti in modo che possano essere riprodotti utilizzando i computer. Il risultato di un tale successo sarà un computer in grado di ricevere dati, filtrarli e produrre riassunti delle informazioni più importanti. Il computer baserà tali documenti non solo sulle informazioni, ma sugli obiettivi del testo prodotto. Sulla scia della teoria della stanza cinese, questo potrebbe significare che il computer è in grado di comprendere i dati piuttosto che essere in grado di replicare e calcolare.