Il vocabolario controllato è un concetto nell’informatica e nella programmazione informatica che implica l’utilizzo solo di termini precedentemente concordati o approvati durante la costruzione di database relazionali, metadati ricercabili o altri sistemi in cui vengono utilizzate parole leggibili dall’uomo per contrassegnare le informazioni per il successivo recupero. La metodologia dell’utilizzo di un vocabolario controllato per classificare le informazioni è in diretto contrasto con il concetto di vocabolario del linguaggio naturale, in cui non esistono termini concordati e tutte le parole utilizzate sono invece collegate da relazioni ponderate. Oltre alle parole di primo livello utilizzate in un vocabolario controllato, è possibile utilizzare parole di supporto in modo che i sinonimi o altri termini fortemente associati al termine di primo livello possano attivare l’uso della parola di primo livello. Le principali differenze misurate tra i sistemi di linguaggio naturale e i sistemi di vocabolario controllato sono la pertinenza dei risultati di una query utilizzando le parole, il volume di informazioni restituite e l’usabilità complessiva del sistema.
Esistono molti casi in cui una raccolta di parole o termini viene utilizzata per rendere più accessibili agli utenti informazioni arbitrarie, in continua evoluzione o disorganizzate. I termini di ricerca all’interno di un motore di ricerca Internet, un database di informazioni aziendali e persino una biblioteca di ricerca digitale sono tutti esempi di applicazioni attraverso le quali le informazioni possono essere classificate con termini di metadati anziché con una rigida struttura gerarchica. Le parole usate per descrivere un oggetto in tali situazioni costruiscono una sorta di indice ricercabile del più ampio pool di informazioni.
Un esempio dell’uso del vocabolario controllato può essere visto quando si considera un sistema di archiviazione per un’azienda. I file devono essere classificati in modo da essere facilmente e prevedibilmente recuperabili. Se un file riguarda le auto, potrebbe essere archiviato nella categoria “auto”. Se anche un’altra persona ha un file che si occupa di automobili, senza un vocabolario controllato, il file potrebbe essere posizionato sotto la voce “automobili”, rendendo difficile trovare i due file con un’unica ricerca. Quando le categorie sono controllate, tutti i file relativi alle auto verranno inseriti in un’unica intestazione concordata.
Il vantaggio di usare un vocabolario controllato è che le informazioni sono descritte rigorosamente in modo prevedibile. Ciò significa che chiunque sia a conoscenza del vocabolario sarà in grado di cercare informazioni in modo efficace e accurato. Una complicazione con il vocabolario, tuttavia, è che i termini di ricerca sono più difficili, se non impossibili, da generare automaticamente e di solito richiedono un intervento umano, il che rende un grande compito convertire i database esistenti per utilizzare un vocabolario controllato. Se il vocabolario non è abbastanza ampio, esiste anche la possibilità che una singola query produca un volume di informazioni così grande da rendere poco pratico l’ordinamento senza l’uso di un altro metodo di query.