Cos’è il web semantico?

Il web semantico è un progetto in corso, attualmente guidato dal creatore del World Wide Web, Tim Berners-Lee. Tenta di affrontare alcune delle carenze semantiche del web attuale, introducendo un markup molto più versatile e dinamico nei documenti che compongono la rete.

L’HTML, il linguaggio di markup utilizzato per la maggior parte del World Wide Web, ha un insieme molto limitato di tag che possono essere usati per dire a un parser quale dovrebbe essere il testo all’interno di quei tag. Per la maggior parte, i tag utilizzati nell’HTML vengono utilizzati per varie istruzioni di layout e stilistiche, con l’obiettivo di focalizzare l’HTML esclusivamente sul markup strutturale e i fogli di stile a cascata affrontano i problemi di stile. Ci sono alcune eccezioni a questo, come i tag di intestazione (titolo, meta, ecc.) e i tag degli oggetti incorporati.

Il web semantico, tuttavia, utilizza XML (così come altre tecnologie, come OWL e RDF), per fornire informazioni di dettagli sostanzialmente illimitati. Alcune delle idee di Lee per questo includono la capacità di incorporare informazioni sui collegamenti all’interno dei collegamenti stessi: l’aggiunta di metadati a ciascun collegamento indicando il titolo della pagina Web, forse una valutazione, la natura della relazione tra le due persone che effettuano il collegamento e un assortimento di altre curiosità informative.

Un aspetto fondamentale del web semantico è il collegamento dei dati a punti dati centralizzati, piuttosto che definirli in modo indipendente. Ad esempio, attualmente, se voglio che il mio testo appaia tutto rosso, indicherei: font color=red, o forse utilizzare un foglio di stile per specificare: p { color: red; }. Con il web semantico indicherei qualcosa di simile a: font color=www.wisegeek.com/colors/red/, e il colore verrebbe poi recuperato da un punto centrale.

Il web semantico si sta costruendo e si sta diffondendo sotto la struttura del web esistente. Chiunque abbia visto una licenza Creative Commons ha visto il web semantico in azione: i diritti d’autore stessi sono conservati in un database centrale in cui sono archiviati e, a loro volta, i siti Web che utilizzano un collegamento di licenza Creative Commons a quella voce di database, piuttosto che semplicemente replicare il licenza stessi. Se esamini il markup di una pagina web utilizzando una di queste licenze, vedrai una serie di tag nascosti alla vista normale, destinati a consentire ai crawler dei motori di ricerca, ai news feeder e ad altri strumenti automatici di comprendere effettivamente il copyright che hai inserito sul tuo luogo.

In definitiva, il futuro del web semantico sembra luminoso. Con sempre più siti che integrano piccoli componenti semantici, come informazioni sul copyright, meta parole chiave, nomi di creatori e coordinate globali, sembrerebbe semplicemente un’idea troppo buona per fallire.