Che cos'è un localizzatore di risorse uniformi?

Un Uniform Resource Locator, noto anche con l’acronimo URL, è un mezzo per specificare la posizione e il metodo di accesso di un oggetto su Internet. Include uno schema o un nome di protocollo che descrive come accedere all’oggetto. Include anche il percorso di rete, insieme a query facoltative e identificatori di frammento. Un uso molto comune di un URL è indirizzare un browser a un sito web.

Il concetto originale di Uniform Resource Locator si è evoluto durante i primi anni ‘1990. Request For Comments (RFC) 1630 è stato il primo standard URL, rilasciato dall’Internet Engineering Task Force (IETF) nel 1994. Un nome senza una posizione o un metodo di accesso associati divenne noto come Uniform Resource Name (URN). Combinando i due concetti, è nato il termine URI (Uniform Resource Identifier). Un URI può essere un’identità URN, un indirizzo URL o entrambi. Può anche fare riferimento a un oggetto che non è affatto basato sulla rete.

Negli ambienti tecnici, il termine Uniform Resource Locator viene utilizzato raramente più a lungo: è preferibile l’URI. Tuttavia, URL rimane un nome popolare tra il pubblico in generale e la stampa. L’ultima specifica URI, rilasciata nel 2009 come RFC 3986, chiarisce i concetti di URL, URN e URI.

Un Uniform Resource Locator è composto da due parti. Il primo è il nome di uno schema URI, seguito da due punti. Uno schema definisce il protocollo o altro metodo utilizzato per accedere alla risorsa. L’Internet Assigned Numbers Authority (IANA) gestisce un lungo elenco di schemi URI registrati. Hypertext Transport Protocol (HTTP), Secure HTTP (HTTPS) e File Transport Protocol (FTP) sono probabilmente i più comuni. Vengono utilizzati anche molti schemi non registrati.

La seconda parte di un Uniform Resource Locator è specifica dello schema e può includere diversi componenti. Questa parte di un URL HTTP inizia spesso con www. seguito da un nome di dominio. Al posto del nome di dominio può essere utilizzato un indirizzo numerico IP (Internet Protocol). Il nome può essere seguito dal percorso di un oggetto specifico. Possono essere presenti anche una stringa di query, il nome di un’intestazione di frammento all’interno dell’oggetto o entrambi.

Quando si digita l’URL di una pagina Web in un browser, lo schema e parte del nome di dominio sono spesso facoltativi. Se omesso, “http://” o “http://www”. di solito viene assunto dal browser web. Il percorso, la query o il frammento possono anche contenere caratteri speciali limitati in formato numerico esadecimale. Uno spazio—%20—è quello più comunemente usato. Un identificatore di risorsa internazionalizzato (IRI) consente anche caratteri Unicode in tutto.
Più di un Uniform Resource Locator univoco può descrivere un percorso per lo stesso oggetto. I motori di ricerca possono utilizzare un processo chiamato normalizzazione degli URL per determinare se più URL si riferiscono effettivamente alla stessa cosa. Anche i browser Web e i crawler fanno questo. Un URL può anche puntare a un oggetto che non può essere trovato: è stato spostato o non è mai esistito.