¿Qué es un localizador uniforme de recursos?

Un localizador uniforme de recursos, también conocido por el acrónimo URL, es un medio para especificar la ubicación y el método de acceso de un objeto en Internet. Incluye un esquema o nombre de protocolo que describe cómo acceder al objeto. También incluye la ubicación de la red, junto con identificadores opcionales de consultas y fragmentos. Un uso muy común de una URL es dirigir un navegador a un sitio web.

El concepto original de un localizador uniforme de recursos evolucionó a principios de la década de 1990. Solicitud de comentarios (RFC) 1630 fue el primer estándar de URL, lanzado por el Grupo de trabajo de ingeniería de Internet (IETF) en 1994. Un nombre sin una ubicación asociada o método de acceso se conoció como Nombre de recurso uniforme (URN). Combinando los dos conceptos, nació el término Identificador uniforme de recursos (URI). Un URI puede ser una identidad URN, una dirección URL o ambas. Incluso puede referirse a un objeto que no está basado en la red en absoluto.

En los círculos técnicos, el término Localizador uniforme de recursos rara vez se usa más; se prefiere URI. Sin embargo, URL sigue siendo un nombre popular entre el público en general y la prensa. La última especificación de URI, publicada en 2009 como RFC 3986, aclara los conceptos de URL, URN y URI.

Un localizador uniforme de recursos consta de dos partes. Primero es el nombre de un esquema de URI, seguido de dos puntos. Un esquema define el protocolo u otro método utilizado para acceder al recurso. La Autoridad de Números Asignados de Internet (IANA) administra una larga lista de esquemas URI registrados. El Protocolo de transporte de hipertexto (HTTP), HTTP seguro (HTTPS) y el Protocolo de transporte de archivos (FTP) son probablemente los más comunes. También se utilizan muchos esquemas no registrados.

La segunda parte de un localizador uniforme de recursos es específica del esquema y puede incluir varios componentes. Esta parte de una URL HTTP a menudo comienza con www. seguido de un nombre de dominio. Se puede utilizar una dirección de Protocolo de Internet (IP) numérica en lugar del nombre de dominio. El nombre puede ir seguido de la ruta a un objeto específico. También pueden estar presentes una cadena de consulta, el nombre de un encabezado de fragmento dentro del objeto o ambos.

Al escribir la URL de una página web en un navegador, el esquema y parte del nombre de dominio suelen ser opcionales. Si se omite, “http: //” o “http: // www.” normalmente será asumido por el navegador web. La ruta, la consulta o el fragmento también pueden contener caracteres especiales limitados en forma numérica hexadecimal. Un espacio (% 20) es el más utilizado. Un identificador de recursos internacionalizado (IRI) también permite caracteres Unicode en todas partes.
Más de un localizador uniforme de recursos único puede describir una ruta al mismo objeto. Los motores de búsqueda pueden utilizar un proceso llamado normalización de URL para determinar si varias URL se refieren realmente a lo mismo. Los navegadores web y los rastreadores también hacen esto. Una URL también puede apuntar a un objeto que no se puede encontrar; para empezar, se movió o nunca existió.