Los metadatos son esencialmente datos sobre otros datos. También conocido como metalenguaje, los metadatos se pueden utilizar en cualquier tipo de medio para describir el contenido de la información. La idea detrás del metalenguaje es proporcionar documentación o información sobre un dato específico. Cuando se crea un documento, imagen u otro tipo de datos, es necesario agregar ciertos parámetros detrás del elemento como parte de todo el archivo. Estos pueden incluir elementos y atributos como un nombre, tamaño o tipo de archivo. También puede representar la ubicación o propiedad del archivo entre cualquier otra información que deba tenerse en cuenta sobre el contenido de los datos.
Los metadatos se almacenan con un archivo en diferentes niveles de granularidad. La granularidad es esencialmente el detalle con el que se almacenan estos datos. Los metadatos se pueden formatear en un nivel de granularidad bajo donde se establece una línea de datos. También puede ser más complejo, con varias líneas de datos almacenadas en una estructura detallada, como una base de datos.
Los usos de metadatos incluyen libros, fotografías, archivos de audio y páginas web. Los libros se archivarían con información sobre el título, el autor, la fecha de publicación y posiblemente un identificador único, como el número estándar internacional de libros (ISBN). Las fotografías suelen incluir la hora y la fecha en que se tomaron. Las cámaras digitales a menudo registran datos sobre datos en un formato estandarizado que es intercambiable con diferentes marcas. Asimismo, los archivos de audio digital incluyen nombres de álbumes, títulos de canciones, año de publicación y, a menudo, género. Las páginas web suelen contener el metalenguaje más elaborado. El lenguaje de marcado de hipertexto (HTML) que compone las páginas web incluye de todo, desde textos simples hasta fechas y palabras clave. El metalenguaje puede incluir el encabezado de la página y está geoetiquetado con coordenadas para su ubicación. El hipertexto, que enlaza las páginas web, también utiliza metalenguaje.
El uso de metalenguaje acelera la búsqueda y localización de muchos recursos. En Internet, los datos sobre datos ayudan en las consultas de búsqueda a través de navegadores web como Google y Yahoo! Permite al usuario ahorrar tiempo al buscar información. El navegador web descarga automáticamente el metalenguaje, lo que lo convierte en parte del proceso de búsqueda.
A menudo, los metadatos se formatean en un sistema jerárquico llamado «esquema». Ciertos elementos de datos se utilizan como descriptores de otros elementos de datos. Este sistema esencialmente puede continuar para siempre en muchos niveles. El formato de los datos sobre los datos generalmente se almacena en una ubicación central conocida como registro de metadatos y ayuda a las organizaciones a estandarizar sus datos. La mayoría de los archivos, sin embargo, no requieren una información tan extensa.
El origen del lenguaje de los metadatos proviene del prefijo griego meta que describe estar entre algo.