Los microdatos son una especificación HTML-5 para agregar código legible por máquina a un documento, como una página web, y la especificación no debe confundirse con empresas que se denominan sistemas de microdatos. Todos los microdatos generalmente se agregan a las etiquetas HTML que muestran información que es visible para los usuarios humanos. Al agregar información a las etiquetas ya utilizadas, un desarrollador puede etiquetar elementos del contenido de la página para que los motores de búsqueda y otras aplicaciones puedan clasificar el contenido más fácilmente. Estas etiquetas describen el tipo de contenido, como varios aspectos de productos, organizaciones o información sobre personas. La especificación no describe la presentación o apariencia del contenido.
El contenido del documento, como el nombre, la dirección, el número de teléfono y la URL del sitio web de una organización, se etiqueta mediante grupos, conocidos como elementos, de pares nombre-valor. Dentro del código HTML-5, el desarrollador anotará el contenido como un elemento y luego agregará propiedades del elemento como cadenas, URL, fechas y hora a ese elemento. Las etiquetas y son con frecuencia las etiquetas base a las que se agrega la información de microdatos. Así como HTML se puede anidar, los microdatos también se pueden anidar. Un conjunto inicial de vocabularios para las propiedades de los elementos está disponible en el sitio web de la organización Data Vocabulary.
El siguiente es un ejemplo del uso de microdatos para describir un producto:
Nombre del producto (Sólo disponible en inglés) Plátano o Cambur
Grupo alimenticio: Fruta
Productor: Subsidio de desempleo
ID del Producto: 123456789
El uso de microdatos es compatible con Resource Description Framework (RDFa). RDFa funciona con las extensiones de nivel de atributo de XHTML. Sin embargo, esta especificación es más simple que la especificación para RDFa y es parte de la especificación HTML-5. Tanto el uso de RDFa como de microdatos son formas de marcado semántico.
Se pueden extraer todos los microdatos para utilizarlos con la notación de objetos de JavaScript (JSON). JSON es un formato de intercambio de datos, considerado ligero, que los humanos pueden leer. JSON se puede utilizar con métodos de programación Asynchronous Javascript y XML (AJAX). Estos métodos permiten que los datos de la aplicación web se obtengan de un servidor sin afectar el comportamiento y la apariencia de la página web. Las aplicaciones Web 2.0 utilizan con frecuencia AJAX, por lo que los sistemas de microdatos pueden resultar útiles para estos programas.
Los motores de búsqueda escanean las páginas en busca de contenido estructurado con microdatos para que sus fragmentos enriquecidos puedan presentar mejor información en la página de resultados de búsqueda. Es de especial utilidad para mejorar los resultados de la búsqueda local, que consiste en motores de búsqueda especiales que revisan los datos de las listas de empresas de una región específica. La empresa tiene información sobre cómo agregar este código a documentos HTML en su sección de herramientas para webmasters.