Un arquitecto de datos es una persona designada para ser responsable del diseño, la estructura, la organización y el mantenimiento de los datos de una empresa o proyecto en particular. Así como un arquitecto diseña cuidadosamente los planos de un edificio, un arquitecto de datos traza cuidadosamente la estructura y organización de los datos relevantes para una empresa o proyecto. Puede trabajar para una sola empresa y centrarse por completo en los datos internos o trabajar para un grupo de bases de datos y ayudar a varias empresas con sus datos.
Un arquitecto de datos cumple una serie de funciones y mantiene una serie de responsabilidades. Él o ella es responsable de evaluar el uso de datos y relacionarlos directamente con los objetivos y prácticas de una empresa de una manera que proporcione resultados claros. Alguien en esta posición debe garantizar la precisión y accesibilidad de todos los datos importantes, y él o ella es responsable de saber qué datos son importantes y por qué. A menudo actúa como intermediario, deduciendo las necesidades de datos de un grupo en particular y explicando la importancia y el uso de los datos más relevantes para ellos.
Hay una serie de herramientas que utiliza alguien en arquitectura de datos a lo largo de su carrera. Más allá de las bases de datos básicas, un arquitecto de datos a menudo crea algo llamado registro de metadatos. En cierto sentido, se trata de una base de datos que cataloga qué datos están disponibles en lugar de catalogar los datos reales. Un registro de metadatos puede organizar datos en una escala mucho más masiva que una base de datos básica, porque no es necesario que contenga la información en sí, sino solo que haga referencia a ella.
Casi todos los arquitectos de datos están familiarizados con lenguajes informáticos orientados a datos como SQL. En un intento por simplificar un sistema bastante complicado, SQL es un lenguaje de consulta de datos basado en recuperar datos almacenados de acuerdo con relaciones matemáticas. En lugar de almacenar números, las bases de datos SQL representan todo tipo de información en términos matemáticos y utilizan herramientas matemáticas para ordenar la información. Es probable que otros lenguajes orientados a datos, como XML, sean herramientas habituales para las personas en esta posición.