¿Qué es un modelo de almacén de datos?

Un modelo de almacén de datos es una forma aplicada de un modelo de datos de un sistema informático. En los sistemas informáticos, el flujo de datos se modela con base en información teórica para probar las habilidades y limitaciones del sistema. Cuando surgió el almacenamiento de datos, estos mismos modelos comenzaron a encontrar aplicaciones físicas reales en la construcción de los datos. Esto sería similar a una persona que simplemente resuelve problemas matemáticos y luego usa esas ecuaciones para construir un nuevo tipo de motor.

Hay varias ideas diferentes detrás de un modelo de almacén de datos. Cada uno de ellos tiene sus propias fortalezas y debilidades, así como los tipos de datos que es más adecuado para manejar. No es raro que en el mismo sistema existan varios modelos de almacenamiento de datos diferentes o sistemas híbridos que aprovechan las ventajas de varios tipos.

El sistema Flat es el tipo de modelo de almacén de datos que muchos usuarios reconocerían como el más sencillo. Esta forma de almacenamiento de datos implica filas y columnas de información interconectadas, similar a una hoja de cálculo. Si bien este método es fácil de leer para los humanos, es más difícil para las computadoras y lento de correlacionar.

Un modelo de almacén de datos jerárquico almacena información en una serie continua de niveles. Cada nivel contiene información que depende de la generación anterior. Es muy similar al modelo de red, que también contiene una serie de niveles dependientes. La diferencia radica en sus dependencias: en un sistema jerárquico, cada bloque de datos puede tener solo un nivel más alto de dependencia, pero en un modelo de red, pueden tener tantos como necesiten. En ambos casos, un solo bloque de información puede conectarse a varios bloques a continuación.

Un modelo de almacén de datos relacional es una variación del sistema Flat. Los datos se guardan en tablas, similares a las de un sistema Flat, y a cada dato fundamental se le asigna un identificador único. Este identificador viaja junto con los datos, asegurando su singularidad. Por ejemplo, si un empleador tiene dos empleados con el mismo nombre, su identificador aún los separaría en el sistema. Este identificador está correlacionado a través de todo el sistema; si todo funciona correctamente, cada vez que algo relacionado con la información única ingresa al sistema, se correlacionaría con información preexistente basada únicamente en el identificador.

El modelo dimensional se basa en el jerárquico. Un solo hecho se utiliza como punto de partida, luego se filtra información adicional relacionada con ese hecho. Un elemento como el número de empleado sería un dato inicial; luego, las fechas relacionadas con ese trabajador, así como el pago o el tiempo de vacaciones, se conectarían a él cuando ingresaran al sistema.
Los modelos de almacén de datos relacionales y dimensionales son los dos estilos más comunes. Existen otros tipos de almacenamiento de datos, pero son menores en comparación con estos. Generalmente, los nuevos modelos se construyen a partir de sistemas planos, jerárquicos o de red; a menudo, son simples mejoras a su método básico de organización.