¿Qué es la captura de datos modificados?

La captura de datos modificados es el proceso de localizar, registrar y guardar registros de versiones en sistemas de datos. En la mayoría de los casos, los sistemas de captura de datos modificados funcionan dando a los datos ciertos marcadores que hacen referencia a entradas de datos específicas. Cuando se cambian los datos, estos marcadores también cambian. Esto alerta al sistema de captura de datos de cambios y guarda la versión de datos anterior, lo que brinda a los usuarios y sistemas acceso a datos nuevos y antiguos. Estos procesos son comunes en grandes sistemas de almacenamiento de datos, como almacenes de datos y sistemas de datos basados ​​en la web.

Los datos de versiones se consideran un aspecto muy importante del almacenamiento de datos. Cuando un dato es sobrescrito por otro, el dato original no puede simplemente desaparecer. Esto causaría estragos si esa información fuera importante para un proceso en curso o un registro corporativo.

La creación de versiones de diferentes piezas de datos es el centro de la captura de datos de cambio. Si una sola pieza de información cambia cinco veces, el sistema necesita recordar cada uno de los cinco valores y cuándo cambiaron. Esto es importante tanto para el mantenimiento de registros a largo plazo como para la verificación de errores. Por ejemplo, si un trabajador imputa una cifra de ventas en la parte incorrecta de una base de datos, podría alterar una gran cantidad de información. El control de versiones permite a la empresa revertir ese número si es necesario.

No existe un método establecido para la captura de datos modificados. Los diferentes sistemas de datos utilizan sus propias versiones, a menudo desarrolladas internamente para adaptarse a su propio estilo específico de almacenamiento de datos. Aun así, hay varios métodos que se utilizan habitualmente. No es inusual que un solo sistema tenga varios métodos diferentes de captura de datos modificados operando en el mismo sistema. A menudo, cada método se especializa en un cierto tipo de captura u opera como un sistema redundante a prueba de fallas.

Los métodos más comunes para crear diferentes versiones de datos son marcadores especiales en los datos. Estos marcadores están en una fila o columna especial en los datos que realiza un seguimiento de cuándo ocurren los cambios. Los scripts de captura de datos de cambios observan estas áreas en busca de cambios y realizan un seguimiento de las modificaciones realizadas. Estas celdas especiales pueden contener números de versión, marcas de tiempo o cadenas de datos patentadas.

Los dos lugares más comunes para encontrar sistemas de captura de datos de cambios a gran escala son los almacenes de datos y las bases de datos de acceso abierto. Uno de los principales puntos de venta del almacenamiento de datos son las copias de seguridad constantes y completas de los datos. Mientras un usuario se suscriba a sus servicios, estos sistemas nunca se deshacen de nada. Las bases de datos de acceso abierto, como Wikipedia, utilizan el control de versiones para evitar la manipulación y mantienen registros de qué usuarios realizaron qué cambios. Si bien el control de versiones de Wikipedia puede no ser tan completo como los que se utilizan en los almacenes de datos, a menudo es examinado por más usuarios.