¿Qué son las sumas de comprobación?

Las sumas de verificación son bloques fijos de información, o datum, que se utilizan para verificar y mantener la integridad de los datos al almacenar y transmitir información computarizada. Usando funciones matemáticas, un algoritmo de suma de verificación cuenta el número de bits en un bloque particular de información y genera un número que representa datos precisos. Cuando los datos se duplican por cualquier medio, el duplicado se compara con el número original mediante el valor calculado. Si los números coinciden, los datos se consideran completos y precisos.

La mayoría de los protocolos de transferencia de archivos (FTP) válidos requieren algún tipo de verificación de datos, y muchas funciones son capaces no solo de detectar, sino de reparar problemas menores con la integridad de los datos. Algunos tipos de sumas de comprobación, también conocidas como sumas hash, incluyen md5 y comprobaciones de redundancia cíclica (CRC). Los CRC son un tipo de suma de comprobación conocida como suma de comprobación de código polinomial, capaz de identificar alteraciones accidentales en el formato de datos original.

Si bien es útil para detectar errores en archivos descargados a través de la web o mediante redes peer-to-peer (P2P), las sumas de verificación también se utilizan en cualquier función en la que los datos pueden corromperse cuando se transfieren a través de una red o en un medio de almacenamiento. Los errores de datos a menudo son causados ​​por bits faltantes, duplicados o incorrectos. Dado que el valor de una suma de comprobación se calcula en función de cada bit de un bloque de datos, incluso un bit faltante puede provocar un error de suma de comprobación.

La mayoría de los archivos codifican sumas de comprobación directamente en sus datos, generalmente adjuntos al final del archivo. Cuando el archivo se transfiere a otro sistema o dispositivo, el receptor lee la suma de comprobación y usa su algoritmo para verificar que todo el archivo se haya recibido sin errores. Es posible que los archivos con bits faltantes, corruptos o repetidos no funcionen correctamente o no funcionen en absoluto. Otros pueden parecer que funcionan correctamente a pesar de fallar la suma de comprobación. Los datos incompletos o corruptos pueden continuar degradándose con el tiempo, hasta que se vuelvan inutilizables o provoquen errores.

Debido a su naturaleza, las sumas de comprobación básicas generalmente solo son útiles para verificar y reparar pequeños bloques de datos. A medida que aumenta la cantidad de información, también aumenta la probabilidad de un error que la suma de comprobación no puede detectar ni corregir. Esto puede hacer que los datos corruptos pasen repetidamente la suma de verificación, generen más errores e incluso corrompan el dato de la suma de verificación.

Las comprobaciones de redundancia cíclica, debido a la mayor complejidad de sus algoritmos, tienen una tasa de error mucho menor que una suma de comprobación estándar y se pueden aplicar a bloques de datos más grandes. Aunque los CRC no son seguros, aún brindan una mayor confiabilidad al verificar y preservar la integridad de los datos. Algunos programas también brindan capacidad de suma de comprobación y reparación de errores en función de funciones personalizadas.