¿Qué son los datos brutos?

Los datos brutos, también conocidos como datos de origen o datos atómicos, son información que no se ha procesado para mostrarse en cualquier forma presentable. La forma en bruto puede parecer muy irreconocible y casi sin sentido sin procesamiento, pero también puede ser en una forma que algunos puedan interpretar, dependiendo de la situación. Estos datos se pueden procesar manualmente o mediante una máquina.

En algunos casos, los datos sin procesar pueden ser nada más que una serie de números. Sin embargo, la forma en que se ordenan esos números y, a veces, incluso la forma en que están espaciados, puede ser información muy importante. Una computadora puede interpretar esta información y dar una lectura que luego puede tener sentido para el lector.

El código binario es un buen ejemplo de datos sin procesar. Tomado por sí mismo como una copia impresa, un código binario hace muy poco por el usuario de la computadora, al menos la gran mayoría de los usuarios. Cuando se procesa a través de una computadora, por otro lado, proporciona información más comprensible. De hecho, el código binario suele ser el código fuente de todo lo que ve un usuario de computadora.

En algunos casos, es posible que este tipo de datos nunca se vean en su forma final, especialmente para quienes trabajan en aplicaciones de entrada de datos. En estas situaciones, el usuario es responsable solo de ingresar la información y, a veces, la persona que ingresa los datos puede que ni siquiera sepa exactamente qué está ingresando o por qué. Esto es especialmente útil cuando la seguridad o la privacidad son importantes porque ayuda a garantizar que ningún trabajador inserte información parcial o intencionalmente falsa con el propósito de dañar o beneficiar a alguien.

Por ejemplo, en algunas aplicaciones médicas, puede haber regulaciones muy estrictas con respecto a la privacidad del paciente, sin embargo, es posible que los datos deban ingresarse en una base de datos. Para evitar que la mayor cantidad posible de personas identifiquen a los pacientes, a cada uno se le puede asignar un número. A sus afecciones también se les puede asignar un número, así como sus opciones de tratamiento. Sin el conocimiento de lo que significan esos números, no hay forma de identificar al paciente o la condición. Es posible que esa información de identificación solo esté disponible para un puñado de personas.

Este ejemplo es bastante inusual, ya que la información rara vez se convierte en un formulario que se considera sin formato. En cambio, los datos sin procesar generalmente se procesan para refinarlos más. Sin embargo, existen muchas aplicaciones diferentes en las que aparecen datos sin procesar y las reglas sobre qué hacer con ellos dependen de la situación.