¿Qué son los macrodatos?

Los macrodatos son mediciones de datos que han crecido tanto que las bases de datos normales no pueden contener y trabajar con una gran cantidad de información. Los datos vienen en tres tamaños: pequeño, mediano y grande; ninguna de estas medidas es estricta; en cambio, cada uno depende más de la facilidad de uso y del tipo de máquina que puede manejar la información. Para big data se necesitan máquinas especiales, mucho más grandes y complejas que las que se utilizan para las bases de datos ordinarias. Estos tipos de datos se encuentran normalmente en agencias gubernamentales y científicas, pero algunos sitios web muy grandes también contienen esta gran cantidad de información.

Los datos vienen en tres tamaños estándar, pero no estrictos. Los datos pequeños pueden caber en una sola computadora o máquina, como una computadora portátil. Los datos medianos pueden caber en una matriz de discos y son mejor administrados por una base de datos. Las bases de datos, sin importar cuán grandes sean, son incapaces de trabajar con big data, y en su lugar se utilizan sistemas especiales. Si bien no existe una pauta estricta sobre lo que son los macrodatos, generalmente comienza alrededor del nivel de terabyte (TB) y sube hasta el nivel de petabyte (PB).

Intentar trabajar con big data en una base de datos que no está especializada para esta cantidad de datos provocará varios problemas sustanciales. La base de datos no puede manejar la cantidad de información, por lo que algunos datos deben borrarse. Esto es como intentar colocar 100 gigabytes (GB) en una computadora con solo 50 GB de espacio en el disco duro; No se puede hacer. Los datos que quedan serán difíciles de controlar y administrar, porque cualquier función tomaría mucho tiempo en completarse y la base de datos debe cerrarse para nuevos envíos.

Si bien es posible seguir comprando máquinas y agregando nuevos datos a las bases de datos, esto crea un problema difícil de manejar. Esto se debe a que el software de base de datos solo está diseñado para trabajar con datos medios. Los conjuntos de datos más grandes dan lugar a errores y problemas administrativos, porque el software simplemente no puede moverse o trabajar con datos grandes sin encontrar problemas.

La mayoría de las organizaciones o sitios web no detectan macrodatos. Las agencias de defensa y militares utilizan esta cantidad de información para crear modelos y almacenar los resultados de las pruebas, y muchas agencias científicas grandes necesitan estas máquinas especializadas por razones similares. Algunos sitios web muy grandes necesitan grandes máquinas de datos, pero los sitios web no son tan comunes como las agencias en este mercado. Estas organizaciones necesitan conservar todos sus datos, porque les ayuda a analizar mejor los datos futuros y hacer predicciones.