Che cosa sono i dati grezzi?

I dati grezzi, noti anche come dati di origine o dati atomici, sono informazioni che non sono state elaborate per essere visualizzate in qualsiasi forma presentabile. La forma grezza può sembrare molto irriconoscibile e quasi priva di significato senza elaborazione, ma può anche essere in una forma che alcuni possono interpretare, a seconda della situazione. Questi dati possono essere elaborati manualmente o da una macchina.

In alcuni casi, i dati grezzi potrebbero non essere altro che una serie di numeri. Il modo in cui questi numeri sono sequenziati, tuttavia, e talvolta anche il modo in cui sono distanziati, può essere un’informazione molto importante. Un computer può interpretare queste informazioni e fornire una lettura che può avere senso per il lettore.

Il codice binario è un buon esempio di dati grezzi. Preso da solo come una stampa, un codice binario fa ben poco per l’utente del computer, almeno per la stragrande maggioranza degli utenti. Quando viene elaborato tramite un computer, invece, fornisce informazioni più comprensibili. In effetti, il codice binario è in genere il codice sorgente per tutto ciò che vede un utente di computer.

In alcuni casi, questo tipo di dati potrebbe non essere mai visto nella sua forma definitiva, soprattutto da chi lavora nelle applicazioni di data entry. In queste situazioni, l’utente è responsabile solo dell’inserimento delle informazioni e, a volte, la persona che inserisce i dati potrebbe anche non sapere esattamente cosa sta inserendo o perché. Ciò è particolarmente utile quando la sicurezza o la privacy sono importanti perché aiuta a garantire che nessun lavoratore inserisca informazioni distorte o intenzionalmente false allo scopo di ferire o avvantaggiare qualcuno.

Ad esempio, in alcune applicazioni mediche, possono esistere normative molto rigide in materia di privacy dei pazienti, tuttavia potrebbe essere necessario inserire i dati in un database. Per evitare che più persone possibili identifichino i pazienti, a ciascuno può essere assegnato un numero. Alle loro condizioni può anche essere assegnato un numero, così come le loro opzioni di trattamento. Senza la conoscenza di cosa significano quei numeri, non c’è modo di identificare il paziente o la condizione. Tali informazioni identificative possono essere disponibili solo per una manciata di persone.

Questo esempio è in realtà piuttosto insolito, poiché le informazioni vengono raramente convertite in una forma considerata grezza. Invece, i dati grezzi vengono solitamente elaborati per renderli più raffinati. Esistono tuttavia molte applicazioni diverse in cui vengono visualizzati dati non elaborati e le regole relative a cosa farne dipendono dalla situazione.