Che cos’è un pool di dati?

Il termine “pool di dati” si riferisce a un insieme correlato di valori ottenuti da un database centralizzato. I dati possono essere qualsiasi cosa, dalle informazioni sulla catena di approvvigionamento ai record dei dipendenti. I dati possono essere generati automaticamente o manualmente per l’analisi utilizzando l’intero set di dati o un sottoinsieme di valori. Il software del database è progettato per gestire le varie funzioni associate ai pool di dati, inclusa la sincronizzazione e la verifica delle informazioni.

In un senso molto elementare, qualsiasi insieme di dati raccolti a scopo di analisi è un pool di dati. Il metodo di raccolta dei dati può influenzare l’accuratezza dei valori all’interno del pool e quindi l’esito dell’analisi. Se il set di dati fa parte di un semplice esperimento quantitativo che non comporta un enorme set di dati, la raccolta manuale dei dati può essere ragionevolmente affidabile. Al contrario, se il set di dati è grande, un processo di raccolta automatica dei dati sarà il più accurato e preciso.

L’accuratezza e la precisione dei valori contenuti in un set di dati è sempre importante, ma potrebbe essere indispensabile per alcuni settori che si affidano al monitoraggio della catena di custodia nella catena di approvvigionamento. Il Global Data Synchronization Network (GSDN) certifica i pool di dati e facilita il processo di sincronizzazione dei dati eseguendo un audit annuale su tutti i pool di dati certificati GDSN. I dati della catena di approvvigionamento acquisiti in un pool di dati certificato GDSN sono legati a un numero di posizione globale (GLN) e a un numero di articolo commerciale globale (GLIT). Questi due numeri vengono utilizzati per identificare rispettivamente le posizioni rilevanti e gli articoli associati per il commercio, mentre l’articolo passa attraverso la catena di approvvigionamento dal produttore al consumatore.

In altri casi, ai pool di dati si accede automaticamente dal software del database durante l’avvio di un computer o durante un processo di installazione o aggiornamento. Questi processi implicano il trasferimento e la verifica delle informazioni tra i database. Le informazioni trasferite e verificate sono il pool di dati. Se si verifica un errore del pool di dati durante il processo, potrebbe esserci un problema con i dati, come un file di avvio corrotto, impostazioni errate sul disco rigido o un disco rigido difettoso.

Per un database personalizzato che contiene record dei dipendenti o dati storici sulla temperatura, l’accesso al pool di dati può essere privato o condiviso. Un pool privato non può essere visto o accessibile da nessuno tranne che dall’amministratore. A un pool condiviso possono accedere altri che possono aggiungere, modificare o rimuovere valori. I dati possono essere inseriti automaticamente, manualmente e importati o esportati da un foglio di calcolo. Un pool basato sul Web viene in genere manipolato da un amministratore ma condiviso in modo che gli utenti online possano visualizzare ed esportare i dati per vari scopi.