Che cos’è l’integrazione dei dati?

L’integrazione dei dati è l’unione di più origini dati in un’unica origine dati. Questa pratica è spesso molto lunga e complessa, poiché le diverse fonti di dati sono probabilmente incompatibili tra loro. Cose semplici come nomi di colonne diverse su un foglio di calcolo sono sufficienti per richiedere la riformattazione della data. Questo processo è più comune nelle situazioni in cui due gruppi sono partiti senza alcuna connessione, ma vengono messi insieme dopo aver lavorato in modo indipendente. L’integrazione dei dati è diventata un argomento più importante a causa della prevalenza di fonti di dati gratuite e database online.

La parte dei dati dell’integrazione dei dati può essere quasi qualsiasi cosa purché sia ​​archiviata in un sistema informatico. Il contenuto effettivo dei dati raramente è importante quanto il modo in cui i dati vengono archiviati. Il più delle volte, i dati sono conservati in banche dati, sistemi di informazione organizzati. Questi sistemi contengono voci e campi univoci che consentono agli utenti di trovare rapidamente le informazioni.

Il più grande ostacolo a qualsiasi processo di integrazione dei dati sono i dati stessi. In molti casi, quando i dati sono stati impostati per la prima volta, non c’era l’intenzione di unire mai il set di dati con un altro. Ciò significa che anche se due set di dati possono fare riferimento alla stessa cosa, sono totalmente incompatibili.

Quasi tutto renderà i database incompatibili. Qualcosa di semplice come una differenza nella presentazione, come l’ordine dei campi o la larghezza delle colonne, può essere sufficiente per impedire una facile fusione. Quando i dati sono significativamente diversi, ad esempio un database che contiene più o meno informazioni, la fusione è molto più difficile.

Le due situazioni che più di ogni altra richiedono l’integrazione dei dati sono nel campo degli affari e della ricerca. Nel mondo degli affari, la fusione di dipartimenti o aziende richiede la combinazione delle informazioni precedentemente separate in un’unica struttura. Questa forma di integrazione è generalmente molto difficile a meno che i gruppi originali non utilizzino software simili e abbiano obiettivi informativi simili.

Quando l’integrazione dei dati viene eseguita per scopi di ricerca, generalmente è molto più agevole. Quando un ricercatore dà accesso alle sue informazioni a un altro, le due parti generalmente stanno esaminando lo stesso processo. Ciò significa che utilizzeranno metodi simili per catalogare e archiviare i propri dati.
In passato, l’integrazione dei dati era un’area relativamente minore degli studi sui dati, ma questo è cambiato dalla prima parte del 21° secolo. Con i database online gratuiti che stanno diventando sempre più popolari e accurati, le aziende stanno cercando di ottenere le loro informazioni in un formato condivisibile. Ciò consente loro sia di rilasciare le proprie informazioni in forma pubblica sia di integrare nei propri sistemi versioni private di interfacce pubbliche ben note.