Un database relazionale è costituito da una raccolta di tabelle che memorizzano particolari insiemi di dati. L’invenzione di questo sistema di database ha standardizzato il modo in cui i dati vengono archiviati ed elaborati. Il concetto di database relazionale deriva dai principi dell’algebra relazionale, realizzati nel loro insieme dal padre dei database relazionali, EF Codd. La maggior parte dei sistemi di database oggi in uso si basa sul sistema relazionale; tuttavia, i database relazionali sono integrati nel software acquistato da persone e aziende, quindi il database è generalmente invisibile al pubblico in generale.
La storia del database relazionale è iniziata con l’articolo di Codd del 1970, A Relational Model of Data for Large Shared Data Banks. Questa teoria stabiliva che i dati dovevano essere indipendenti da qualsiasi hardware o sistema di archiviazione e prevedeva la navigazione automatica tra gli elementi dei dati. In pratica, ciò significava che i dati dovevano essere archiviati in tabelle e che esistevano relazioni tra i diversi set di dati o tabelle.
Contenuto del database
La relazione, che è una tabella bidimensionale, è l’unità di archiviazione primaria in un database relazionale. Un database relazionale può contenere una o più di queste tabelle, con ogni tabella costituita da un insieme univoco di righe e colonne. Un singolo record viene archiviato in una tabella come riga, nota anche come tupla, mentre gli attributi dei dati sono definiti in colonne o campi nella tabella. Le caratteristiche dei dati, o la colonna, mettono in relazione un record con un altro. Ogni colonna ha un nome univoco e il contenuto al suo interno deve essere dello stesso tipo.
Tabelle con riferimenti incrociati
Le tabelle possono essere collegate tra loro in vari modi. Le dipendenze funzionali si formano quando un attributo di una tabella si riferisce ad attributi di altre tabelle. La relazione più semplice è la relazione uno a uno, in cui un record in una tabella è correlato a un altro record in una tabella separata. Una relazione uno a molti è una relazione in cui un record in una tabella è correlato a più record in un’altra tabella. Una relazione molti a uno definisce la situazione inversa; più di un record in una singola tabella si riferisce a un solo record in un’altra tabella. Infine, in una relazione molti a molti, più di un record in una tabella si riferisce a più di un record in un’altra tabella.
Dati differenzianti
Quando si fa riferimento a un database relazionale, una chiave è un’entità in una tabella che distingue una riga di dati da un’altra. La chiave può essere una singola colonna oppure può essere costituita da un gruppo di colonne che identifica in modo univoco un record. Le tabelle possono contenere chiavi primarie e chiavi esterne. Le chiavi primarie servono a differenziare i record l’uno dall’altro; possono essere un singolo attributo o una combinazione di attributi. Le chiavi esterne mettono in relazione tra loro le tabelle nel database e generalmente definiscono le relazioni padre-figlio tra le tabelle. Inoltre, una chiave esterna in una tabella può essere una chiave primaria in un’altra.
Organizzazione dei dati
I dati archiviati nelle tabelle sono organizzati in modo logico in base a uno scopo particolare per ridurre al minimo la duplicazione, ridurre le anomalie dei dati e rafforzare l’integrità dei dati. Il processo mediante il quale i dati sono organizzati logicamente è chiamato normalizzazione; non solo semplifica la definizione dei dati, ma ne regola anche la struttura. Ci sono cinque moduli nel processo di normalizzazione, con ogni modulo che soddisfa una condizione più impegnativa. La prima forma normale, 1NF, soddisfa i requisiti minimi per la normalità e ha la minima integrità dei dati, mentre la quinta forma normale, o 5NF, struttura i dati con il minor numero di anomalie e la migliore integrità.
I dati memorizzati vengono manipolati utilizzando un linguaggio di programmazione chiamato Structured Query Language o SQL. Esistono molte varietà di SQL, ma la maggior parte si basa su operatori relazionali della teoria degli insiemi come and, or, not, and in, tutti utilizzati per eseguire operazioni sui dati. Le operazioni che possono essere utilizzate nei database relazionali includono i privilegi di inserimento, selezione, aggiornamento ed eliminazione.
Opzioni del prodotto
All’inizio degli anni 2010, il sistema di gestione di database relazionali (RDBMS), è il formato di database più comunemente utilizzato; è spesso utilizzato da aziende e società per aiutare ad aggiornare e amministrare i database relazionali. Storicamente, ci sono state tre aziende leader di RDBMS: Oracle®, che ha creato il primo database relazionale commerciale nel 1979; IBM®, che ha seguito l’esempio nel 1982 con SQL Data System, in seguito ribattezzato DB2®; e Microsoft®, che si è unito a SQL Server® 4.2 nel 1992. Altre aziende offrono anche prodotti RDBMS, la maggior parte dei quali può essere acquistata dal sito Web dell’azienda o nei negozi al dettaglio che vendono software per computer, ei prezzi variano a seconda dell’azienda.