Che cos’è un database del genoma?

Un genoma è una raccolta di tutto il materiale genetico presente in un organismo. Poiché la sequenza e la struttura di questo materiale genetico guidano tutta la vita biologica, gli scienziati sono molto interessati a scoprire a cosa servono. Un database del genoma è una raccolta incrociata di informazioni su uno o più organismi, in modo che uno scienziato possa esaminare tutte le informazioni genetiche disponibili per aiutarlo nella ricerca.

I genomi sono molto complessi e contengono miliardi di basi nella sequenza delle informazioni. I database informatizzati, quindi, sono l’unico modo pratico per organizzare i dettagli in un unico luogo. Generalmente, questi sono disponibili come database online per la ricerca scientifica. Un campo della scienza relativamente nuovo, chiamato bioinformatica, è sorto per perfezionare il modo in cui i dati biologici possono essere interpretati attraverso i sistemi informatici.

I database dei genomi contengono la sequenza dei geni di un organismo se l’intera sequenza è nota. In caso contrario, può contenere sequenze parziali. Ad esempio, sono stati sequenziati i genomi dell’uomo, del topo e della mosca della Drosophila. Quando la sequenza di un genoma è nota, i genetisti possono identificare particolari geni nel genoma. Ogni gene è il foglio di istruzioni per un particolare prodotto cellulare.

Se un gene ha una mutazione, ha una sequenza diversa dal gene normale e funzionale. Le mutazioni possono essere utili e produrre una caratteristica utile nell’organismo mutato. Inoltre possono essere ininfluenti per il prodotto, oppure possono essere dannosi per il normale funzionamento dell’organismo. Molte condizioni mediche, ad esempio, sono dovute a mutazioni in un particolare gene.

Le mutazioni possono anche essere utilizzate per calcolare quanto una specie particolare sia strettamente correlata a un’altra, poiché più mutazioni si accumulano nel tempo. Gli individui possono anche variare nella sequenza del genoma, soprattutto perché grandi parti del genoma non sono geni e non codificano per alcun prodotto cellulare essenziale. Un database del genoma contiene una sequenza di un organismo designato come standard, ma ci saranno molte differenze minori tra lo standard scelto arbitrariamente e gli altri individui di una specie.

Nonostante la presenza di molte differenze, i geni sono riconoscibili attraverso le sequenze. Se i genetisti sanno cosa fa un particolare gene in un organismo, allora un gene con una sequenza simile in un altro animale svolge molto probabilmente la stessa funzione. I genetisti possono utilizzare un database del genoma per identificare un gene che stanno studiando o per scoprire che cosa fa il gene.
Ogni database del genoma è ricercabile. Di solito, gli scienziati possono eseguire ricerche in un database in diversi modi. Comunemente, può inserire la sequenza di un gene che ha sequenziato. Quindi, il database trova una o più sequenze simili per il confronto.

Un modo più semplice di cercare nel database prevede la ricerca di una parola chiave del gene, come il nome del gene. Autorità come la National Authority for Biotechnology Information (NCBI) degli Stati Uniti possono fornire alle sequenze numeri di riferimento distinti e un genetista può anche eseguire ricerche in un database del genoma utilizzando uno di questi identificatori. Lui o lei può anche restringere i risultati utilizzando più parametri di ricerca. Le informazioni con riferimenti incrociati sono una caratteristica della maggior parte dei database del genoma e un singolo risultato di sequenza fornirà anche all’utente del database collegamenti utili per ulteriori informazioni genetiche. Oltre alle informazioni su una sequenza specifica, molti database forniscono una rappresentazione visiva della sequenza e delle caratteristiche notevoli di quell’area.
Organismi diversi possono avere database genomici specifici, ma alcuni database più grandi contengono più di una specie. Varie autorità controllano i diversi database disponibili, quindi tutti i database possono utilizzare formati e capacità di ricerca distinti. Alcuni esempi di queste autorità includono l’NCBI, l’Istituto europeo di bioinformatica o anche singole università.