L’annotazione del genoma contrassegna le sezioni di un genoma con informazioni sui dati genetici che contiene. Questo fa parte del processo dei progetti sul genoma, in cui l’obiettivo non è solo sequenziare il DNA di un organismo bersaglio, ma capire cosa fa e come funziona. I ricercatori possono condurre annotazioni nei loro laboratori e possono condividere i dati con altri scienziati per mettere in comune risorse e informazioni. Sono disponibili banche dati online aperte al pubblico e alcune consentono anche ai membri del pubblico di inviare le proprie annotazioni.
Il primo passo nell’annotazione del genoma è il sequenziamento, in cui i ricercatori determinano l’ordine degli amminoacidi nel DNA di un organismo. Il sequenziamento di un intero genoma richiede molto tempo ed è comune per gli scienziati iniziare ad annotare prima che il genoma sia stato decodificato. Con una sezione di DNA sequenziato in mano, un ricercatore può iniziare ad annotare. Gli scienziati possono notare dove i geni sembrano iniziare e fermarsi, prestando attenzione alle stringhe distintive di DNA che contengono informazioni sulla funzione del genoma.
I computer sono in grado di eseguire autonomamente alcune annotazioni sul genoma. Possono cercare schemi noti, come stringhe di amminoacidi che compaiono all’inizio e alla fine dei geni. Nell’annotazione automatica, il computer può aggiungere note a diverse sezioni di una stringa di DNA per fornire informazioni su di essa. È anche possibile confrontare segmenti di organismi diversi per cercare la varianza che potrebbe fornire informazioni importanti sulla specie nel suo insieme.
L’annotazione manuale del genoma comporta la revisione fisica del DNA. Molti ricercatori utilizzano i computer per visualizzare le informazioni e contrassegnarle, consentendo loro di inserirle nei database mentre lavorano. In alcuni casi, potrebbe essere necessaria una revisione manuale dopo l’annotazione automatica, per assicurarsi che il computer ottenga le informazioni corrette. Questo può essere un processo scrupoloso e si verificano errori, motivo per cui i ricercatori amano mettere in comune i database. Se un’annotazione non corrisponde ad altre sulla stessa sezione del DNA, le persone possono valutare le informazioni per determinare cosa è successo e correggere l’errore.
Non è sempre possibile determinare cosa fa un gene durante il processo di annotazione del genoma. Gli scienziati possono contrassegnare i geni e separarli da altri componenti del genoma, come il DNA non codificante come le ripetizioni. Queste informazioni possono essere utilizzate nella ricerca mentre le persone sviluppano teorie su diversi segmenti del genoma. Possono aggiungere alle annotazioni per annotare la funzione di un gene.