Qu’est-ce que l’annotation du génome ?

L’annotation du génome marque des sections d’un génome avec des informations sur les données génétiques qu’il contient. Cela fait partie du processus des projets sur le génome, où l’objectif n’est pas seulement de séquencer l’ADN d’un organisme cible, mais de comprendre ce qu’il fait et comment il fonctionne. Les chercheurs peuvent effectuer des annotations dans leurs laboratoires et partager des données avec d’autres scientifiques pour mettre en commun des ressources et des informations. Des bases de données en ligne ouvertes au public sont disponibles, et certaines permettent également aux membres du grand public de soumettre leurs propres annotations.

La première étape de l’annotation du génome est le séquençage, où les chercheurs déterminent l’ordre des acides aminés dans l’ADN d’un organisme. Le séquençage d’un génome entier prend beaucoup de temps et il est courant que les scientifiques commencent à annoter avant que le génome n’ait été décodé. Avec une section d’ADN séquencé en main, un chercheur peut commencer à annoter. Les scientifiques peuvent noter où les gènes semblent commencer et s’arrêter, en prêtant attention aux chaînes d’ADN distinctives qui contiennent des informations sur la fonction du génome.

Les ordinateurs sont capables d’effectuer eux-mêmes certaines annotations du génome. Ils peuvent rechercher des modèles connus, tels que des chaînes d’acides aminés qui apparaissent au début et à la fin des gènes. Dans l’annotation automatisée, l’ordinateur peut ajouter des notes à différentes sections d’une chaîne d’ADN pour fournir des informations à son sujet. Il est également possible de comparer des segments de différents organismes pour rechercher une variance susceptible de fournir des informations importantes sur l’espèce dans son ensemble.

L’annotation manuelle du génome implique l’examen physique de l’ADN. De nombreux chercheurs utilisent des ordinateurs pour afficher les informations et les marquer, ce qui leur permet de les saisir dans des bases de données pendant qu’ils travaillent. Dans certains cas, une révision manuelle peut être nécessaire après une annotation automatisée, pour s’assurer que l’ordinateur a obtenu les informations correctes. Cela peut être un processus laborieux et des erreurs se produisent, ce qui est l’une des raisons pour lesquelles les chercheurs aiment mettre en commun les bases de données. Si une annotation ne correspond pas à d’autres sur la même section d’ADN, les gens peuvent évaluer les informations pour déterminer ce qui s’est passé et corriger l’erreur.

Il n’est pas toujours possible de déterminer ce que fait un gène pendant le processus d’annotation du génome. Les scientifiques peuvent signaler les gènes et les séparer des autres composants du génome, tels que l’ADN non codant comme les répétitions. Ces informations peuvent être utilisées dans la recherche au fur et à mesure que les gens développent des théories sur différents segments du génome. Ils peuvent compléter les annotations pour noter la fonction d’un gène.