Genom-Annotation kennzeichnet Abschnitte eines Genoms mit Informationen zu den darin enthaltenen genetischen Daten. Dies ist Teil des Prozesses bei Genomprojekten, bei denen es nicht nur darum geht, die DNA eines Zielorganismus zu sequenzieren, sondern zu verstehen, was er tut und wie er funktioniert. Forscher können in ihren Laboren Anmerkungen erstellen und Daten mit anderen Wissenschaftlern teilen, um Ressourcen und Informationen zu bündeln. Es stehen öffentlich zugängliche Online-Datenbanken zur Verfügung, und einige ermöglichen es auch der breiten Öffentlichkeit, eigene Anmerkungen einzureichen.
Der erste Schritt bei der Genom-Annotation ist die Sequenzierung, bei der Forscher die Reihenfolge der Aminosäuren in der DNA eines Organismus bestimmen. Die Sequenzierung eines ganzen Genoms dauert lange, und es ist üblich, dass Wissenschaftler mit der Annotation beginnen, bevor das Genom entschlüsselt wurde. Mit einem Abschnitt der sequenzierten DNA in der Hand kann ein Forscher mit der Annotation beginnen. Wissenschaftler können feststellen, wo Gene zu beginnen und zu stoppen scheinen, und achten dabei auf charakteristische DNA-Stränge, die Informationen über die Funktion des Genoms enthalten.
Computer sind in der Lage, selbst einige Genom-Annotationen durchzuführen. Sie können nach bekannten Mustern suchen, beispielsweise nach Aminosäureketten, die am Anfang und am Ende von Genen erscheinen. Bei der automatisierten Annotation kann der Computer verschiedenen Abschnitten eines DNA-Strings Notizen hinzufügen, um Informationen darüber bereitzustellen. Es ist auch möglich, Segmente verschiedener Organismen zu vergleichen, um nach Varianzen zu suchen, die wichtige Informationen über die Art als Ganzes liefern könnten.
Bei der manuellen Genom-Annotation wird die DNA physisch überprüft. Viele Forscher verwenden Computer, um die Informationen anzuzeigen und zu markieren, sodass sie sie während der Arbeit in Datenbanken eingeben können. In einigen Fällen kann nach der automatischen Annotation eine manuelle Überprüfung erforderlich sein, um sicherzustellen, dass der Computer die Informationen korrekt erfasst hat. Dies kann ein mühsamer Prozess sein und es treten Fehler auf, was ein Grund dafür ist, dass Forscher gerne Datenbanken bündeln. Wenn eine Annotation nicht mit anderen im selben DNA-Abschnitt übereinstimmt, können Benutzer die Informationen auswerten, um festzustellen, was passiert ist, und den Fehler beheben.
Es ist nicht immer möglich zu bestimmen, was ein Gen während des Genom-Annotationsprozesses tut. Wissenschaftler können Gene markieren und sie von anderen Komponenten des Genoms trennen, wie z. B. nicht kodierende DNA wie Wiederholungen. Diese Informationen können in der Forschung verwendet werden, da Menschen Theorien über verschiedene Segmente des Genoms entwickeln. Sie können die Anmerkungen ergänzen, um die Funktion eines Gens zu vermerken.