Ein Genom ist eine Sammlung des gesamten genetischen Materials, das in einem Organismus vorhanden ist. Da die Sequenz und Struktur dieses genetischen Materials das gesamte biologische Leben bestimmt, sind Wissenschaftler sehr daran interessiert, herauszufinden, wozu sie alle dienen. Eine Genomdatenbank ist eine querverwiesene Sammlung von Informationen über einen oder mehrere Organismen, sodass ein Wissenschaftler alle verfügbaren genetischen Informationen einsehen kann, um ihm oder ihr bei der Forschung zu helfen.
Genome sind hochkomplex und enthalten Milliarden von Basen in der Informationssequenz. Computergestützte Datenbanken sind daher die einzige praktische Möglichkeit, die Details an einem Ort zu organisieren. Diese stehen in der Regel als Online-Datenbanken für die wissenschaftliche Forschung zur Verfügung. Ein relativ neues Wissenschaftsgebiet namens Bioinformatik ist entstanden, um die Art und Weise, wie biologische Daten durch Computersysteme interpretiert werden können, zu perfektionieren.
Genomdatenbanken enthalten die Sequenz der Gene eines Organismus, wenn die gesamte Sequenz bekannt ist. Andernfalls kann es Teilsequenzen enthalten. Die Genome von Mensch, Maus und Drosophila-Fliege wurden zum Beispiel sequenziert. Wenn die Sequenz eines Genoms bekannt ist, können Genetiker bestimmte Gene im Genom identifizieren. Jedes Gen ist die Gebrauchsanweisung für ein bestimmtes Zellprodukt.
Wenn ein Gen eine Mutation aufweist, hat es eine andere Sequenz als das normale, funktionelle Gen. Mutationen können nützlich sein und eine nützliche Eigenschaft im mutierten Organismus erzeugen. Sie können auch für das Produkt keinen Unterschied machen oder die normale Funktion des Organismus beeinträchtigen. Viele Erkrankungen sind beispielsweise auf Mutationen in einem bestimmten Gen zurückzuführen.
Mutationen können auch verwendet werden, um zu berechnen, wie eng eine bestimmte Spezies mit einer anderen verwandt ist, da sich im Laufe der Zeit mehr Mutationen ansammeln. Individuen können auch in der Genomsequenz variieren, zumal große Teile des Genoms keine Gene sind und kein essentielles Zellprodukt kodieren. Eine Genomdatenbank enthält eine Sequenz eines Organismus, die als Standard bezeichnet wird, aber es gibt viele kleine Unterschiede zwischen dem willkürlich gewählten Standard und den anderen Individuen einer Art.
Trotz vieler Unterschiede sind Gene durch Sequenzen erkennbar. Wenn Genetiker wissen, was ein bestimmtes Gen in einem Organismus bewirkt, dann erfüllt höchstwahrscheinlich ein Gen mit einer ähnlichen Sequenz in einem anderen Tier die gleiche Funktion. Genetiker können eine Genomdatenbank verwenden, um entweder ein Gen zu identifizieren, das sie untersuchen, oder um herauszufinden, was das Gen tut.
Jede Genomdatenbank ist durchsuchbar. Normalerweise können Wissenschaftler eine Datenbank auf verschiedene Weise durchsuchen. Üblicherweise kann er oder sie die Sequenz eines Gens eingeben, das er oder sie sequenziert hat. Dann findet die Datenbank eine oder mehrere ähnliche Sequenzen zum Vergleich.
Eine einfachere Art, die Datenbank zu durchsuchen, besteht darin, nach einem Genschlüsselwort zu suchen, wie beispielsweise dem Namen des Gens. Behörden wie die US National Authority for Biotechnology Information (NCBI) können Sequenzen eindeutige Referenznummern geben, und ein Genetiker kann auch eine Genomdatenbank mit einem dieser Identifikatoren durchsuchen. Er oder sie kann die Ergebnisse auch mit weiteren Suchparametern eingrenzen. Querverweisinformationen sind ein Merkmal der meisten Genomdatenbanken, und ein einzelnes Sequenzergebnis liefert dem Datenbankbenutzer auch nützliche Links für weitere genetische Informationen. Neben Informationen zu einer bestimmten Sequenz bieten viele Datenbanken eine visuelle Darstellung der Sequenz und der bemerkenswerten Merkmale dieses Gebiets.
Verschiedene Organismen können über spezifische Genomdatenbanken verfügen, aber einige größere Datenbanken enthalten mehr als eine Spezies. Verschiedene Behörden kontrollieren die verschiedenen verfügbaren Datenbanken, sodass die Datenbanken alle unterschiedliche Formate und Suchfunktionen verwenden können. Einige Beispiele für diese Behörden sind das NCBI, das European Bioinformatics Institute oder sogar einzelne Universitäten.