Was ist Genom-Assembly?

Genomassemblierung bezieht sich auf den Prozess, viele kleine Teile einer genetischen Sequenz zu nehmen und sie zu einem zusammenhängenden Ganzen zusammenzuführen, das das gesamte Genom eines Organismus darstellt. Dies ist ein Schwerpunkt der Bioinformatik, zu dem es eine Vielzahl von Genomprojekten gibt. Die Genomassemblierung wurde verwendet, um mit der Analyse der Genome vieler Arten zu beginnen, darunter Menschen, Pflanzen, Tiere und Bakterien.

Die Analyse der Gene eines Organismus ist ein langer Prozess, und die Genommontage ist einer der ersten Schritte. Viele andere Analysemethoden bauen auf einem erfolgreichen Zusammenbau auf, und die Identifizierung von Genen kann ohne sie nicht voranschreiten. Noch bevor Gene gefunden werden, kann eine erfolgreiche Genommontage viele nützliche Informationen für die spätere Analyse liefern, einschließlich der Größe des Genoms, seiner Struktur und seiner allgemeinen Zusammensetzung.

Der Prozess der Genommontage ist wie das Zusammensetzen eines Puzzles, ohne ein Bild oder nützliche Formen als Anleitung zu haben. Konfrontiert mit den ersten Genomstücken, den sogenannten Raw-Reads, gibt es selten Hinweise darauf, wohin ein bestimmtes Stück geht oder wie es ausgerichtet ist. Jedes Stück ist ähnlich mit den vier DNA-Basen kodiert, abgekürzt A, C, G und T. Das Genom könnte in ein großes Chromosom kompaktiert oder in viele gespalten werden. Es gibt auch keine Garantie dafür, dass einige der Raw-Reads keine Duplikate desselben Genombereichs sind, was bedeuten würde, dass weniger eindeutige Informationen vorhanden sind, als es auf den ersten Blick erscheint.

Allgemeines Wissen über die Genomstruktur ist von unschätzbarem Wert, wenn man mit dem Assemblierungsprozess beginnt. Obwohl sich die Genome zwischen den Arten deutlich unterscheiden, gibt es bestimmte Regeln, denen bestimmte Genomtypen folgen, und diese können angewendet werden, wenn ein anderes Genom desselben Typs zusammengefügt wird. Wenn beispielsweise ein bestimmter Organismus immer ein bestimmtes Muster in der Nähe hat, wo Gene gefunden werden, könnte man vernünftigerweise davon ausgehen, dass beim Zusammensetzen eines anderen ähnlichen Organismus ein solches Muster ein Gen in der Nähe signalisiert. Im größeren Maßstab haben viele Bakteriengenome ein kreisförmiges Chromosom, daher wäre es vernünftig zu erwarten, dass alle Rohdaten eines neuen Bakteriums irgendwie auf einem Chromosom zusammenpassen. Die Anwendung des allgemeinen genetischen Wissens auf diese Weise kann es einem Forscher ermöglichen, potenziell Hunderttausende von Daten zu verstehen.

Es gibt viele andere Methoden, die bei der Genommontage verwendet werden können, einschließlich rechnerischer Vorhersagen und manueller Vergleiche. Unabhängig von der Methode ist die Genommontage eine große Aufgabe, die oft zeitaufwendig und schwierig ist. Da es die Grundlage für viele zukünftige genetische Analysen eines Organismus ist, gibt es wenig Raum für Fehler.