¿Qué es el ensamblaje del genoma?

El ensamblaje del genoma se refiere al proceso de tomar muchas piezas pequeñas de secuencia genética y fusionarlas en un todo coherente que representa el genoma completo de un organismo. Este es un enfoque importante del campo de la bioinformática, y existe una variedad de proyectos de genoma para este propósito. El ensamblaje del genoma se ha utilizado para comenzar a analizar los genomas de muchas especies, incluidos humanos, plantas, animales y bacterias.

El análisis de los genes de un organismo es un proceso largo y el ensamblaje del genoma es uno de los primeros pasos. Muchos otros métodos de análisis se basan en un ensamblaje exitoso y la identificación de genes no puede progresar sin él. Incluso antes de que se encuentren genes, un ensamblaje exitoso del genoma puede generar mucha información útil para un análisis posterior, incluido el tamaño del genoma, su estructura y su composición general.

El proceso de ensamblaje del genoma es como armar un rompecabezas sin tener una imagen o formas útiles como guía. Cuando se confrontan con las primeras piezas del genoma, llamadas lecturas sin procesar, rara vez hay indicios de hacia dónde va una pieza en particular, o incluso cómo está orientada. Cada pieza está codificada de manera similar con las cuatro bases de ADN, abreviadas A, C, G y T. El genoma podría compactarse en un cromosoma grande o dividirse en muchos. Tampoco hay garantía de que algunas de las lecturas sin procesar no sean duplicados de la misma área del genoma, lo que significaría que existe menos información única de la que parece a primera vista.

El conocimiento general de la estructura del genoma es invaluable al comenzar el proceso de ensamblaje. Aunque los genomas entre especies son marcadamente diferentes, existen ciertas reglas que siguen los tipos de genomas específicos, y estas se pueden aplicar al juntar otro genoma del mismo tipo. Por ejemplo, si un determinado tipo de organismo siempre tiene un patrón particular cerca de donde se encuentran los genes, uno podría asumir razonablemente, al ensamblar otro organismo similar a él, que encontrar dicho patrón indicaría un gen cercano. A mayor escala, muchos genomas bacterianos tienen un cromosoma circular, por lo que sería razonable anticipar que todas las lecturas en bruto de una nueva bacteria encajarían de alguna manera en un cromosoma. Aplicar el conocimiento genético general de esta manera puede permitir que un investigador comience a comprender potencialmente cientos de miles de datos.

Hay muchos otros métodos que se pueden utilizar en el ensamblaje del genoma, incluidas las predicciones computacionales y las comparaciones manuales. Independientemente del método, el ensamblaje del genoma es un trabajo extenso que, a menudo, requiere mucho tiempo y es difícil. Dado que es la base de muchos análisis genéticos futuros de un organismo, hay poco margen de error.