¿Qué es la secuenciación de escopeta?

La secuenciación de escopeta es un método de secuenciación de ADN mediante el cual un tramo largo de ADN se rompe físicamente en pequeños fragmentos (aproximadamente 2,000 pares de bases) que se clonan, secuencian y ensamblan mediante análisis informático. Fue desarrollado y hecho famoso por Craig Venter de Celera Corporation. Venter desarrolló la técnica en 1996 mientras trabajaba en el Instituto de Investigación del Genoma.

Venter fundó Celera en 1998 con la misión de secuenciar el genoma humano en tres años. Este objetivo estaba en competencia directa con el Proyecto Genoma Humano ya operativo, un consorcio de universidades que trabajan juntas para secuenciar el genoma humano utilizando una estrategia más antigua llamada secuenciación basada en mapas o BAC-to-BAC. Este método implicó primero dividir el genoma en 150,000 piezas de pares de bases llamadas BAC, ensamblar las BAC en orden y luego secuenciar cada BAC en detalle.

La secuenciación rápida del genoma completo evita la creación y el mapeo de BAC y comienza directamente con la secuenciación del ADN. El proceso comienza con la adquisición de una muestra de ADN de alto peso molecular del organismo de interés y rompiéndola físicamente en pequeños pedazos pasándola a través de una jeringa de calibre estrecho o sonicándola, una forma de romper la muestra usando ondas sonoras. El cizallamiento es un proceso aleatorio, por lo que las secuencias de los fragmentos tendrán cierta superposición entre ellos. El cizallamiento no crea específicamente los fragmentos de 2,000 pares de bases necesarios para la secuenciación, sino que los fragmentos del tamaño deseado deben purificarse de la mezcla.

El siguiente paso es unir los fragmentos de ADN con el ADN portador llamado vector. Este proceso se conoce como clonación y crea una biblioteca de secuenciación a partir de la cual se creará la secuencia de un genoma completo. Se determina la secuencia de cada clon en la biblioteca y se usa el análisis informático para encontrar secuencias superpuestas o continuas en cada fragmento. El ensamblaje de las superposiciones crea un «contig», que es un tramo largo y continuo de secuencia de ADN.

La clonación de escopeta generalmente dará como resultado algunos espacios entre contigs porque algunas secuencias faltan en la biblioteca por casualidad. Los vacíos se pueden llenar creando una nueva biblioteca o usando secuencias conocidas para extenderse hacia afuera desde el contig. Debido a que la secuenciación rápida de los fragmentos de ADN se secuencia al azar, muchos fragmentos se secuencian más de una vez, lo que crea una mayor certeza de que la secuencia es correcta que si cada fragmento se hubiera secuenciado una o dos veces.

El genoma humano fue secuenciado tanto por el Proyecto Genoma Humano usando secuenciación basada en mapas como por Celera usando secuenciación escopeta. La secuenciación por escopeta es ahora el método preferido para otros tipos de secuenciación del genoma. De esta manera se han secuenciado los genomas completos de muchos organismos, como la planta Arabidopsis thaliana, el arroz, la vaca, el perro, el pollo, el chimpancé, la rata, el ratón, el pez globo y muchos microorganismos.