Razones y metodologías para la secuenciación del genoma

La secuenciación de genomas es sofisticada, compleja y requiere tecnología especializada. Se puede secuenciar un segmento de 500- 800 pb. Sin embargo, los genomas son muy grandes, por ejemplo, E. coli con 4, 2 x 10 6 pb y 3, 2 x 10 9 pb para humanos.

Por lo tanto para la secuenciación se necesitan pequeños segmentos. Tales segmentos se producen al romper el ADN genómico en pequeños fragmentos al azar. Tales fragmentos usualmente se superponen con otros fragmentos en sus extremos. Los fragmentos se clonan en un vector para generar una biblioteca genómica de organismos.

Razones para la secuenciación completa de un genoma:

(i) Proporciona información sobre la base del descubrimiento de genes y proporciona un inventario de genes.

(ii) Representa las posibles relaciones entre los genes.

(iii) La secuenciación de genomas proporciona un conjunto de herramientas para una mayor experimentación.

(iv) La información genética de un organismo está disponible a partir de la secuencia genética.

(v) La secuenciación genética completa de un organismo proporciona toda la información genética necesaria para formar un organismo.

Metodologías utilizadas para la secuenciación del genoma:

(i) Secuenciación dirigida de los contigs del Cromosoma Artificial Bacteriano (BAC):

Los cromosomas artificiales bacterianos son simplemente plásmidos diseñados para la clonación de segmentos muy largos (es decir, de 100.000 a 300.000 pb) de ADN. Estos vectores se utilizan para crear bibliotecas genómicas en las que el tamaño del inserto es de 80 a 100 kb. Los fragmentos de ADN de miles de pares de bases se clonan en el vector BAC.

La biblioteca genómica se analiza ubicando clones de restricción comunes llamados contigs. Los miembros de contig contienen algunas regiones superpuestas para permitir la determinación precisa de su ubicación en contig.

El objetivo final de los métodos de mapeo físico es recibir un contig completo para cada cromosoma del genoma. Los contigs mapeados se secuencian mediante la división de grandes fragmentos de ADN en pequeños segmentos. Cada clon del contig está secuenciado. La secuencia de nucleótidos se identifica sola por clonación hasta que se secuencia el genoma completo.

(ii) Secuenciación aleatoria de escopeta o enfoque ascendente:

Es posible clonar en un organismo cualquier gen deseado de otro organismo mediante disparo por disparo. Para todo este genoma del primer organismo se digiere con endonucleasa de restricción para producir una mezcla aleatoria de fragmentos.

Las bibliotecas aleatorias (shotgim) de ADN genómico se construyen en pequeños, es decir, 2.0 kb y en el medio, es decir, 10 kb vectores de plásmidos de inserción junto con la biblioteca de BAC de inserción grande de escopeta genómica (80-100 kb). Los fragmentos se insertan en el vector plasmídico y los plásmidos recombinantes se transforman en la célula huésped deseada.

En la secuenciación de shot gun, los clones seleccionados al azar se secuencian hasta que se analizan los clones en la biblioteca genómica. En otras palabras, podemos decir que, en la secuencia aleatoria, los cromosomas se dividen en secciones y luego la sección del ADN genómico se divide en millones de pequeños segmentos y todos los segmentos se secuencian de manera imparcial.

Se combinan áreas de ADN superpuesto que forman segmentos más grandes y más grandes de ADN genómico. La secuenciación del ADN se realiza en ambos extremos de las inserciones de los clones seleccionados al azar de las bibliotecas de plásmidos de inserción pequeñas y medianas para proporcionar al menos tres veces la cobertura del genoma.

Pequeños fragmentos de ADN se insertan en diferentes moléculas de plásmidos al azar. En el caso de las inserciones superpuestas, todas provienen de la misma ubicación genómica, pero de diferentes regiones desplazadas hacia la izquierda o hacia la derecha una con respecto a la otra.

Los fragmentos superpuestos se alinean ya sea en cuna o en una secuencia para la región en cuestión (método del arma de tiro). Los genomas procariotas tienen poco ADN respectivo y la secuenciación de las pistolas da buenos resultados. Los eucariotas llevan muchas secuencias repetidas.

Todo esto lleva a la confusión. Sin embargo, la superposición de fragmentos se explota en la fase de ensamblaje mediante el ejercicio computacional. El programa de computadora identifica las secuencias superpuestas y las une en una extensión continua. Este proceso se ha aplicado con éxito para secuenciar todas las secuencias del genoma microbiano publicadas por Celera Genomics.