Genómica: Estudios estructurales y funcionales de la genómica.

Genómica: Estudios estructurales y funcionales de la genómica!

El término genoma fue introducido por H. Winkler (1920) para denotar el conjunto completo de genes cromosómicos y cromosómicos extra presentes en un organismo, incluido un virus.

El término genómica acuñado por TH Roderick (1987) significa mapeo y secuenciación para analizar la estructura y organización de los genomas. Pero actualmente la genómica incluye la secuenciación de genomas, la determinación del conjunto completo de proteínas codificadas por un organismo y el funcionamiento de los genes y las rutas metabólicas en un organismo.

El estudio de la genómica se divide en los siguientes dos dominios:

1. La genómica estructural se ocupa de la determinación de la secuencia completa de genomas o el conjunto completo de proteínas producidas por un organismo. Los distintos pasos involucrados son: (i) construcción de mapas genéticos y físicos de alta resolución, (ii) secuenciación del genoma y (iii) determinación del conjunto completo de proteínas en un organismo. También incluye la determinación de las estructuras tridimensionales de las proteínas en cuestión.

2. La genómica funcional estudia el funcionamiento de los genes y las vías metabólicas, es decir, los patrones de expresión génica en los organismos.

Secuenciación de genomas:

La secuenciación de genomas es un proceso altamente sofisticado y técnicamente exigente. De una vez, se puede secuenciar un fragmento de 500-600 pb. En contraste, los genomas son extremadamente grandes, por ejemplo, 4.2 x 10 6 para E. coli y 3.2 x 10 9 pb para humanos. Por lo tanto, la secuencia de genoxina debe obtenerse en un número extremadamente grande de piezas pequeñas, estas piezas se ensamblan en una secuencia para el genoma.

Las piezas utilizadas para la secuenciación se generan al romper el ADN genómico en fragmentos en puntos aleatorios. Como resultado, la ubicación del fragmento en el genoma tiene que ser determinada experimentalmente. Todos los fragmentos obtenidos del ADN genómico de un organismo se clonan en un vector adecuado, esto genera una biblioteca genómica del organismo. Los dos enfoques para la secuenciación de genomas son: (a) secuenciación de clon por clon y (b) secuenciación de arma de fuego.

(a) Clonar por secuenciación de clones:

En este método, los fragmentos primero se alinean en contigs también llamados como secuenciación dirigida de contigs BAC. Un contig consiste en una serie de clones que contienen piezas superpuestas de ADN que convierten una región específica de un cromosoma o incluso el cromosoma completo. Por lo general, se construyen utilizando BAC (cromosoma bacteriano artificial) y clones cósmidos.

El enfoque general en la creación de contigs es identificar los clones que tienen segmentos de ADN adyacentes del cromosoma, por ejemplo, la marcha de los cromosomas, el salto de los cromosomas, etc. Así, los miembros de un contig deben contener la misma región superpuesta para permitir la determinación precisa de su ubicación -en el contingente. El objetivo final de los procedimientos de mapeo físico es obtener un contig completo para cada cromosoma del genoma.

Los fragmentos de ADN clonados de un contig pueden correlacionarse con ubicaciones a lo largo de un cromosoma obtenido a partir del enlace o mapeo citogenético. Esto se puede lograr identificando miembros del contig que contienen inserciones que tienen genes que ya han sido mapeados por enlaces o métodos citológicos. Esto permitiría la alineación de los otros miembros del contig a lo largo del cromosoma. Alternativamente, se puede usar RFLP (polimorfismo de longitud de fragmento de restricción) y otros marcadores de ADN para correlacionar las ubicaciones en un mapa de enlace con los miembros de un contig.

(b) Secuenciación de arma de fuego:

En este enfoque, los clones seleccionados al azar se secuencian hasta que se analizan todos los clones en la biblioteca genómica. El software Assembler organiza la información de la secuencia de nucleótidos así obtenida en una secuencia del genoma. Esta estrategia funciona muy bien con genomas procarióticos que tienen poco ADN repetitivo. Pero los genomas eucariotas tienen muchas secuencias repetidas que crean confusión en la alineación de la secuencia. Estos problemas se resuelven mediante el uso de enormes capacidades de computación, software especializado y evitando aquellas regiones que son ricas en ADN repetitivo (por ejemplo, regiones centroméricas y teloméricas).

Compilación de la secuencia del genoma:

Los proyectos de secuenciación del genoma requerían el desarrollo de tecnologías de alto rendimiento que generaran datos a una velocidad muy rápida. Esto requirió el uso de computadoras para manejar este flujo de información y ha dado a luz a una nueva disciplina llamada bioinformática. La bioinformática se ocupa del almacenamiento, análisis, interpretación y utilización de la información sobre sistemas biológicos (actividades como la compilación de secuencias genómicas, la identificación de genes, la asignación de funciones a los genes identificados, la preparación de bases de datos, etc.).

Para asegurar que la secuencia de nucleótidos de un genoma esté completa y sin errores, el genoma se secuenciará más de una vez. Una vez que el genoma de un organismo es secuenciado, compilado y corregido (corrigiendo los errores) comienza la siguiente etapa de la genómica, es decir, la anotación.

Predicción y conteo de genes:

Después de obtener una secuencia del genoma y verificar su exactitud, la siguiente tarea es encontrar todos los genes que codifican las proteínas. Este es el primer paso en la anotación. La anotación es un proceso que identifica los genes, sus secuencias reguladoras y su (s) función (es). También identifica genes no codificantes de proteínas, incluidos aquellos que codifican para r-RNA, t-RNA y pequeños RNA nucleares. Además, se identifican y caracterizan elementos genéticos móviles y familias de secuencias repetitivas.

La localización de los genes codificantes de proteínas se realiza mediante la inspección de la secuencia, utilizando un programa informático u ocular. Los genes codificantes de proteínas se identifican mediante marcos de lectura abierta (ORF). Un ORF tiene una serie de codones que especifican una secuencia de aminoácidos, comienza con un codón de iniciación (generalmente ATG) y termina con un codón de terminación (TAA) TAG o TGA). Los ORF se identifican generalmente por una computadora y son un método eficaz para los genomas bacterianos.

Los genes en los genomas eucariotas (incluido el genoma humano) tienen varias características que hacen que la búsqueda directa sea menos útil. En primer lugar, la mayoría de los genes eucariotas tienen un patrón de exones (regiones codificantes) alternados con intrones (regiones no codificantes). Como resultado, estos genes no están organizados como ORF continuos. En segundo lugar, los genes en humanos y otros eucariotas a menudo están muy separados, lo que aumenta las posibilidades de encontrar genes falsos. Pero las versiones más recientes del software de escaneo ORF para genomas eucariotas hacen que el escaneo sea más eficiente.

Después de analizar una secuencia genómica y predecir los genes, cada gen se examina uno por uno para identificar la función del producto genético codificado y se clasifica en grupos funcionales. Este análisis implica varios programas. Por ejemplo, uno puede buscar en bases de datos como Gene Bank, para encontrar genes similares aislados de otros organismos. Los ORF predichos pueden compararse con los de genes bacterianos conocidos y bien caracterizados. Finalmente, uno puede buscar tales secuencias de nucleótidos para los motivos de función que codifican los dominios de proteínas involucrados con funciones específicas.

Por lo tanto, el objetivo del análisis del genoma es determinar las funciones de todos los genes y comprender cómo estos genes interactúan en el desarrollo y la función del organismo.

Genómica funcional:

Puede definirse como la determinación de la función de todos los productos genéticos codificados por el genoma de un organismo. Incluye los siguientes parámetros: (1) cuándo y dónde se expresan los genes particulares (perfiles de expresión), (ii) las funciones de genes específicos mediante la mutación selectiva de los genes deseados, y (iii) las interacciones que tienen lugar entre las proteínas y entre las proteínas y otras moléculas. La genómica funcional intenta examinar todos los genes presentes en el genoma de una sola vez. Por lo tanto, las técnicas utilizadas en la genómica funcional permiten un análisis de alto rendimiento que permite una acumulación de datos muy rápida.

(i) Perfil de Expresión:

La determinación de los tipos / tejidos celulares en los que se expresa un gen, así como cuando se expresa el gen, se denomina perfil de expresión. El objetivo de la genómica funcional es estudiar el patrón de expresión de todos los genes presentes en el genoma al mismo tiempo; Esto se llama perfil de expresión global. Esto se puede hacer a nivel de ARN o a nivel de proteína. A nivel de ARN, se podría utilizar un muestreo de secuencia directa o matrices de ADN.

A nivel de la proteína, se puede utilizar una electroforesis bidimensional, seguida de espectrometría de masas o matrices de proteínas. El perfil de expresión global proporciona información sobre fenómenos biológicos complejos, incluida la diferenciación, la respuesta al estrés, el inicio de una enfermedad, etc. También proporciona una nueva forma de definir los fenotipos celulares.

(ii) Determinación de la función génica:

Un aspecto importante de la genómica funcional es determinar la función de genes específicos / secuencias anónimas. Una forma potente de lograrlo es clonar el gen, mutarlo in vitro y reintroducir el gen mutado en el organismo huésped y analizar su efecto. El genoma bajo bibliotecas mutantes se ha desarrollado en varios organismos modelo como bacterias, levaduras, plantas y mamíferos. Esto se refiere a veces como genómica mutacional. Dicha biblioteca se puede generar de una de las siguientes tres formas:

(a) Mutación sistemática de cada gen único en un momento que generará un banco de cepas mutantes específicas.

(b) En el enfoque aleatorio, los genes se mutan indiscriminadamente. Las mutaciones individuales se caracterizan y se catalogan.

(c) En este enfoque, se usa un grupo de técnicas para prevenir la expresión de grupos de genes específicos.

(iii) Interacciones de proteínas:

La función génica refleja el comportamiento de las proteínas codificadas por ellas. Este comportamiento puede verse como una serie de interacciones entre varias proteínas y entre proteínas y otras moléculas. Las interacciones de proteínas se estudian utilizando técnicas de alto rendimiento. Un número de métodos de mapeo de interacción de proteínas basados ​​en bibliotecas permite que cientos o miles de proteínas se analicen a la vez. Estas interacciones pueden ser analizadas in vitro o in vivo. Los datos de interacción de proteínas de varias fuentes se asimilan en las bases de datos.