Proceso de predicción y conteo de genes

¡Proceso de predicción de genes y conteo!

Annonation es un proceso que identifica genes, sus secuencias reguladoras y posibles funciones. Annonation indica los genes no codificantes de proteínas, los genes codificadores de r RNA, t RNA y RNAs nucleares, elementos genéticos móviles y familias de secuencias repetitivas presentes en el genoma.

La tarea de la anulación comienza solo después de que se haya obtenido la secuencia del genoma. La predicción de genes es un problema importante para la biología computacional y existen varios logaritmos que pueden usarse para la predicción de genes utilizando genes identificados como un conjunto de datos de entrenamiento.

El conteo de genes se vuelve difícil a pesar de conocer la posición de la existencia de genes en un genoma. La presencia de genes superpuestos y variantes de empalme dificultan la tarea. Se vuelve difícil predecir qué partes del ADN deben considerarse como genes iguales o diferentes.

Fig.6.70. Un mapa de SNP

Muchos genes en los eucariotas tienen un patrón de exones (regiones codificantes) seguidos de intrones (regiones no codificantes). Debido a esto, los genes no están organizados como ORF continuos (marcos de lectura abiertos). Un ORF tiene una serie de codones que especifican una secuencia de aminoácidos.

Los segundos genes en los eucariotas suelen estar muy separados, por lo que tienen más posibilidades de localizar genes falsos. Pero las nuevas técnicas del software de escaneo ORF para genes eucarióticos hacen que el escaneo sea más eficiente. Ahora podemos contar los genes de un organismo (con algún error experimental).

Se dice que aproximadamente el 99.8% de los 3.200 millones de pares de bases entre dos humanos es el mismo y solo el 0.2% diferente. Por cada 500 nucleótidos, solo un nucleótido difiere entre dos individuos. Significa que la variación en unas pocas ubicaciones en la secuencia del ADN puede conducir a enfermedades graves y diferentes caracteres en los seres humanos.

Similitud del genoma, SNPs y Genómica Comparativa:

Como ya se dijo, el 99.8% de cada genoma humano es similar a cualquier otro genoma humano y 0.2% diferente. Esto significa que dos personas difieren solo en 6 millones de ubicaciones de las 3, 2 billones de ubicaciones.

Si estas ubicaciones tienen poco efecto, entonces dos seres humanos serán idénticos. Los humanos son más del 98% similares a los chimpancés. Por lo tanto, la diferencia en algunas ubicaciones en el ADN lleva a hacer que el individuo sea único Por cada 500-1000 nucleótidos, un nucleótido difiere entre dos individuos.

Las variaciones importantes en los genomas individuales son los polimorfismos de un solo nucleótido o SNP, que se han observado en las regiones codificantes y no codificantes del genoma. Los SNP son básicamente una alteración en una sola base, es decir, A, C, G o T, lo que conduce a variaciones en el ADN que conducen a la existencia de diferentes letras en tales posiciones. El tipo de nucleótido o base presente en una ubicación determinada en un cromosoma puede variar según las personas.

Se dice que el 90% de la variación de la secuencia en humanos se debe a la presencia de SNP. Por lo tanto, los SNP proporcionan un marcador molecular que está presente en alta densidad.

En la huella dactilar de ADN, en particular en las partes no codificadas del genoma, se explotan tales variaciones genéticas entre diferentes seres humanos.

Tales variaciones genéticas también son responsables de la gravedad de la enfermedad y la respuesta del cuerpo al tratamiento. Una única diferencia de base en el gen Apo E conduce a la enfermedad de Alzheimer y una deleción dentro de CCRS (gen receptor de quimiocinas) es responsable de la resistencia de HW y SIDA.

Los SNP se utilizan para mapear genes implicados en enfermedades humanas. Al usar los SNP como marcadores, se puede mapear cada gen en el genoma humano. Los SNP están localizados dentro del gen o pueden mostrar un vínculo estrecho.

Los datos de secuencia se almacenan en bases de datos y se analizan para conocer los SNP. Se han desarrollado chips de ADN y micromatrices para la identificación de SNP. Los médicos que utilizan muestras de ADN de pacientes pueden identificar el patrón del perfil de genotipo SNP. Por lo tanto, son capaces de decir la respuesta de los pacientes a un tipo específico de medicamento.

La rama de la medicina que estudia el efecto de la variación genética en la susceptibilidad de la enfermedad y la respuesta de la medicina se llama farmacogenómica.

Debido a que pocos SNP difieren en la frecuencia en diferentes poblaciones, el análisis de SNP puede usarse para el estudio de la genética de poblaciones.

Es interesante observar que los genomas del ratón y el hombre se parecen mucho entre sí (alrededor del 97.5%). El chimpancé y el genoma humano difieren solo en la proporción de 1 a 3%. Por lo tanto, se puede concluir que se debe al intercambio de ancestros comunes hace 100 millones de años y que no se han producido muchos cambios en el genoma.

De estas pequeñas diferencias genéticas surge la variedad humana, como las diferencias en la vista, el color del pelo, el tamaño del pie, etc. Algunos de los SNP están vinculados a poblaciones humanas específicas y proporcionan información sobre migraciones humanas que tuvieron lugar hace varios años y sobre un pasado evolutivo más lejano .