En el twit del día 11 de Mayo de este mismo año proponíamos una cuestión a resolver como un problema de genética sencillamente complicado ó complicadamente sencillo . ( https://bit.ly/36eiJ3h ).

Vamos a explicar la solución con un ejemplo más sencillo, y posteriormente la aplicaremos al problema planteado. Vamos allá.

Pongamos que debemos resolver el nº de genomas diferentes de 4 pares de bases donde siempre existen 2 del par A-T y 2 del par G-C

1.- Comenzarenos por consideran las posibilidades de una sola de sus cadenas (la otra es complementaria y, por lo tanto viene dada con ella)

1.a-Empezamos por considerar  A-T y G-C como si fuesen 1 solo bloque cada uno.

Las posibles disposiciones de los bloques (1,2,3,4) para construir la secuencia completa, serían Permutaciones tomados de 2 (A-T) en 2(G-C) en 4 posibles posiciones=4!/2!2! = 4x3x2x1/2x1x2x1 = 6 posibles posiciones diferentes de ambos bloques que forman la cadena. En la tabla figuran esas 6 disposiciones posibles.

1.b-En cada una de las disposiciones anteriores cada bloque (A-T) y cada bloque (G-C), puede ser ocupado por A ó por T en su bloque correspondiente y lo mismo con G ó C.

 

-Veamos primero las posibles variantes de A por T. Serían variaciones con repetición (se puede repetir la A o la T) en 2 posiciones  de 2 elementos (A,T) = 22 = 4 posibles en las 2 posiciones ocupadas por el bloque A-T .

-Lo mismo para G y C: 4 posibles en las posiciones ocupadas por el bloque G-C. Veánse ambas en la tabla siguiente.

Ahora ya estamos es disposición de calcular todas las posibles secuencias diferentes que se podrían producir en una cadena de ADN.

Serían : 6 disposiciones por bloques x 4 posibles variantes del bloqueAT  en las disposiciones de A ó T, y X 4  variantes en las disposiciones de GC = 6x4x4= 96 secuencias diferentes en  una sola cadena.

Veamos las posibles secuencias resultantes de la disposición 1 del cuadro inicial.

 

 

 

 

 

 

 

 

 

 

Veamos una de las posibles disposiciones ( correpondiente a la disposición 5 de la 1ª de las tablas)

 

-Vemos que todas las secuencias son diferentes unas de otras y lo mismo con todas las restantes disposiciones no indicadas.

Existen 6 disposiciones diferentes de los bloques, cada una con 16 concretas y diferentes secuencias, lo que haría un total, como anteriormente dijimos de 96 secuencias distintas en una de las hebras del ADN con 4 nucleótidos, siendo 2 A ó 2 T y 2G ó 2 C.

2.- Hasta ahora hemos resuelto las 96 posibilidades de secuencia diferentes en UNA de las cadenas del ADN.  No obstante, estamos hablando del ADN (genoma) y éste está formado por 2 cadenas  de secuencias complementarias y  antiparalelas. Y vemos que: cualquiera de las 96 secuencias de una de las cadenas, tiene su complementaria antiparalela en la otra y su secuencia complementaria antiparalela está englobada en una de esas 96.

Por ejemplo: secuencia   ATCC (disposición 1) . Su complementaria , antiparalela (lectura al revés) de la misma es GGAT. ( una de las 16 posibles de la disposición 4) y ambas formarían el mismo ADN. Y, así, podemos encontrar complementeria a cualquiera de las 96. Por tanto, el nº de ADNs posibles con las condiciones indicadas ( de 4 con 2 de cada tipo) sería 96/2 = 48  ADNs o genomas diferentes.

3.- Hasta aquí, el cálculo parece resuelto (48 ADNs distintos), pero existe otro elemento que debemos tener en consideración: a saber, en ciertos ADNs basta con la misma secuencia en una y otra hebra para constituirlos. (No son necesarias 2 secuencias simples; basta con una, ya que la secuencia de la otra hebra es la misma)

Por ejemplo: secuencia  GATC, que en la otra hebra sería GATC; es decir, la misma. En este caso y otros similares bastaría con una sola secuencia para construir el ADN.

Se trata de calcular, por tanto, de las 96 secuencias posibles el nº de ellas que sólo por sí mismas construirían un ADN. ¿Cómo?

1º.- Fijémonos que los 2 primeros nucleótidos en una de las cadenas tienen forzosamente que ser uno del par A-T ó G-C y el segundo del par G-C ó A-T.  El 3º y 4º sólo pueden tener una única combinación que se correspondería: 3º con el complemetario del 2º y el 4º complementario del primero. Por tanto, veamos todas las posibles combinaciones de 2 nucleótidos donde deben entrar uno del par A-T (ó G-C) y otro del otro par G-C (ó A-T).

Procedemos como lo hemos realizado en el punto 1.

Primero. Permutaciones de los 2 bloques A-T y G-C en 2 posiciones= 2!/1! 1! = 2

Variaciones sin repetición en este caso de A-T = 2

Variaciones sin repetición , también en este caso de de G-C = 2

Total de secuencias de 2 donde haya 1 de A/T y otro de G/C = 2x2x2 = 8

Veamos cuáles son esos 8 (indicando además también el 3º y 4º de los nucleótidos) y la secuencia complementaria que es antiparalela.

2º.- De las 96 secuencias, existen 8 que sólo ellas hacen un mismo ADN. Nos quedan 88 secuencias que 2 a 2  construirían diferentes ADNs. Por tanto 88/2 + 8= 52 moléculas de  ADNs distintos que podemos construir con las premisas  establecidas en  el problema.

-Pregunta a los lectores: ¿ sería necesario realizar  los mismos cálculos si fuesen 3 de A-T y 3 de G-C para construir ADNs de 6 pares de bases?

 

 

Vamos ahora con la resolución de la actividad tal y como lo planteábamos en el post.

El problema planteado en la actividad propuesta es similar al resuelto. Veamos el resultado procediendo del mismo modo que anteriormente:

Variedad de Genomas de 16 pares de bases donde existen siempre 8 A-T y 8 G-C

Vamos a considerar inicialmente las combinaciones posibles de una de las hebras del ADN:

1.-Consideremos primero los 2 tipos de pares de bases como 2 bloques diferentes. Bloque 1 (A-T ó T-A) y Bloque 2 (G-C ó C-G). El primer escollo es como el de cuántas formas podemos colocar 8 objetos cualesquiera iguales y otros 8 objetos diferentes a los primeros pero iguales entre sí en 16 posiciones. Sería PERMUTACIONES de 8 y 8 en 16 posiones= 16! / 8! .8! = 12.870 posiciones diferentes de colocación de ambos bloques en las 16 posiciones.

2.- Cualquiera de las 12.870 posiciones pueden tener la A o la T en la posición ocupada por el bloque 1  de la secuencia y lo mismo sucedería con la G o la C.

– Consideremos éstas por separado : para el bloque A-T. Puede que la variación A ó T se produzca en una concreta de las posiciones posibles en 1 ocasión, en 2, en 3, 4, 5…….hasta en  las 8 (en una posición la A y en las 7 restantes la T; en 2 posiciones la A y en las 6 restantes la T, en 3 la A y en 5 la T,…….hasta en todas la A o en todas la T). Serían VARIACIONES CON REPETICIÓN  de 2 elementos (A ó T) en 8 posiciones. = 2 elevado a 8 = 256 posibles.

– Lo mismo sucedería en cada bloque 2 donde puede haber una G o una C en todas sus posibles posiciones de bloque. Es decir 256 variaciones distintas

 

-Como cualquiera de las 256 posiciones del Bloque 1 (bien A o bien T) es independiente de que las que adopte el Bloque 2 (con G o con C). Es decir, cada posición concreta de letras del Bloque 1 puede combinarse con cualquiera de las 256 posiciones de letras del bloque 2,….las secuencias de letras posibles total = 256 x 256 = 65.536  secuencias diferentes de letras.

3.- Ahora bien, cada secuencia concreta de las 65.536 posibles puede darse en las 12.870 posiciones de los bloques,…..El total de genomas en una fila de 8 y 8 será = 65.536 x 12.870 = 843.448.320 filas de letras distintas.

4.- Pero el ADN tiene 2 filas (2 hebras complementarias) y, por tanto siempre existirán el las 843.448.320 secuencias de una fila otra de ellas que sea su complementeria y formar el genoma completo. Y por lo tanto, habrá que dividir por 2 el nº de secuencias para el nº de genomas posibles de ese microorganismo. 843.448.320 / 2= 421.724.160 genomas.

Nota: El total de secuencias de ADN posibles, genomas posibles (sin tener en cuenta la limitación señalada: 8 y 8) sería aproximadamente = 2.147.483.648 . Cerca de 1.726 millones de genomas no podrían estar presentes en esa supuesta especie al no cumplir la condición ( 8 y 8) reseñada. Por otro lado, no deja de asombrarnos que un genoma tan simple y corto posea un número tan grande de secuencias diferentes.

5.-  En principio, pudiera parecer que , con  el planteamiento y la solución (421.724.160 genomas), el problema planteado está resuelto. Pero no es así. Son algunas más,  ya que existen secuencias iguales en ambas hebras entre todas las posibles (Palíndromos continuos) y por tanto, en estos casos, basta con una secuencia para construir el genoma (la secuencia de la otra hebra sería la misma) y por tanto no cabría dividir por 2 en todos los casos. Le dejo al lector los cálculos (similares a los planteados en el ejemplo) para dar con la cifra de ese tipo de secuencias y calcular el nº exacto de genomas diferentes que pudiera tener los individuos pertenecientes a esa especie.

Si alguien tiene el ánimo de calcularlo que envíe su solución a «gerardo(arroba)dnadidactic.com» . Será contestado.

Como siempre, esperamos que algún interesado lo resuelva y nos envíe la respuesta.