Tag Archives: Matemáticas y ADN

11
diciembre

Matemática y ADN (7c)

 

Genética de Poblaciones (3)

Veamos ahora una aplicación práctica sobre genética de poblaciones.  Hemos consultado en Internet los porcentajes de los grupos sanguíneos en España del sistema ABO. Internet (wilkipedia) nos ha proporcionado los resultados siguientes:

Fenotipo Grupo A = 42%; F. Grupo B=10%; F. Grupo AB=3% y F.  Grupo 0 = 45%

En frecuencias decimales: A= 0,42; B=0,10, AB = 0,03 y 0 = 0,45

Los genes alelos involucrados en estos genotipos son: Alelo A = frecuencia “a”; alelo B= frecuencia “b” y alelo 0 = frecuencia “c”. Según lo indicado en los artículos del post anteriores, sabemos que las frecuencias de los diferentes genotipos- supuesto que la población está en equilibrio-  se corresponden con el desarrollo del polinomio (a + b + c)2 . Su desarrollo es= a2 + b2 + c2 + 2.a.b + 2 a. c. + a. b. c; y su correspondencia por cada genotipo sería:

Genotipo AA = a2

Genotipo AO= 2 x a x c

Genotipo AB = 2 x a x b

Genotipo BB = b2

Genotipo BO = 2 x b x c

Genotipo OO = c2

Como conocemos que los alelos A y B son codominantes y ambos son dominantes sobre el alelo O,  Los fenotipos de grupo A comprenderían los genotipos AA y AO y en frecuencias=a2 +2.a.c; los fenotipos del grupo B comprenderían los genotipos BB y BO y en frecuencias = b2 + 2.b.c; los fenotipos del grupo AB sólo comprenderían al genotipo AB y en frecuencias 2.a.b ; y  los fenotipos del grupo O sólo comprenderían el genotipo OO y en frecuencias c2.

Para conocer las frecuencias génicas (supuesta la población en equilibrio) nos apoyamos inicialmente en el dato del fenotipo del grupo O, cuyo genotipo es OO y su frecuencia c2.   Asi “c”= raiz cuadrada de 0,45  = 0,6708.

Conociendo “c” podemos calcular “a”, sabiendo que 0,42 = a2 + 2. a. 0,6708. Tenemos una ecuación de segundo grado: a2 + 1,3416.a – 0,42 = 0 y, al resolverla tenemos para “a” 2 valores posibles:  + 0,2619 y -1,60 (descartamos el -1,60 por ser negativo y por superar el 1), así que el valor de “a” = 0,2619.

El valor de “b” lo sacamos de  a + b + c = 1; b = 1 –(a+c) = 1- (0,2619 + 0,6708) = 0,0673.

Si ya tenemos las frecuencias génicas decimales de los 3 alelos, solo falta comprobar si  se cumplen las frecuencias fenotípicas esperadas con las frecuencias reales que nos ha proporcionado internet para conocer el equilibrio poblacional español respecto a los grupos sanguíneos del sistema ABO.

(*) la suma debería ser igual a 1. No obstante se aproxima mucho y, esto es debido a no contar los decimales a partir de la cien milésima y siguientes en cada uno de los cálculos anteriores.

(**) Las diferencias entre las frecuencias genotípicas reales y esperadas en todos los casos son muy escasas y no son significativas(+) (hay que tener en cuenta que nos encontramos en un planteamiento estadístico). Podemos decir, por tanto, que la población española está en equilibrio genético respecto al sistema sanguíneo AB0.

(+) existen formas estadísticas de comprobar si esas desviaciones respecto al valor real son debidas a la falta de equilibrio poblacional o simplemente lo son debido al azar estadístico. En este caso resultan innecesarios puesto que la desviación es muy pequeña.

También –una vez calculadas las frecuencias génicas- podemos indicar la frecuencia de los genotipos homozigóticos y heterozigóticos para los diferentes genotipos

Genotipo AA–  Fenotipo A = a2 = 0,26192 = 0,06859161 = 6,8%, redondeando 7%

Genotipo A0– Fenotipo A = 2.a.c = 2x 0,2619 x 0,6708 = 0,35136504 = 35,13%, redondeo 35%

Genotipo BB – Fenotipo B = b2 = 0,06732 = 0,004529 = 0,45%

Genotipo B0 –Fenotipo B = 2.b.c = 2x 0,06723 x 0,6708 = 0,09019 = 9,02%

Genotipo AB –Fenotipo AB = 2.a.b = 2 x 0,2619 x 0,06723 = 0,03521 = 3,5%

Genotipo 00 –Fenotipo 0 = c2 = 0,67082 = 0,4499 = 45%

El genotipo más poco frecuente en la población española es el homozigótico del grupo B: aproximadamente 1 de cada doscientas personas (0,45 de cada 100).

 

Para entretenerse:

Os animamos a realizar un cálculo similar al anterior respecto a otro factor sanguíneo, el factor rH, que, como sabemos,  es un factor genético independiente del anterior y más sencillo ya que sólo está determinado por 2 alelos: rH+ y rH- , siendo el positivo dominante sobre el negativo.

Los datos, en la población española son los siguientes (según datos de la misma publicación anterior)

Fenotipo rH+  = 80,5%

Fenotipo rH- = 19,5 %

¿Podrías , además, calcular qué porcentaje de rH positivos y negativos le corresponde a cada uno de los fenotipos del sistema ABO y a cada uno de los genotipos?

 

Posted in Artículos, Para estudiantes BACH, Para estudiantes ESO | Tagged , | Leave a comment
7
noviembre

Matemáticas y ADN (5)

Genes, alelos y Genotipos

En esta ocasión vamos a intentar buscar una relación matemática entre las diferentes variantes (alelos) que puede presentar un gen  y el número de combinaciones binarias (genotipos) entre ellos en las especies diploides.

Empecemos, como siempre, por el caso más sencillo: 2 variantes o alelos para el mismo gen que, como siempre, ocuparán el mismo locus cromosómico.

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 y A2

 

(2)

1- A1 A1

2- A2 A2

1- A1 A2

(*)

2 homozigóticos

1 heterozigóticos

2 posibles 1 posible 3 posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 y A3

 

 

 

(3)

1-A1 A1

2- A2 A2

3- A3 A3

1-A1 A2

2- A1 A3

3- A2 A3

(*)

3 homozigóticos

3 heterozigóticos

3 posibles 3 posibles 6 posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 y A4

 

 

 

 

 

 

(4)

1-A1 A1

2- A2 A2

3- A3 A3

4- A4 A4

1-A1 A2

2-A1 A3

3-A1 A4

4-A2 A3

5-A2 A4

6-A3 A4

(*)

4 homozigóticos

6 heterozigóticos

4 posibles  6 posibles 10  posibles

 

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 , A4 y A5

 

 

 

 

 

 

 

 

 

 

(5)

A1 A1

A2 A2

A3 A3

A4 A4

A5 A5

A1 A2

A1 A3

A1 A4

A1 A5

A2 A3

A2 A4

A2 A5

A3 A4

A3 A5

A4 A5

(*)

5 homozigóticos

10 heterozigóticos

5  posibles  10  posibles 15  posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 , A4 , A5 y  A6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(6)

1-A1 A1

2- A2 A2

3- A3 A3

4- A4 A4

5- A5 A5

6- A6 A6

1-A1 A2

2- A1 A3

3- A1 A4

4- A1 A5

5- A1 A6

6- A2 A3

7- A2 A4

8- A2 A5

9- A2 A6

10- A3 A4

11- A3 A5

12- A3 A5

13- A4 A5

14- A4 A6

15- A5 A6

(*)

6 homozigóticos

15 heterozigóticos

6  posibles  15  posibles 21  posibles

 

(*) La combinación A1 A2 es la misma que A2A1 y por ello no se consideran como 2 combinaciones diferentes; y lo mismo A1 A3=A3 A1; A2 A4 = A4 A2,….. y así sucesivamente.

Por tanto:

Nº alelos Nº de Homozigotos Nº Heterozigotos Total genotipos
2 2 1 3
3 3 3 6
4 4 6 10
5 5 10 15
6 6 15 21

 

Conclusiones:

1.-  Parece seguro que el nº de homozigóticos coincide con el nº de alelos; si llamamos “n “ al nº de variantes alélicas (variable principal), el nº de genotipos homozigóticos para cualquier nº “n” será igual a “n”.

2.- Con el nº de heterozigóticos, en función de “n” parece que no es tan simple encontrar una relación: De 2, sólo 1; de 3 salen 3, de 4 salen 6, de 5 salen 10, de 6 salen 15, de “n”….saldrían?.

Podemos probar con el total de genotipos para ver si es más fácil la relación y luego descontar los homozigotos: de 2 salen 3; de 3 salen 6; de 4 salen 10; de 5 salen 15 de 6 salen 21, de “n”… parece que n . (n+1)/2 nos cuadra con cualquiera de los resultados obtenidos. 2×3/2 =3;  3×4/2=6;  4 x5/2 =10;  5×6/2 =15;  6×7/2=21.

Por lo que parece esta fórmula funciona, así que para el cálculo de los heterozigóticos = nºTotal – nº homozigóticos = n.(n+1)/2 –n  = (n. (n+1)-2n)/2  =  (n(n+1-2))/2  =  n(n-1)/2

Veamos si cumple: para 2, 2×1/2 =1; para 3, 3×2/2 =3; para 4,  4×3/2=6; para 5,  5×4/2 =10; para 6, 6×5/2 =15,… Vemos que se cumple también la fórmula en todos los casos.

Nota: Otra forma de calcular el nº total de genotipos que da resultado es  N= n +(n-1)+ (n-2)+ (n-3) +…….(n-(n-1)). Así para 5 alelos N= 5+4+3+2+1 = 15 genotipos.

Nota: para los que conocen combinatoria matemática, los heterozigóticos serían combinaciones (donde el orden no importa)  sin repetición de “n” elementos tomados de 2 en 2 = = n!/2! (n-2)! =n. (n-1).(n-2). (n-3)…/2. (n-2). (n-3)…= n (n-1)/2

Así para 2 alelos = 2!/2!(2-2)! = 2/ 2 =1  , recuérdese que 0!=1

Así para 3 alelos =3!/2! (3-2)! = 6/2 = 3

Así para 4 alelos = 4!/2! (4-2)! = 24/4= 6

Así para 5 alelos = 5!/2!(5-2)! = 120/12 =10

Lo mismo para el resto de alelos.

Por tanto y generalizando:

Nº alelos Nº de Homozigotos Nº Heterozigotos Total
n n n.(n-1)/2 n.(n+1)/2

 

Cualquier gen que presente “n” variantes (alelos), el nº de genotipos posibles será n. (n+1)/ 2, de los cuales “n” será el nº de genotipos homozigóticos y,   n. (n-1)/2 corresponderá con el nº de genotipos heterozigóticos posibles.

Los genes que presentan más de 2 alelos posibles se denominan genes con alelomorfismo múltiple.

Un ejemplo sencillo  de genes con alelomorfismo múltiple son los que determinan el grupo sanguíneo humano del Sistema ABO, siendo 3 los alelos posibles (A, B y O). Los genotipos homozigóticos serán 3: AA, BB y OO y los genotipos heterozigóticos, otros 3: AB, AO, BO. En este caso la diferente potencia de expresión de los diferentes alelos A=B>O, implica que los fenotipos resultantes sean A, B, O,  AB, A y B respectivamente. Sólo 4 fenotipos para 6 genotipos posibles. Como se ve, los fenotipos posibles dependerán de la fuerza expresiva que posean las diferentes variantes (alelos) del  gen en cuestión.

 

Otro caso humano de alelomorfismo múltiple es el caso de los genes STR. Los genes STR son genes situados en diferentes posiciones de la molécula del ADN nuclear humano que se caracterizan por presentar una secuencia corta de bases (Short=Corta) (la misma en cada gen STR) repetida a continuación una de otra  en un número de repeticiones bastante variado (Tandem Repeat= repetidas en tándem). Por ejemplo……..ACTG ACTG ACTG ACTG ACTG ACTG…… Esta secuencia se repite en el mismo locus o posición de la molécula de ADN de todos las personas y el nº de repeticiones puede variar entre, por ejemplo 6 a 18 veces. Por tanto, los alelos  o variantes posibles serán 6 repeticiones, 7, repeticiones, 8 repeticiones, nueve repeticiones,…….. y así hasta 18 repeticiones. Es decir 13 alelos diferentes. Las personas tendrán un genotipo concreto de entre los 13×14/2= 91 genotipos posibles. Así, por ejemplo un individuo será (11, 11) ó (8,18) ó ( 9, 16 ) ó cualquier combinación de 2 nºs de repeticiones entre el 6 y el 18. Se pueden analizar al detectar y diferenciarlos  por su longitud en electroforesis.

Estos genotipos, que se sepa, no determinan ningún fenotipo ni externo ni interno de cada individuo (aparentemente no tienen función fisiológica ninguna), pero se pueden analizar y diferenciar individuos por ellos. Así, analizando los 91 genotipos posibles para ese gen STR diferenciamos a 1 individuo entre 91 posibles.

El análisis de uno sólo de esos genotipos nos diferencia a una persona entre 91, pero  como en el ADN hay más lugares con repeticiones STR (con otra secuencia y con igual o superior nº de repeticiones en tándem y situados en diferentes cromosomas), la combinación de varios de esos locus nos amplía considerablemente y en progresión geométrica la diferenciación individual.

Por ejemplo:

Gen o Locus STR Secuencia repetida Localizado en el cromosoma…. Nº de variantes o alelos Diferenciación de Genotipos Diferenciación conjunta

(*)

STR 1 ACTG 2 13 13×14/2= 91;

1 de 91

 

1 de 91

STR 2 TATGC 4 9 9 x10/2 = 45

1 de 45

91 x 45 = 4.095

1 de 4.095

STR 3 GCTACC 7 18 18×19/2= 171

 

1 de 171

4.095 x 171 =

700.245

1 de 700.245

STR 4 TTAAG 13 14 14 x15/2 =105

 

1 de 105

700.245 x 105 =73.525.725

1 entre 7,5 millones

STR 5 CCGAT 18 20 20×21/2 = 210

 

1 de 210

73.525.725 x 210 = 15.440.402.250

1 entre 15,4 miles de millones

(*) Al ser cada locus STR independiente de cualquier otro, cada uno de ellos admite cualquier combinación del otro, por ello se multiplican las combinaciones al considerarlas conjuntamente.

Nota: los alelos STR del ejemplo son inventados. En realidad son muy similares y valen como ejemplo.

Analizando sólo 5 genes STR del genoma humano (siempre que se localicen en cromosomas diferentes para que sean genes independientes), podemos diferenciar por el genotipo conjunto de los 5 genes  a 1 persona entre 15, 4 miles de millones de personas.

El perfil genético que usa la policía en sus análisis de ADN (tan utilizado en cualquier delito) analiza nada menos que entre 13 y 16  de esos locus STR y así puede afirmar categóricamente –con una certeza muy próxima al 100%- de qué individuo se trata (siempre que tenga archivado el perfil genético de esa persona o que al sospechoso se le haga un análisis de su perfil genético y concuerde o no para confirmar su culpabilidad o inocencia).

El hecho de no poder llegar a una certeza absoluta del 100% se debe principalmente al hecho de que existen alelos y genotipos más frecuentes que otros en las poblaciones para los diferentes genes STR y no del modo que nosotros lo hemos considerado, con igualdad de posibilidades para todos ellos. Con todo, la coincidencia proporciona una confirmación del 99,99% o incluso mayor.

Estos análisis de perfil genético nos  sirven, además, para determinar parentescos entre personas. De los 2 alelos que una persona posee en cualquiera de sus genes STR, uno de ellos lo ha recibido de su padre biológico y el otro de su madre. Por tanto, el padre o supuesto padre biológico tiene que  tener en sus dos alelos de cada uno de los genes STR, uno de los 2 que posee el hijo o supuesto hijo; y lo mismo con la madre o supuesta madre.

Ver artículos en nuestro blog: http://bit.ly/235x0oa .  http://bit.ly/2opCTQF . Y el documento de perfiles genéticos: http://bit.ly/2x7fs2E

En las demandas judiciales de paternidad –tan de actualidad en estos días con respecto a personas famosas-  estas pruebas de comparación de perfiles genéticos constituyen una prueba fundamental. También para otro grado de parentesco pero no con tanta fiabilidad.

Posted in alelos STR, Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment
13
octubre

Matemáticas y ADN (4)

 

Palíndromos y Re-palíndromos (4)

En el artículo anterior relacionamos las posibles secuencias de una de las hebras del ADN o del ARN (En este caso la complementariedad es A-U y G-C) con las posibles secuencias palíndromo (continuos o interrumpidos) que se podían presentar en ellas.

También podemos buscar las razones matemáticas para relacionar los palíndromos con los diferentes ADNs. Para ello tendremos que tener en cuenta que sólo los palíndromos continuos forman la misma molécula de ADN, mientras que los discontinuos no; ya que tienen parte NP y, por definición, no pueden ser idénticas en esa zona en ambas cadenas.

Conclusión :

La relación entre secuencias palíndromo (de cualquier tipo) y el nº de ADNs diferentes de ese mismo nº de unidades es de 1/2 en ADNs de nº impar y un poco menor en ADNs de nº par de unidades, aunque muy próximo a esa misma cantidad (1/2) .  Esto significa que si escribimos la secuencia de un ADN al azar, existe  1/2 de probabilidad de que contenga algún tipo de palíndromo.

Las secuencias palíndromo desempeñan diferentes funciones biológicas.

Muchas de ellas sirven de señalización (identifican puntos de interés en el ADN para, por ejemplo, localizar secuencias,  determinar lugares del ADN donde se unen determinados factores de transcripción o también en determinadas secuencias promotoras y terminadoras del mismo proceso,  lugares para escindir el ADN por enzimas de restricción o endonucleasas (tipo II) o también lugares  donde el ADN se “metila” para desactivar genes) o también como regiones transcribibles para que el ARN resultante pueda formar horquillas de apareamiento como en el caso de los ARN ribosómicos y transferente y los ARNmic transcritos primarios que originan los ARN-i (ARN de interferencia) . Las secuencias palíndromo también se encuentran presentes en los sistemas genómicos bacterianos CRISPR: CRI-SPR; las iniciales SPR (Short Palindromic Repeats = repeticiones palindrómicas cortas) que actúan de encaje a las secuencias espaciadoras, responsables directas de la inmunidad adquirida bacteriana, y  que es utilizado en la actualidad para la edición génica con múltiples aplicaciones.

 Los palíndromos en el ARN : RE-PALÍNDROMOS

Es frecuente observar que algunos tipos de moléculas de ARN (ejemplo: ARNt y ARNr) no tienen una estructura lineal, sino que en diferentes lugares presentan estructura doble (partes diferentes  de la cadena se han hibridado) presentando una estructura compleja tridimensional variada en su forma, incluso ARNs de estructura circular. Esto es debido a que las secuencias que hibridan son palíndromicas (por complementarias) y a su vez, en el intermedio de las mismas puede haber otras secuencias también palindrómicas produciéndose una primera y una segunda,.. hibridación en ellas. Casos que podríamos denominar re-palíndromos. En la imágenes  inferiores puede observarse la estructura lineal (rodeado de elipses en rojo las regiones palíndromas) de uno de los ARNt  y debajo su estructura tridimensional.

Su secuencia Re-palindrómica: 5´-P1-NP1-P2-NP2 (bucle izqdo.)-P´2-NP-P3-NP3( bucle anticodon)-P´3-NP4 (semibucle derecho)-P4-NP5 (bucle derecho)-P´4P´1-NP7-3´.

LOS PALINDOMOS EN EL ADN- Ver artículos Blog DNA didactic : Palindromos de ADN 1, 2 y 3 (http://www.dnadidactic.com/blog/secuencias-del-adn-palindromos-1/  http://www.dnadidactic.com/blog/secuencias-de-adn-palindromos-2-2/  http://www.dnadidactic.com/blog/secuencias-de-adn-palindromos-3/ )

 

 

 

Posted in Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment
10
octubre

Matemáticas y ADN (3)

 

También hay secuencias que forman los palindromos interrumpidos(3)

Las secuencias palindrómicas de los artículos anteriores son palíndromos continuos (o también llamados ininterrumpidos), pero también existen otras secuencias similares denominadas palíndromos interrumpidos. Son secuencias palíndromo que justo en medio se ha introducido 1, 2, 3, 4,….unidades que no son palindrómicas. (En lo sucesivo, mientras no indiquemos lo  contrario, hablaremos de secuencias y no haremos referencia a ADNs diferentes).

Ejemplo: ATCGT GGT ACGAT . Las unidades subrayadas forman un palíndromo,  interrumpido por una secuencia –en este caso de 3 unidades-que no igualaría la secuencia de la otra hebra en ese tramo, mientras que las adyacentes subrayadas sí.

Estas secuencias hacen que tanto los tramos de unidades pares como las impares puedan formar palíndromos interrumpidos.

Podemos igualmente aproximarnos a calcular su número, en función del número total de unidades de la secuencia.

En general podemos denominar a estos palíndromos interrumpidos del siguiente modo: P(n)-NP(m)-P´(n); siendo P(n) y P´(n) los tramos palíndomo de “n” (nº de unidades) y NP(m) el tramo no palíndromo de “m” (nº de unidades de ese tramo).

¿Podemos calcular el nº de secuencias posibles por ejemplo del  P(6)- NP (5)-P´(6); o sea un tramo de 17(6+5+6) unidades?. Pongámonos a ello partiendo de casos sencillos y busquemos, como en artículos  anteriores, una fórmula general que nos lo indique.

 

1.-Palíndromo interrumpido de 3 unidades

En este caso no pueden existir secuencias palíndromo continuos ya que un nº impar de unidades lo impide y sólo cabe el caso indicado a continuación.

1.a.- (P (1) – NP (1) – P´(1))

P: secuencia que forma el palíndromo/ NP: secuencia que no lo forma

P: puede tener 41 combinaciones posibles  que lo harían palíndromo en posiciones P y P´; respectivamente(A y T; T y A; Gy C y Cy G), cada una de ellas junto con las 4 posibles de NP (A,T,G,C), lo que haría un total de 41 x 41 = 42

 

 2.- Palíndromos de 4 unidades

2 casos posibles de palíndromo.

2.a.-Caso 1 (P (2)- NP (0)- P´(2)- Palíndromo continuo

En el continuo, los 2 primeros nucleótidos determinan los 2 siguientes para que se cumpliera la condición de palíndromo. Por tanto 42 combinaciones posible x 1 sola posibilidad en la 2ª parte del palíndromo = 42 x 1 = 42

2.b.- Caso 2 ( P (1)- NP(2) –P´(1))

Para el palíndromo interrumpido de 4 bases sólo cabe la posibilidad dibujada abajo. Su cálculo sería: 41 para constituir palíndromo (P y P´), multiplicado por aquellas secuencias posibles NP de 2 bases; éstas últimas serían 42 posibles de 2 unidadades  – 41 que las harían palíndromo continuo al añadir una unidad más al palíndromo (y estamos contemplando el caso  que no constituyan palíndromo). Por tanto, en total:  41 (42 – 41 ) = 43 – 42

2.c.-

La Suma total de secuencias de 4 bases que formarían un palíndromo (continuo o interrumpido) = 42 + (43 – 42) = 42 + 43 – 42 = 43

 

3.- Palíndromos interrumpidos de 5 unidades

2 casos posibles de palíndromo (ambos interrumpidos). No existe, en este caso la posibilidad de palíndromos continuos,  al ser una secuencia Impar.

3.a.- Caso 1:  (P (2)- NP(1)- P´(2))

En este primer caso se calcularía 42 (nº de P ) x 41 (posibilidades de NP: los 4 nucleótidos) = 43 posibilidades de secuencias diferentes

3.b.- Caso 2; (P (1)- NP(3)-P´(1))

En esta segunda posibilidad: 41 secuencia P x aquellas secuencias NP de 3 unidades que se calcularía 43 secuencias posibles, menos aquellas que las convirtiesen en palíndromo (que serían las indicadas para en apartado 1, o sea 42); por tanto, 41 ( 43 – 42) = 44 -43

3.c.- Si sumamos ambos casos 43 + (44 – 43) = 44 posibilidades de secuencias palíndromo diferentes

4.- Palíndromos de 6 unidades

Casos posibles:

4.a.- Caso 1:  (P(3)- NP(0)- P´(3)) – Palíndromo continuo

Palíndromo continuo donde los 3 primeros nucleótidos (43 combinaciones posibles) determinan una  y sólo una posibilidad en los 3 últimos: 43 X 1 = 43

4.b.- Caso 2:  (P(1)-NP(4)-P´(1))

Palíndromo interrumpido de 1 base en cada extremo

si le añaden una : 41 ( P y P´) x aquellas de 4 nucleótidos no palíndromos (44 – 43: las combinaciones posibles (44) menos las calculadas en el apartado 2c, que sería el nº de secuencias palíndromo posibles de 4 nucleótidos o pares de nucleótidos ): 41 (44 – 43) = 45 – 44

4.c.- Caso 3:  (P(2)-NP(2)-P´(2))

Palíndromo interrumpido de 2 bases en cada extremo:

Secuencias P= 42 multiplicado por aquellas combinaciones de 2 NP: (42 – 41: las posibles menos las indicadas en el razonamiento del  apartado 2b). Por tanto 42(42 – 41)= 44 – 43

4.d.-

La suma de todas las combinaciones palíndrómicas posibles sería: 43 (continuo) + (45– 44) añade 1, + (44 – 43) añade 2 = 43 + 45 – 44 + 44– 43= 45 secuencias palíndromos posibles

 

5.- Palíndromos interrumpidos  de 7 unidades

5.a.-Caso 1:  (P(1)-NP(5)-P´(1))

palíndromo interrumpido de 2 bases (uno en cada extremo) y 5 NP. Multiplicar el nº de unas por el nº de las otras

-Secuencias que forman el palíndromo: 41

-Secuencias NP (de 5 bases): 45 posibles menos aquellas que hicieran de esas 5 bases algún palíndromo; que como hemos calculado en el apartado (3) son 44.

Por tanto= 45– 44

-Total: 41 (45 – 44) = 46 – 45

5.b.-Caso 2:  (P(2)-NP(3)-P´(2))

palíndromo interrumpido que añade 4 bases (2 en cada extremo) y 3NP. Multiplicar el nº de unas por el nº de las otras.

-Secuencias posibles palíndromos: 42

-Secuencias NP( de 3 bases): las posibles 43 – aquellas que la convertirían a la secuencia NP en palíndromo, que como hemos calculado en el apartado (1) son 42. En total 43 – 42

-Total secuencias: 42 (43 – 42)= 45 – 44

5.c.- Caso 3:  (P(3)-NP(1)-P´(3))

Palíndromo interrumpido que añade 6 bases (3 en cada extremo) y 1 NP

Secuencias posibles que formarían el palíndromo;  43, multiplicadas por los posibles NP (los 4 nucleótidos) que en este caso es 41

Por tanto 43x 41 = 44 posibilidades de secuencias

5.d.-

Si sumamos los 3 casos: 46 – 45 + 45 – 44 + 44 = 46

 

6.- Palíndromos de 10 unidades

Pasamos ahora al caso en que la secuencia tenga 10 Pares de bases ( o nucleótidos)

6.a.-Caso 1:  (P(5)-NP(0)- P´(5))- Palíndromo continuo

Palíndromo continuo (5 y 5). Los 5 primeros nucleótidos (45) determinan una y sólo una combinación en los 5 restantes: 45 x 1 =45

6b.- Caso 2:  (P(1)- NP(8)-P´(1)

Palíndromo interrumpido de 1 base en cada extremo y 8 NP: Siguiendo los razonamientos anteriores: 41 x (48– 47)= 49 – 48

6.c.- Caso 3:  (P(2)-NP(6)-P´(2))

Palindromo interrumpido de 2 en cada extremo y 6 NP: 42 (46– 45)= 47– 46

6.d.- Caso 4:  (P(3)-NP(4)-P´(3))

Palíndromo interrumpido de 3 en cada extremo y 4 NP en medio: 43 (44– 43) = 47 – 46

6e.- Caso 5:  (P(4)-NP(2)-P´(4))

Palíndromos interrumpidos de 4 en cada extremo y 2 NP en medio: 44 (42– 41)=46 – 45

6.f.-La suma total de posibles secuencias palíndromo de 10:  45 +49-47 + 47-46 + 46-45 = 49

7.- Respuesta a la pregunta inicial

Podemos ahora responder a la pregunta con la que iniciábamos los cálculos de este apartado. El nº de secuencias posibles de un palíndromo (P6-NP(5)-P´(6))  es igual a  46 (45 -44) = 411 -410 = 410( 4 -1) = 3 x 410 = 3.145.728 ( Ver punto 5 de las conclusiones más abajo y todos los casos contemplados de palíndromos interrumpidos en los apartados anteriores 1a, 2b, 3a, 3b, 4b, 4c, 5a, 5b, 5c, 6b, 6c, 6d, 6e))

Tabla resumen de los cálculos realizados anteriormente

CONCLUSIONES

1.- En una secuencia de “n” nucleótidos o pares de nucleótidos, el nº de secuencias posibles es 4n y 4n-1 de ellas serán secuencias palíndromo (continuos e interrumpidos)

2.- La relación entre secuencias palíndromo y secuencias no palindrómicas de cualquier tamaño (n nucleótidos o pares de nucleótidos) viene dado por la fracción 4n-1/4n = 1/4. Una de cada cuatro secuencias al azar constituirán un palíndromo continuo o interrumpido.

3.- En las secuencias de nº par (n= nº par), el nº de secuencias palíndromos continuos será 4 n/2,  y el nº de secuencias palíndromo interrumpido será 4n-1 – 4n/2. (Véase en la tabla casos 2, 4 y 6 el cálculo del nº de palíndromos interrumpidos).

4.- En las secuencias de nº impar(n= nº impar), no es posible la existencia de palíndromos continuos y el nº de secuencias de palíndromos interrumpidos será 4n-1.

5.- En cualquier secuencia que constituya un palíndromo interrumpido de estructura general: P(n)- NP (m) –P´(n) el nº de secuencias posibles diferentes será el que viene dado por la fórmula: 4n (4m -4m-1) ; 4n para el palíndromo que forman P y P´; que habrá que multiplicar por las secuencias de “m” posibles que NO puedan formar palíndromos que serán todas las posibles (4m) menos aquellas que sí lo forman (4m-1), tal y como hemos visto en los cálculos realizados. Si queremos simplificar más esta fórmula, 4n (4m -4m-1)  = 4(n+m) – 4(n+m-1) = 4 (n+m-1) (4 -1) = 3 . 4 (n+m-1)  

6.- Estas conclusiones se pueden aplicar a cualquier tipo de secuencias simples, tanto ADN como ARN .

 

 

 

 

 

 

 

 

 

 

 

Posted in Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment
5
octubre

Matemáticas y ADN (1)

ADNs diferentes (1)

La genética y su ADN se prestan para realizar actividades de tipo matemático en diferentes  aspectos. Todo es cuestión de ponerse a ello.

1.-  Empecemos por calcular el nº de  ADNs diferentes por sus secuencias
Por ejemplo: Calcula el nº de ADNs diferentes por su secuencia de 8 pares de bases (8 unidades en cada cadena)

Lo primero que tenemos que tener en cuenta es que el ADN tiene 2 cadenas complementarias y antiparalelas que forman su secuencia con 4 tipos de unidades (nucleótidos: A, T, G y C) que se siguen unas a otras de todas las formas posibles, admitiendo la repetición de cualquiera de ellas.

Complementarias significa que si en una de las cadenas hay una A, en la otra debe haber una T (y lo mismo al revés) y si en una de ellas hay una G, en la otra tiene que haber una C enfrentada a ellas.

Antiparalelas quiere decir que frente a la A, en la otras cadena hay T pero como si estuviese al revés (con el palo transversal de la T boca abajo) igualmente con T y A (vértice hacia abajo) y con G y C. De tal forma que en una de las cadenas “leemos” su secuencia de izquierda a dcha. y la otra de  dcha. a izquierda.

Aclarado a lo que nos enfrentamos, iniciamos la resolución.

1.1.- Vamos allá con la cuenta de la vieja: Imaginamos una secuencia de 2 pares de bases

-Veamos las secuencias posibles en UNA de sus cadenas.

a- La primera unidad de las 2 puede ser A ó T ó  G ó C (4 posibles) y la segunda unidad puede tener las mismas 4 posibilidades( A,T,G ó C):  AA, AT, AG, AC, TA, TT, TG, TC, GA, GT, GG, GC, CA, CT, CG y CC , constituyen las 16 posibles secuencias en una de sus cadenas que se calcularía 4 posibilidades de la primera POR 4 posibilidades en la segunda = 4 x 4 = 42 = 16.

b- No obstante, si nos fijamos en las 4 secuencias de las 16 posibilidades (las 4 subrayadas), en la otra cadena también hacen la misma secuencia de ADN (2 cadenas antiparalelas y complementarias):  AT , TA, GC y CG hacen la misma secuencia de ADN ya que ambas cadenas poseen la misma secuencia. O sea, 4 ADNs de secuencia diferente utilizando la misma secuencia en cada caso.

c- Por otro lado, observamos que entre las 12 secuencias que nos quedan y, por poner uno de los ejemplos, la secuencia AA tiene como complementaria a la secuencia TT y, ambas situadas en una o en la otra cadena formarían el mismo ADN (1); lo mismo sucedería por parejas en las restantes: AG con CT (2)/ AC con GT(3)/TG con CA (4)/ TC con GA(5) y GG con CC (6). Así que sólo caben 6 posibilidades de construir el mismo ADN de 2 unidades., que traducido en números sería 42 (por todas las posibles combinaciones), menos 41 (por las anteriores señaladas en el apartado b, que por sí solas forman la misma molécula) y el resultado dividido entre 2 por formar la misma molécula cada 2 de ellas.

d- Las posibilidades de secuencias que darían lugar al mismo ADN de 2 unidades sería por tanto: (42-4)/2(c) + 4 (b)= 12/2 +4 = 6+4= 10.

-Hasta ahora, no es posible generalizar para secuencias de “n” unidades de ADN, pero podemos intentarlo: ¿¿(4n -4n-1)/2 + 4. Ésta podría ser?; o quizás (4n-4n/2)/2+ 4n/2¿?

1.2.- Con esta interrogante inicial pasemos al caso siguiente en el que son 3 unidades. Podemos plantearlo del modo siguiente: poniendo en medio de las secuencias anteriores una nueva unidad. Por ejemplo a la secuencia AA, le ponemos una cualquiera de las letras de los nuecleótidos en medio de las 2 “aes” y, así resultarían las secuencias siguientes: AAA, ATA, AGA y ACA y lo mismo con las restantes posibles AAT, ATT, AGT, ACT;   AAG, ATG, AGG, ACG; etc……… Esto haría que las secuencias posibles de una de las cadenas sería 43.

a- Observando la configuración de 3 unidades, vemos que no hay forma de repetir en una y otra cadena la misma secuencia, como en el caso anterior. Lo impediría la unidad central que no puede ser de ningún modo idéntica a la de la otra cadena ya que estaría situada su complementaria, distinta a ella.

b- Sucedería igualmente en todas las secuencias con número Impar de unidades (3, 5, 7, 9,….), ya que nunca podría producirse una igualdad de ambas secuencias por culpa de la unidad central  y, por lo tanto, las secuencias de ADN diferentes de un nº impar de unidades vendría dado por la fórmula de 4n y punto.

c- Pero también sucedería que cualquier secuencia de 3 unidades, tendría su secuencia complementaria entre alguna de las posibles 43 unidades: por ejemplo ATG y CAT formarían el mismo ADN (y así 2 a 2). Por tanto las 43 secuencias habría que dividirlas entre 2 para conocer el nº de ADNs diferentes de 3 unidades posibles. Por tanto habría 4n/2 ADNs diferentes en secuencias de nº impar de unidades.

1.3.- Pasemos ahora al caso de 4 unidades para ver si podemos despejar la incógnita del caso de 2 unidades generalizando para las unidades pares.

a- Para construir las secuencias de una de las cadenas podemos añadir 2 unidades más en medio de las 2 del caso 1.1 .  Con las 4 subrayadas en el punto 1.1, (a) y a cada una de ellas, si les ponemos en medio las 4  mismas citadas, se convertirían en secuencias de 4 que serían iguales en ambas cadenas. Así AT (una de las 4) se convierte en 4 opciones: AATTATAT, AGCT y ACGT  ( secuencias idénticas en ambas cadenas del ADN).  Y lo mismo con las otras 3 restantes. Su cálculo sería 4 x 4 = 42 =16. Es decir,  hay 16 secuencias diferentes de 4 unidades que harían que el ADN coincidiera en ambas cadenas: ellas solas construirían los mismos ADNs.

b- Las restantes combinaciones: 44 (por todas las posibles) – 42 (por las citadas en el punto anterior), formarían ADNs idénticos pero tomándolas de de 2 en dos y el nº de ADNs diferentes sería (44 -42)/2 = 256-16/2= 240/2 = 120 ADNs con secuencia diferente.

-A las 120 anteriores habría que añadir las 16 secuencias que por sí solas forman el mismo ADN ya que su secuencia complementaria coincide en ambas.

-Por tanto 120 +16 = 136 ADNs diferentes de 4 unidades

-A estas alturas podemos ajustar un poco más del cálculo para generalizar para un ADN de “n” unidades (siempre que “n” sea par, que para “n” impar ya lo hemos generalizado en el apartado 1.2):

-la 1ª fórmula posible  prevista (4n -4n-1)/2 +4/2)  nos daría (44-43)/2 +2 = (256 -64)/2 +2 =192/2 +2 = 96+2 = 98 y, por lo tanto no nos cuadra.

-Vayamos con la segunda:

Sí parece que el primer sumando, parece ser acertado: ((4n -4n/2)/2) que daría (44 -42) /2, en este caso. Parece acertado ya que sigue el razonamiento esgrimido en el apartado anterior para el cálculo de ADNs cuyas secuencias no son coincidentes en ambas cadenas, (posibles-iguales)/2 =256-16/2 =120.

El segundo sumando (4n/2) que en este caso sería 44/2 = 42 = 16 también nos cuadra.

Apostamos, por tanto, que el nº de ADNs diferentes por su secuencia de un nº “n” de unidades (se entiende en cada cadena) y siempre que “n” sea par se puede calcular por la fórmula general siguiente: (4n– 4n/2)/2 + 4n/2   .

Como sucede en matemáticas hay que reducir la fórmula a su expresión más simple (simplificar) y así (4n – 4n/2 + 2.4n/2)/2 = (4n +4n/2)/2

1.4.-Respondiendo ahora a la cuestión planteada de inicio; ADNs diferentes de 8 unidades (nº par), aplicamos la fórmula obtenida: (48 +44)/2 = (65.536 +256)/2 = 32.896.

1.5.- Conclusiones:

                -El número de ADNs diferentes por su secuencia de “n” unidades  es 4n/2 si el nº de unidades (n) es impar,  y  (4n + 4n/2)/2 ,  si “n” es un número par.

 

1.6.- No es extraño que haya investigadores que se dediquen a desarrollar métodos computacionales basados en  secuencias de ADN, incluso ordenadores cuya “CPU” esté compuesta de moléculas de ADN. La cantidad de información que pudiera contener sería más extensa que el sistema digital y, al mismo tiempo, en muchísimo menor espacio. Un ejemplo más de la naturaleza,  que adopta la forma más eficaz y simple de almacenar la información que explica la enorme diversidad existente.

Posted in Artículos, DNA Didactic, Noticias, Para estudiantes BACH, Para estudiantes ESO | Tagged , | Leave a comment
5
octubre

Matemáticas y ADN (0)

Jugando con las matemáticas del  ADN (0)

Lo nuestro es el ADN y la genética, y por ello vamos a realizar una serie de artículos en nuestro blog relacionando diferentes aspectos del ADN y de genética con las matemáticas. Pretendemos hacerlo desde postulados simples e ir, poco a poco, deduciendo fórmulas o generalizaciones que nos permitan resolver casos más complejos. Es decir, por el método denominado “la cuenta de la vieja”.

 

Lo hacemos de este modo porque estos artículos van dirigidos, sobre todo al alumnado de enseñanzas medias (ESO y Bachillerato), y también para sus profesores, con la finalidad de que éstos se sirvan de ellos para su  labor didáctica, tanto para aspectos matemáticos como para aspectos biológicos.

Esperemos que estos artículos puedan ser de utilidad.

Posted in Artículos, DNA curioseando, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged | Leave a comment