7
noviembre

Matemáticas y ADN (5)

Genes, alelos y Genotipos

En esta ocasión vamos a intentar buscar una relación matemática entre las diferentes variantes (alelos) que puede presentar un gen  y el número de combinaciones binarias (genotipos) entre ellos en las especies diploides.

Empecemos, como siempre, por el caso más sencillo: 2 variantes o alelos para el mismo gen que, como siempre, ocuparán el mismo locus cromosómico.

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 y A2

 

(2)

1- A1 A1

2- A2 A2

1- A1 A2

(*)

2 homozigóticos

1 heterozigóticos

2 posibles 1 posible 3 posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 y A3

 

 

 

(3)

1-A1 A1

2- A2 A2

3- A3 A3

1-A1 A2

2- A1 A3

3- A2 A3

(*)

3 homozigóticos

3 heterozigóticos

3 posibles 3 posibles 6 posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 y A4

 

 

 

 

 

 

(4)

1-A1 A1

2- A2 A2

3- A3 A3

4- A4 A4

1-A1 A2

2-A1 A3

3-A1 A4

4-A2 A3

5-A2 A4

6-A3 A4

(*)

4 homozigóticos

6 heterozigóticos

4 posibles  6 posibles 10  posibles

 

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 , A4 y A5

 

 

 

 

 

 

 

 

 

 

(5)

A1 A1

A2 A2

A3 A3

A4 A4

A5 A5

A1 A2

A1 A3

A1 A4

A1 A5

A2 A3

A2 A4

A2 A5

A3 A4

A3 A5

A4 A5

(*)

5 homozigóticos

10 heterozigóticos

5  posibles  10  posibles 15  posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 , A4 , A5 y  A6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(6)

1-A1 A1

2- A2 A2

3- A3 A3

4- A4 A4

5- A5 A5

6- A6 A6

1-A1 A2

2- A1 A3

3- A1 A4

4- A1 A5

5- A1 A6

6- A2 A3

7- A2 A4

8- A2 A5

9- A2 A6

10- A3 A4

11- A3 A5

12- A3 A5

13- A4 A5

14- A4 A6

15- A5 A6

(*)

6 homozigóticos

15 heterozigóticos

6  posibles  15  posibles 21  posibles

 

(*) La combinación A1 A2 es la misma que A2A1 y por ello no se consideran como 2 combinaciones diferentes; y lo mismo A1 A3=A3 A1; A2 A4 = A4 A2,….. y así sucesivamente.

Por tanto:

Nº alelos Nº de Homozigotos Nº Heterozigotos Total genotipos
2 2 1 3
3 3 3 6
4 4 6 10
5 5 10 15
6 6 15 21

 

Conclusiones:

1.-  Parece seguro que el nº de homozigóticos coincide con el nº de alelos; si llamamos “n “ al nº de variantes alélicas (variable principal), el nº de genotipos homozigóticos para cualquier nº “n” será igual a “n”.

2.- Con el nº de heterozigóticos, en función de “n” parece que no es tan simple encontrar una relación: De 2, sólo 1; de 3 salen 3, de 4 salen 6, de 5 salen 10, de 6 salen 15, de “n”….saldrían?.

Podemos probar con el total de genotipos para ver si es más fácil la relación y luego descontar los homozigotos: de 2 salen 3; de 3 salen 6; de 4 salen 10; de 5 salen 15 de 6 salen 21, de “n”… parece que n . (n+1)/2 nos cuadra con cualquiera de los resultados obtenidos. 2×3/2 =3;  3×4/2=6;  4 x5/2 =10;  5×6/2 =15;  6×7/2=21.

Por lo que parece esta fórmula funciona, así que para el cálculo de los heterozigóticos = nºTotal – nº homozigóticos = n.(n+1)/2 –n  = (n. (n+1)-2n)/2  =  (n(n+1-2))/2  =  n(n-1)/2

Veamos si cumple: para 2, 2×1/2 =1; para 3, 3×2/2 =3; para 4,  4×3/2=6; para 5,  5×4/2 =10; para 6, 6×5/2 =15,… Vemos que se cumple también la fórmula en todos los casos.

Nota: Otra forma de calcular el nº total de genotipos que da resultado es  N= n +(n-1)+ (n-2)+ (n-3) +…….(n-(n-1)). Así para 5 alelos N= 5+4+3+2+1 = 15 genotipos.

Nota: para los que conocen combinatoria matemática, los heterozigóticos serían combinaciones (donde el orden no importa)  sin repetición de “n” elementos tomados de 2 en 2 = = n!/2! (n-2)! =n. (n-1).(n-2). (n-3)…/2. (n-2). (n-3)…= n (n-1)/2

Así para 2 alelos = 2!/2!(2-2)! = 2/ 2 =1  , recuérdese que 0!=1

Así para 3 alelos =3!/2! (3-2)! = 6/2 = 3

Así para 4 alelos = 4!/2! (4-2)! = 24/4= 6

Así para 5 alelos = 5!/2!(5-2)! = 120/12 =10

Lo mismo para el resto de alelos.

Por tanto y generalizando:

Nº alelos Nº de Homozigotos Nº Heterozigotos Total
n n n.(n-1)/2 n.(n+1)/2

 

Cualquier gen que presente “n” variantes (alelos), el nº de genotipos posibles será n. (n+1)/ 2, de los cuales “n” será el nº de genotipos homozigóticos y,   n. (n-1)/2 corresponderá con el nº de genotipos heterozigóticos posibles.

Los genes que presentan más de 2 alelos posibles se denominan genes con alelomorfismo múltiple.

Un ejemplo sencillo  de genes con alelomorfismo múltiple son los que determinan el grupo sanguíneo humano del Sistema ABO, siendo 3 los alelos posibles (A, B y O). Los genotipos homozigóticos serán 3: AA, BB y OO y los genotipos heterozigóticos, otros 3: AB, AO, BO. En este caso la diferente potencia de expresión de los diferentes alelos A=B>O, implica que los fenotipos resultantes sean A, B, O,  AB, A y B respectivamente. Sólo 4 fenotipos para 6 genotipos posibles. Como se ve, los fenotipos posibles dependerán de la fuerza expresiva que posean las diferentes variantes (alelos) del  gen en cuestión.

 

Otro caso humano de alelomorfismo múltiple es el caso de los genes STR. Los genes STR son genes situados en diferentes posiciones de la molécula del ADN nuclear humano que se caracterizan por presentar una secuencia corta de bases (Short=Corta) (la misma en cada gen STR) repetida a continuación una de otra  en un número de repeticiones bastante variado (Tandem Repeat= repetidas en tándem). Por ejemplo……..ACTG ACTG ACTG ACTG ACTG ACTG…… Esta secuencia se repite en el mismo locus o posición de la molécula de ADN de todos las personas y el nº de repeticiones puede variar entre, por ejemplo 6 a 18 veces. Por tanto, los alelos  o variantes posibles serán 6 repeticiones, 7, repeticiones, 8 repeticiones, nueve repeticiones,…….. y así hasta 18 repeticiones. Es decir 13 alelos diferentes. Las personas tendrán un genotipo concreto de entre los 13×14/2= 91 genotipos posibles. Así, por ejemplo un individuo será (11, 11) ó (8,18) ó ( 9, 16 ) ó cualquier combinación de 2 nºs de repeticiones entre el 6 y el 18. Se pueden analizar al detectar y diferenciarlos  por su longitud en electroforesis.

Estos genotipos, que se sepa, no determinan ningún fenotipo ni externo ni interno de cada individuo (aparentemente no tienen función fisiológica ninguna), pero se pueden analizar y diferenciar individuos por ellos. Así, analizando los 91 genotipos posibles para ese gen STR diferenciamos a 1 individuo entre 91 posibles.

El análisis de uno sólo de esos genotipos nos diferencia a una persona entre 91, pero  como en el ADN hay más lugares con repeticiones STR (con otra secuencia y con igual o superior nº de repeticiones en tándem y situados en diferentes cromosomas), la combinación de varios de esos locus nos amplía considerablemente y en progresión geométrica la diferenciación individual.

Por ejemplo:

Gen o Locus STR Secuencia repetida Localizado en el cromosoma…. Nº de variantes o alelos Diferenciación de Genotipos Diferenciación conjunta

(*)

STR 1 ACTG 2 13 13×14/2= 91;

1 de 91

 

1 de 91

STR 2 TATGC 4 9 9 x10/2 = 45

1 de 45

91 x 45 = 4.095

1 de 4.095

STR 3 GCTACC 7 18 18×19/2= 171

 

1 de 171

4.095 x 171 =

700.245

1 de 700.245

STR 4 TTAAG 13 14 14 x15/2 =105

 

1 de 105

700.245 x 105 =73.525.725

1 entre 7,5 millones

STR 5 CCGAT 18 20 20×21/2 = 210

 

1 de 210

73.525.725 x 210 = 15.440.402.250

1 entre 15,4 miles de millones

(*) Al ser cada locus STR independiente de cualquier otro, cada uno de ellos admite cualquier combinación del otro, por ello se multiplican las combinaciones al considerarlas conjuntamente.

Nota: los alelos STR del ejemplo son inventados. En realidad son muy similares y valen como ejemplo.

Analizando sólo 5 genes STR del genoma humano (siempre que se localicen en cromosomas diferentes para que sean genes independientes), podemos diferenciar por el genotipo conjunto de los 5 genes  a 1 persona entre 15, 4 miles de millones de personas.

El perfil genético que usa la policía en sus análisis de ADN (tan utilizado en cualquier delito) analiza nada menos que entre 13 y 16  de esos locus STR y así puede afirmar categóricamente –con una certeza muy próxima al 100%- de qué individuo se trata (siempre que tenga archivado el perfil genético de esa persona o que al sospechoso se le haga un análisis de su perfil genético y concuerde o no para confirmar su culpabilidad o inocencia).

El hecho de no poder llegar a una certeza absoluta del 100% se debe principalmente al hecho de que existen alelos y genotipos más frecuentes que otros en las poblaciones para los diferentes genes STR y no del modo que nosotros lo hemos considerado, con igualdad de posibilidades para todos ellos. Con todo, la coincidencia proporciona una confirmación del 99,99% o incluso mayor.

Estos análisis de perfil genético nos  sirven, además, para determinar parentescos entre personas. De los 2 alelos que una persona posee en cualquiera de sus genes STR, uno de ellos lo ha recibido de su padre biológico y el otro de su madre. Por tanto, el padre o supuesto padre biológico tiene que  tener en sus dos alelos de cada uno de los genes STR, uno de los 2 que posee el hijo o supuesto hijo; y lo mismo con la madre o supuesta madre.

Ver artículos en nuestro blog: http://bit.ly/235x0oa .  http://bit.ly/2opCTQF . Y el documento de perfiles genéticos: http://bit.ly/2x7fs2E

En las demandas judiciales de paternidad –tan de actualidad en estos días con respecto a personas famosas-  estas pruebas de comparación de perfiles genéticos constituyen una prueba fundamental. También para otro grado de parentesco pero no con tanta fiabilidad.

Posted in alelos STR, Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment
13
octubre

Matemáticas y ADN (4)

 

Palíndromos y Re-palíndromos (4)

En el artículo anterior relacionamos las posibles secuencias de una de las hebras del ADN o del ARN (En este caso la complementariedad es A-U y G-C) con las posibles secuencias palíndromo (continuos o interrumpidos) que se podían presentar en ellas.

También podemos buscar las razones matemáticas para relacionar los palíndromos con los diferentes ADNs. Para ello tendremos que tener en cuenta que sólo los palíndromos continuos forman la misma molécula de ADN, mientras que los discontinuos no; ya que tienen parte NP y, por definición, no pueden ser idénticas en esa zona en ambas cadenas.

Conclusión :

La relación entre secuencias palíndromo (de cualquier tipo) y el nº de ADNs diferentes de ese mismo nº de unidades es de 1/2 en ADNs de nº impar y un poco menor en ADNs de nº par de unidades, aunque muy próximo a esa misma cantidad (1/2) .  Esto significa que si escribimos la secuencia de un ADN al azar, existe  1/2 de probabilidad de que contenga algún tipo de palíndromo.

Las secuencias palíndromo desempeñan diferentes funciones biológicas.

Muchas de ellas sirven de señalización (identifican puntos de interés en el ADN para, por ejemplo, localizar secuencias,  determinar lugares del ADN donde se unen determinados factores de transcripción o también en determinadas secuencias promotoras y terminadoras del mismo proceso,  lugares para escindir el ADN por enzimas de restricción o endonucleasas (tipo II) o también lugares  donde el ADN se “metila” para desactivar genes) o también como regiones transcribibles para que el ARN resultante pueda formar horquillas de apareamiento como en el caso de los ARN ribosómicos y transferente y los ARNmic transcritos primarios que originan los ARN-i (ARN de interferencia) . Las secuencias palíndromo también se encuentran presentes en los sistemas genómicos bacterianos CRISPR: CRI-SPR; las iniciales SPR (Short Palindromic Repeats = repeticiones palindrómicas cortas) que actúan de encaje a las secuencias espaciadoras, responsables directas de la inmunidad adquirida bacteriana, y  que es utilizado en la actualidad para la edición génica con múltiples aplicaciones.

 Los palíndromos en el ARN : RE-PALÍNDROMOS

Es frecuente observar que algunos tipos de moléculas de ARN (ejemplo: ARNt y ARNr) no tienen una estructura lineal, sino que en diferentes lugares presentan estructura doble (partes diferentes  de la cadena se han hibridado) presentando una estructura compleja tridimensional variada en su forma, incluso ARNs de estructura circular. Esto es debido a que las secuencias que hibridan son palíndromicas (por complementarias) y a su vez, en el intermedio de las mismas puede haber otras secuencias también palindrómicas produciéndose una primera y una segunda,.. hibridación en ellas. Casos que podríamos denominar re-palíndromos. En la imágenes  inferiores puede observarse la estructura lineal (rodeado de elipses en rojo las regiones palíndromas) de uno de los ARNt  y debajo su estructura tridimensional.

Su secuencia Re-palindrómica: 5´-P1-NP1-P2-NP2 (bucle izqdo.)-P´2-NP-P3-NP3( bucle anticodon)-P´3-NP4 (semibucle derecho)-P4-NP5 (bucle derecho)-P´4P´1-NP7-3´.

LOS PALINDOMOS EN EL ADN- Ver artículos Blog DNA didactic : Palindromos de ADN 1, 2 y 3 (http://www.dnadidactic.com/blog/secuencias-del-adn-palindromos-1/  http://www.dnadidactic.com/blog/secuencias-de-adn-palindromos-2-2/  http://www.dnadidactic.com/blog/secuencias-de-adn-palindromos-3/ )

 

 

 

Posted in Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment
10
octubre

Matemáticas y ADN (3)

 

También hay secuencias que forman los palindromos interrumpidos(3)

Las secuencias palindrómicas de los artículos anteriores son palíndromos continuos (o también llamados ininterrumpidos), pero también existen otras secuencias similares denominadas palíndromos interrumpidos. Son secuencias palíndromo que justo en medio se ha introducido 1, 2, 3, 4,….unidades que no son palindrómicas. (En lo sucesivo, mientras no indiquemos lo  contrario, hablaremos de secuencias y no haremos referencia a ADNs diferentes).

Ejemplo: ATCGT GGT ACGAT . Las unidades subrayadas forman un palíndromo,  interrumpido por una secuencia –en este caso de 3 unidades-que no igualaría la secuencia de la otra hebra en ese tramo, mientras que las adyacentes subrayadas sí.

Estas secuencias hacen que tanto los tramos de unidades pares como las impares puedan formar palíndromos interrumpidos.

Podemos igualmente aproximarnos a calcular su número, en función del número total de unidades de la secuencia.

En general podemos denominar a estos palíndromos interrumpidos del siguiente modo: P(n)-NP(m)-P´(n); siendo P(n) y P´(n) los tramos palíndomo de “n” (nº de unidades) y NP(m) el tramo no palíndromo de “m” (nº de unidades de ese tramo).

¿Podemos calcular el nº de secuencias posibles por ejemplo del  P(6)- NP (5)-P´(6); o sea un tramo de 17(6+5+6) unidades?. Pongámonos a ello partiendo de casos sencillos y busquemos, como en artículos  anteriores, una fórmula general que nos lo indique.

 

1.-Palíndromo interrumpido de 3 unidades

En este caso no pueden existir secuencias palíndromo continuos ya que un nº impar de unidades lo impide y sólo cabe el caso indicado a continuación.

1.a.- (P (1) – NP (1) – P´(1))

P: secuencia que forma el palíndromo/ NP: secuencia que no lo forma

P: puede tener 41 combinaciones posibles  que lo harían palíndromo en posiciones P y P´; respectivamente(A y T; T y A; Gy C y Cy G), cada una de ellas junto con las 4 posibles de NP (A,T,G,C), lo que haría un total de 41 x 41 = 42

 

 2.- Palíndromos de 4 unidades

2 casos posibles de palíndromo.

2.a.-Caso 1 (P (2)- NP (0)- P´(2)- Palíndromo continuo

En el continuo, los 2 primeros nucleótidos determinan los 2 siguientes para que se cumpliera la condición de palíndromo. Por tanto 42 combinaciones posible x 1 sola posibilidad en la 2ª parte del palíndromo = 42 x 1 = 42

2.b.- Caso 2 ( P (1)- NP(2) –P´(1))

Para el palíndromo interrumpido de 4 bases sólo cabe la posibilidad dibujada abajo. Su cálculo sería: 41 para constituir palíndromo (P y P´), multiplicado por aquellas secuencias posibles NP de 2 bases; éstas últimas serían 42 posibles de 2 unidadades  – 41 que las harían palíndromo continuo al añadir una unidad más al palíndromo (y estamos contemplando el caso  que no constituyan palíndromo). Por tanto, en total:  41 (42 – 41 ) = 43 – 42

2.c.-

La Suma total de secuencias de 4 bases que formarían un palíndromo (continuo o interrumpido) = 42 + (43 – 42) = 42 + 43 – 42 = 43

 

3.- Palíndromos interrumpidos de 5 unidades

2 casos posibles de palíndromo (ambos interrumpidos). No existe, en este caso la posibilidad de palíndromos continuos,  al ser una secuencia Impar.

3.a.- Caso 1:  (P (2)- NP(1)- P´(2))

En este primer caso se calcularía 42 (nº de P ) x 41 (posibilidades de NP: los 4 nucleótidos) = 43 posibilidades de secuencias diferentes

3.b.- Caso 2; (P (1)- NP(3)-P´(1))

En esta segunda posibilidad: 41 secuencia P x aquellas secuencias NP de 3 unidades que se calcularía 43 secuencias posibles, menos aquellas que las convirtiesen en palíndromo (que serían las indicadas para en apartado 1, o sea 42); por tanto, 41 ( 43 – 42) = 44 -43

3.c.- Si sumamos ambos casos 43 + (44 – 43) = 44 posibilidades de secuencias palíndromo diferentes

4.- Palíndromos de 6 unidades

Casos posibles:

4.a.- Caso 1:  (P(3)- NP(0)- P´(3)) – Palíndromo continuo

Palíndromo continuo donde los 3 primeros nucleótidos (43 combinaciones posibles) determinan una  y sólo una posibilidad en los 3 últimos: 43 X 1 = 43

4.b.- Caso 2:  (P(1)-NP(4)-P´(1))

Palíndromo interrumpido de 1 base en cada extremo

si le añaden una : 41 ( P y P´) x aquellas de 4 nucleótidos no palíndromos (44 – 43: las combinaciones posibles (44) menos las calculadas en el apartado 2c, que sería el nº de secuencias palíndromo posibles de 4 nucleótidos o pares de nucleótidos ): 41 (44 – 43) = 45 – 44

4.c.- Caso 3:  (P(2)-NP(2)-P´(2))

Palíndromo interrumpido de 2 bases en cada extremo:

Secuencias P= 42 multiplicado por aquellas combinaciones de 2 NP: (42 – 41: las posibles menos las indicadas en el razonamiento del  apartado 2b). Por tanto 42(42 – 41)= 44 – 43

4.d.-

La suma de todas las combinaciones palíndrómicas posibles sería: 43 (continuo) + (45– 44) añade 1, + (44 – 43) añade 2 = 43 + 45 – 44 + 44– 43= 45 secuencias palíndromos posibles

 

5.- Palíndromos interrumpidos  de 7 unidades

5.a.-Caso 1:  (P(1)-NP(5)-P´(1))

palíndromo interrumpido de 2 bases (uno en cada extremo) y 5 NP. Multiplicar el nº de unas por el nº de las otras

-Secuencias que forman el palíndromo: 41

-Secuencias NP (de 5 bases): 45 posibles menos aquellas que hicieran de esas 5 bases algún palíndromo; que como hemos calculado en el apartado (3) son 44.

Por tanto= 45– 44

-Total: 41 (45 – 44) = 46 – 45

5.b.-Caso 2:  (P(2)-NP(3)-P´(2))

palíndromo interrumpido que añade 4 bases (2 en cada extremo) y 3NP. Multiplicar el nº de unas por el nº de las otras.

-Secuencias posibles palíndromos: 42

-Secuencias NP( de 3 bases): las posibles 43 – aquellas que la convertirían a la secuencia NP en palíndromo, que como hemos calculado en el apartado (1) son 42. En total 43 – 42

-Total secuencias: 42 (43 – 42)= 45 – 44

5.c.- Caso 3:  (P(3)-NP(1)-P´(3))

Palíndromo interrumpido que añade 6 bases (3 en cada extremo) y 1 NP

Secuencias posibles que formarían el palíndromo;  43, multiplicadas por los posibles NP (los 4 nucleótidos) que en este caso es 41

Por tanto 43x 41 = 44 posibilidades de secuencias

5.d.-

Si sumamos los 3 casos: 46 – 45 + 45 – 44 + 44 = 46

 

6.- Palíndromos de 10 unidades

Pasamos ahora al caso en que la secuencia tenga 10 Pares de bases ( o nucleótidos)

6.a.-Caso 1:  (P(5)-NP(0)- P´(5))- Palíndromo continuo

Palíndromo continuo (5 y 5). Los 5 primeros nucleótidos (45) determinan una y sólo una combinación en los 5 restantes: 45 x 1 =45

6b.- Caso 2:  (P(1)- NP(8)-P´(1)

Palíndromo interrumpido de 1 base en cada extremo y 8 NP: Siguiendo los razonamientos anteriores: 41 x (48– 47)= 49 – 48

6.c.- Caso 3:  (P(2)-NP(6)-P´(2))

Palindromo interrumpido de 2 en cada extremo y 6 NP: 42 (46– 45)= 47– 46

6.d.- Caso 4:  (P(3)-NP(4)-P´(3))

Palíndromo interrumpido de 3 en cada extremo y 4 NP en medio: 43 (44– 43) = 47 – 46

6e.- Caso 5:  (P(4)-NP(2)-P´(4))

Palíndromos interrumpidos de 4 en cada extremo y 2 NP en medio: 44 (42– 41)=46 – 45

6.f.-La suma total de posibles secuencias palíndromo de 10:  45 +49-47 + 47-46 + 46-45 = 49

7.- Respuesta a la pregunta inicial

Podemos ahora responder a la pregunta con la que iniciábamos los cálculos de este apartado. El nº de secuencias posibles de un palíndromo (P6-NP(5)-P´(6))  es igual a  46 (45 -44) = 411 -410 = 410( 4 -1) = 3 x 410 = 3.145.728 ( Ver punto 5 de las conclusiones más abajo y todos los casos contemplados de palíndromos interrumpidos en los apartados anteriores 1a, 2b, 3a, 3b, 4b, 4c, 5a, 5b, 5c, 6b, 6c, 6d, 6e))

Tabla resumen de los cálculos realizados anteriormente

CONCLUSIONES

1.- En una secuencia de “n” nucleótidos o pares de nucleótidos, el nº de secuencias posibles es 4n y 4n-1 de ellas serán secuencias palíndromo (continuos e interrumpidos)

2.- La relación entre secuencias palíndromo y secuencias no palindrómicas de cualquier tamaño (n nucleótidos o pares de nucleótidos) viene dado por la fracción 4n-1/4n = 1/4. Una de cada cuatro secuencias al azar constituirán un palíndromo continuo o interrumpido.

3.- En las secuencias de nº par (n= nº par), el nº de secuencias palíndromos continuos será 4 n/2,  y el nº de secuencias palíndromo interrumpido será 4n-1 – 4n/2. (Véase en la tabla casos 2, 4 y 6 el cálculo del nº de palíndromos interrumpidos).

4.- En las secuencias de nº impar(n= nº impar), no es posible la existencia de palíndromos continuos y el nº de secuencias de palíndromos interrumpidos será 4n-1.

5.- En cualquier secuencia que constituya un palíndromo interrumpido de estructura general: P(n)- NP (m) –P´(n) el nº de secuencias posibles diferentes será el que viene dado por la fórmula: 4n (4m -4m-1) ; 4n para el palíndromo que forman P y P´; que habrá que multiplicar por las secuencias de “m” posibles que NO puedan formar palíndromos que serán todas las posibles (4m) menos aquellas que sí lo forman (4m-1), tal y como hemos visto en los cálculos realizados. Si queremos simplificar más esta fórmula, 4n (4m -4m-1)  = 4(n+m) – 4(n+m-1) = 4 (n+m-1) (4 -1) = 3 . 4 (n+m-1)  

6.- Estas conclusiones se pueden aplicar a cualquier tipo de secuencias simples, tanto ADN como ARN .

 

 

 

 

 

 

 

 

 

 

 

Posted in Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment
9
octubre

Matemáticas y ADN (2)

 

Palindromos continuos (2)

En el artículo anterior hemos visto cómo existen secuencias en el ADN que son iguales en ambas cadenas y, además hasta hemos determinado la fórmula para el cálculo de ese tipo de secuencias (4n/2) (siempre que “n” –nº de unidades o nucleótidos- sea un nº par).

La razón matemática de esa cantidad obedece a la propia estructura de la secuencia. Para ello fijémonos en las 16 secuencias de este tipo para n=4 indicadas en el artículo anterior:

  • AATT –  AA/TT                   AA y sólo TT a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • ATAT –  AT/AT                   AT y sólo AT a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • AGCT –  AG/CT                  AG y sólo CT a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • ACGT –  AC/GT                  AC y sólo GT a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • TATA –  TA/TA                   TA y sólo TA a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • TTAA –  TT/AA                   TT y sólo AA a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • TGCA –  TG/CA                  TG y sólo CA a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • TCGA –  TC/GA                  TC y sólo GA a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • GATC –  GA/TC                  GA y sólo TC a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • GTAC –  GT/AC                  GT y sólo AC a continuación :   una combinación posible de 2 unidades x 1 combinación concreta posible
  • GGCC –  GG/CC                 GG y sólo CC a continuación :  una combinación posible de 2 unidades x 1 combinación concreta posible
  • GCGC –  GC/GC                 GC y sólo GC a continuación :   una combinación posible de 2 unidades x 1 combinación concreta posible
  • CATG –  CA/TG                  CA y sólo TG a continuación :   una combinación posible de 2 unidades x 1 combinación concreta posible
  • CTAG –  CT/AG                  CT y sólo AG a continuación :   una combinación posible de 2 unidades x 1 combinación concreta posible
  • CGCG –  CG/CG                 CG y sólo CG a continuación :   una combinación posible de 2 unidades x 1 combinación concreta posible
  • CCGG –  CC/GG                 CC y sólo GG a continuación :   una combinación posible de 2 unidades x 1 combinación concreta posible

Vemos que este tipo de secuencias admite cualesquiera de las 16  posibles combinaciones en las 2 primeras posiciones pero sólo una posibilidad (en función de la combinación de las 2 primeras) en las 2 siguientes, por lo que su cálculo sería 42 x1 = 42 = (44/2 x 1) en secuencias de 4 unidades. Si generalizamos para cualquier otro nº par (n), las posibles secuencias de este tipo nos resultaría 4n/2 x 1 = 4n/2 .

En el gráfico inferior podemos observar la razón de este cálculo con un ADN de 10 unidades:

Las 5 primeras unidades de la secuencia  (verde) puede ser cualquier combinación aleatoria (45) pero a cada una de las 5 primeras unidades debemos colocar simétricamente una y solo una (la complementaria en rojo)) y así conseguimos que la secuencia de ADN sea la misma en ambas hebras

A estas secuencias de ADN especiales se les denomina secuencias palindrómicas o Palíndromos (que no hay que confundir con secuencias capicúas, con que se las clasifica en ocasiones: no son capicúas).

-Podemos también calcular también matemáticamente su relación con las otras secuencias no palíndromos posibles que, en principio, se dan cuando “n” es par.

(*) para obtener ese resultado simplificado se multiplica al numerador y al denominador por el mismo nº: en este caso “1/4n/2” ;  (4n/2 x 1/4n/2) / (4n – 4n/2) (1/4n/2) = 1 / (4n – 4n/2)/4n/2 = 1/(4n/2 – 1)

(**)4n/2/(4n+ 4n/2)/2 = 24n/2 /(4n + 4n/2) ; si ahora multiplicamos en numerador y denominador por la misma cantidad: 1/4n/2 y simplificamos, nos queda 2/(4n/2-1)

De todas las secuencias posibles de “n” unidades ( sólo aplicable a “n”, nº par) de ADN en una de sus hebras; o sea de un total de 4n,  habrá 1  por cada 4n/2 – 1 que resultarán ser secuencias palindrómicas o palíndromos. (aprox.  1 de cada 4n/2); el resto de secuencias, no.  Y en relación al nº de ADNs diferentes,  2 de cada (4n/2 – 1) serán ADNs palíndromos (aprox. 2 de cada 4n/2).

Observamos, por la tabla,  que  encontrar una secuencia  palíndromo es cada vez menos probable a medida que el número de unidades de la secuencia va en aumento.

Posted in Artículos, Para estudiantes BACH, Para estudiantes ESO | Tagged , | Leave a comment
5
octubre

Matemáticas y ADN (1)

ADNs diferentes (1)

La genética y su ADN se prestan para realizar actividades de tipo matemático en diferentes  aspectos. Todo es cuestión de ponerse a ello.

1.-  Empecemos por calcular el nº de  ADNs diferentes por sus secuencias
Por ejemplo: Calcula el nº de ADNs diferentes por su secuencia de 8 pares de bases (8 unidades en cada cadena)

Lo primero que tenemos que tener en cuenta es que el ADN tiene 2 cadenas complementarias y antiparalelas que forman su secuencia con 4 tipos de unidades (nucleótidos: A, T, G y C) que se siguen unas a otras de todas las formas posibles, admitiendo la repetición de cualquiera de ellas.

Complementarias significa que si en una de las cadenas hay una A, en la otra debe haber una T (y lo mismo al revés) y si en una de ellas hay una G, en la otra tiene que haber una C enfrentada a ellas.

Antiparalelas quiere decir que frente a la A, en la otras cadena hay T pero como si estuviese al revés (con el palo transversal de la T boca abajo) igualmente con T y A (vértice hacia abajo) y con G y C. De tal forma que en una de las cadenas “leemos” su secuencia de izquierda a dcha. y la otra de  dcha. a izquierda.

Aclarado a lo que nos enfrentamos, iniciamos la resolución.

1.1.- Vamos allá con la cuenta de la vieja: Imaginamos una secuencia de 2 pares de bases

-Veamos las secuencias posibles en UNA de sus cadenas.

a- La primera unidad de las 2 puede ser A ó T ó  G ó C (4 posibles) y la segunda unidad puede tener las mismas 4 posibilidades( A,T,G ó C):  AA, AT, AG, AC, TA, TT, TG, TC, GA, GT, GG, GC, CA, CT, CG y CC , constituyen las 16 posibles secuencias en una de sus cadenas que se calcularía 4 posibilidades de la primera POR 4 posibilidades en la segunda = 4 x 4 = 42 = 16.

b- No obstante, si nos fijamos en las 4 secuencias de las 16 posibilidades (las 4 subrayadas), en la otra cadena también hacen la misma secuencia de ADN (2 cadenas antiparalelas y complementarias):  AT , TA, GC y CG hacen la misma secuencia de ADN ya que ambas cadenas poseen la misma secuencia. O sea, 4 ADNs de secuencia diferente utilizando la misma secuencia en cada caso.

c- Por otro lado, observamos que entre las 12 secuencias que nos quedan y, por poner uno de los ejemplos, la secuencia AA tiene como complementaria a la secuencia TT y, ambas situadas en una o en la otra cadena formarían el mismo ADN (1); lo mismo sucedería por parejas en las restantes: AG con CT (2)/ AC con GT(3)/TG con CA (4)/ TC con GA(5) y GG con CC (6). Así que sólo caben 6 posibilidades de construir el mismo ADN de 2 unidades., que traducido en números sería 42 (por todas las posibles combinaciones), menos 41 (por las anteriores señaladas en el apartado b, que por sí solas forman la misma molécula) y el resultado dividido entre 2 por formar la misma molécula cada 2 de ellas.

d- Las posibilidades de secuencias que darían lugar al mismo ADN de 2 unidades sería por tanto: (42-4)/2(c) + 4 (b)= 12/2 +4 = 6+4= 10.

-Hasta ahora, no es posible generalizar para secuencias de “n” unidades de ADN, pero podemos intentarlo: ¿¿(4n -4n-1)/2 + 4. Ésta podría ser?; o quizás (4n-4n/2)/2+ 4n/2¿?

1.2.- Con esta interrogante inicial pasemos al caso siguiente en el que son 3 unidades. Podemos plantearlo del modo siguiente: poniendo en medio de las secuencias anteriores una nueva unidad. Por ejemplo a la secuencia AA, le ponemos una cualquiera de las letras de los nuecleótidos en medio de las 2 “aes” y, así resultarían las secuencias siguientes: AAA, ATA, AGA y ACA y lo mismo con las restantes posibles AAT, ATT, AGT, ACT;   AAG, ATG, AGG, ACG; etc……… Esto haría que las secuencias posibles de una de las cadenas sería 43.

a- Observando la configuración de 3 unidades, vemos que no hay forma de repetir en una y otra cadena la misma secuencia, como en el caso anterior. Lo impediría la unidad central que no puede ser de ningún modo idéntica a la de la otra cadena ya que estaría situada su complementaria, distinta a ella.

b- Sucedería igualmente en todas las secuencias con número Impar de unidades (3, 5, 7, 9,….), ya que nunca podría producirse una igualdad de ambas secuencias por culpa de la unidad central  y, por lo tanto, las secuencias de ADN diferentes de un nº impar de unidades vendría dado por la fórmula de 4n y punto.

c- Pero también sucedería que cualquier secuencia de 3 unidades, tendría su secuencia complementaria entre alguna de las posibles 43 unidades: por ejemplo ATG y CAT formarían el mismo ADN (y así 2 a 2). Por tanto las 43 secuencias habría que dividirlas entre 2 para conocer el nº de ADNs diferentes de 3 unidades posibles. Por tanto habría 4n/2 ADNs diferentes en secuencias de nº impar de unidades.

1.3.- Pasemos ahora al caso de 4 unidades para ver si podemos despejar la incógnita del caso de 2 unidades generalizando para las unidades pares.

a- Para construir las secuencias de una de las cadenas podemos añadir 2 unidades más en medio de las 2 del caso 1.1 .  Con las 4 subrayadas en el punto 1.1, (a) y a cada una de ellas, si les ponemos en medio las 4  mismas citadas, se convertirían en secuencias de 4 que serían iguales en ambas cadenas. Así AT (una de las 4) se convierte en 4 opciones: AATTATAT, AGCT y ACGT  ( secuencias idénticas en ambas cadenas del ADN).  Y lo mismo con las otras 3 restantes. Su cálculo sería 4 x 4 = 42 =16. Es decir,  hay 16 secuencias diferentes de 4 unidades que harían que el ADN coincidiera en ambas cadenas: ellas solas construirían los mismos ADNs.

b- Las restantes combinaciones: 44 (por todas las posibles) – 42 (por las citadas en el punto anterior), formarían ADNs idénticos pero tomándolas de de 2 en dos y el nº de ADNs diferentes sería (44 -42)/2 = 256-16/2= 240/2 = 120 ADNs con secuencia diferente.

-A las 120 anteriores habría que añadir las 16 secuencias que por sí solas forman el mismo ADN ya que su secuencia complementaria coincide en ambas.

-Por tanto 120 +16 = 136 ADNs diferentes de 4 unidades

-A estas alturas podemos ajustar un poco más del cálculo para generalizar para un ADN de “n” unidades (siempre que “n” sea par, que para “n” impar ya lo hemos generalizado en el apartado 1.2):

-la 1ª fórmula posible  prevista (4n -4n-1)/2 +4/2)  nos daría (44-43)/2 +2 = (256 -64)/2 +2 =192/2 +2 = 96+2 = 98 y, por lo tanto no nos cuadra.

-Vayamos con la segunda:

Sí parece que el primer sumando, parece ser acertado: ((4n -4n/2)/2) que daría (44 -42) /2, en este caso. Parece acertado ya que sigue el razonamiento esgrimido en el apartado anterior para el cálculo de ADNs cuyas secuencias no son coincidentes en ambas cadenas, (posibles-iguales)/2 =256-16/2 =120.

El segundo sumando (4n/2) que en este caso sería 44/2 = 42 = 16 también nos cuadra.

Apostamos, por tanto, que el nº de ADNs diferentes por su secuencia de un nº “n” de unidades (se entiende en cada cadena) y siempre que “n” sea par se puede calcular por la fórmula general siguiente: (4n– 4n/2)/2 + 4n/2   .

Como sucede en matemáticas hay que reducir la fórmula a su expresión más simple (simplificar) y así (4n – 4n/2 + 2.4n/2)/2 = (4n +4n/2)/2

1.4.-Respondiendo ahora a la cuestión planteada de inicio; ADNs diferentes de 8 unidades (nº par), aplicamos la fórmula obtenida: (48 +44)/2 = (65.536 +256)/2 = 32.896.

1.5.- Conclusiones:

                -El número de ADNs diferentes por su secuencia de “n” unidades  es 4n/2 si el nº de unidades (n) es impar,  y  (4n + 4n/2)/2 ,  si “n” es un número par.

 

1.6.- No es extraño que haya investigadores que se dediquen a desarrollar métodos computacionales basados en  secuencias de ADN, incluso ordenadores cuya “CPU” esté compuesta de moléculas de ADN. La cantidad de información que pudiera contener sería más extensa que el sistema digital y, al mismo tiempo, en muchísimo menor espacio. Un ejemplo más de la naturaleza,  que adopta la forma más eficaz y simple de almacenar la información que explica la enorme diversidad existente.

Posted in Artículos, DNA Didactic, Noticias, Para estudiantes BACH, Para estudiantes ESO | Tagged , | Leave a comment
5
octubre

Matemáticas y ADN (0)

Jugando con las matemáticas del  ADN (0)

Lo nuestro es el ADN y la genética, y por ello vamos a realizar una serie de artículos en nuestro blog relacionando diferentes aspectos del ADN y de genética con las matemáticas. Pretendemos hacerlo desde postulados simples e ir, poco a poco, deduciendo fórmulas o generalizaciones que nos permitan resolver casos más complejos. Es decir, por el método denominado “la cuenta de la vieja”.

 

Lo hacemos de este modo porque estos artículos van dirigidos, sobre todo al alumnado de enseñanzas medias (ESO y Bachillerato), y también para sus profesores, con la finalidad de que éstos se sirvan de ellos para su  labor didáctica, tanto para aspectos matemáticos como para aspectos biológicos.

Esperemos que estos artículos puedan ser de utilidad.

Posted in Artículos, DNA curioseando, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged | Leave a comment
18
septiembre

Elaboración casera de una maqueta de ADN

Con motivo del inicio del curso escolar, DNA didactic, pone a disposición de centros, profesores, alumnos y de cualquier persona interesada, una unidad didáctica acerca del ADN. Puedes solicitárnosla por email (disponible en castellano y/o inglés) al email indicado más abajo.

La actividad principal de la unidad es la elaboración de una maqueta de ADN en 3D a partir de cualquier cilindro o canuto de cartón con los que se envuelven productos comerciales (papel cocina, papel de  aluminio, telas,…) que normalmente desechamos. ¡Una nueva vida en favor del reciclaje! 😉La unidad didáctica, además de la descripción detallada de su proceso de construcción, está acompañada de consideraciones y otras actividades sobre la maqueta realizada.

Los cilindros a utilizar suelen presentar un trazado espiral formado por la junta de los dos pliegos del cartón. Ese trazado espiral es el que inicialmente utilizaremos como guía para la elaboración de la maqueta, y al seguir el procedimiento descrito en la unidad, conseguiremos que presente a escala muchos de los parámetros geométricos que caracterizan al ADN real.

No obstante, también añadimos las instrucciones para que el modelo elaborado presente todas las dimensiones geométricas escaladas con las del ADN real, para los que deseen hacerlo así.

Si estás interesad@ en recibir un PDF de la unidad didáctica (disponible en castellano y/o inglés) debes solicitar el envío escribiéndonos un e-mail a “gerardo(arroba)dnadidactic.com” con el asunto “ADN canuto”, y especificando el idioma en que deseas recibir la unidad didáctica.

Sólo pedimos a cambio que, una vez termines la maqueta, nos envíes tus comentarios y una/s foto/s  a la misma dirección de e-mail con el asunto: “Maqueta terminada”.

¡Esperamos que lo disfrutéis! 🙂

Posted in Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , , , , , | Leave a comment
22
junio

ADN TARTAMUDO (III)

En este post , abundando en el mismo tema, os retamos a  realizar ejercicios prácticos. Un buen entretenimiento para las vacaciones.

Como ejercicio práctico, vamos a proponer que se determine el parentesco entre 20 perfiles genéticos. Y lo vamos a hacer simplificando a sólo 8 locus STR independientes ( que nombraremos A,B,C,D,E,F,G y H  y cada uno de ellos con sólo  6 alelos diferentes (numerados del 1 al 6).

Perfiles familia para encontrar parentescoPerfiles genéticos simplificados. V= varón; H= hembra

1.-Entre los 20 perfiles genéticos que proponemos se encuentran los de una misma familia: abuelos, padres-tíos, y nietos  e indicamos, además que en total son entre 8 y 14 miembros. El resto no son familiares. ¿Podrías averiguar los perfiles de cada uno por su parentesco indicando el número que identifica cada perfil?.

Nota: para que sea más fácil encontrarlos vamos a dar una pista: el perfil nº 10 corresponde a una nieta.

2.-Y, otra cosa…¿qué variabilidad y discriminación entre la población -suponiendo que todas las combinaciones de los alelos sean equiprobables-  se obtendría en este caso simplificado. Es decir, para 8 locus independientes y 6 alelos/locus?.

3.- Y ya, para rizar el rizo, ¿Podrías calcular las probabilidades en alelos coincidentes entre 2 hermanos en sus genotipos para los 8 locus STR? Es decir, que no tengan ninguna, que tengan sólo una coincidencia, que tengan 2, que tengan 3, 4, 5…….. hasta que coincidan en todos.

Las respuestas parciales o completas se pueden remitir con asunto: “ADN tartamudo” a info@dnadidactic.com  Posiblemente habrá alguna sorpresa para los participantes a la vuelta de vacaciones. Plazo: hasta el 31 de Agosto de 2017: todo un verano para entretenerse resolviendo estas cuestiones.

Posted in alelos STR, Artículos, CODIS (Combined DNA index system), DNA Didactic, locus STR (Short tandem repeat), Para estudiantes BACH, Para estudiantes ESO, perfil genético | Leave a comment
22
junio

ADN TARTAMUDO (II)

 

En el post anterior comentábamos que la combinación de los 2 alelos (genotipo) de cada locus STR en los 13 locus STR diferentes situados en los cromosomas homólogos de cada individuo indica su particular perfil genético. A este sistema de identificación también se le denomina CODIS (Combined DNA index system)

Pues bien en cada par de cromosomas que tenemos, uno de ellos ha sido recibido de un progenitor (padre biológico) y el otro homólogo del otro progenitor (madre biológica). De modo que si tenemos en un locus STR determinado la combinación o Genotipo (9, 12),  el 9 tiene que figurar en la combinación de uno de los progenitores (padre o madre biológicos) y el 12 en el otro progenitor (madre o padre biológicos) y lo mismo con los 12 restantes locus STR.

transmisión padres-hijosEn la figura ejemplo simplificado de transmisión de locus STR (Sólo 6 locus (A-F), con 6 alelos/locus cada uno (1-6) ).

En esto se basan las pruebas de ADN para determinar la paternidad/filiación. Para determinar otros tipos de parentesco, los perfiles genéticos no son  determinantes de modo absoluto, sino que se basan en  porcentajes de coincidencias. Así, por ejemplo, 2 hermanos tienen un porcentaje de coincidencia medio del 50%. Coincidirían, por término medio, en la mitad de los números entre las 13 combinaciones del perfil. Habrá hermanos que tengan más y otros que tengan menos, incluso podrían no coincidir en ninguno si hubiesen recibido de cada progenitor el cromosoma homólogo contrario al recibido  por el otro hermano, aunque será un caso muy poco probable. E, igualmente, por el motivo opuesto hasta podrían coincidir en todos.

Posted in alelos STR, Artículos, CODIS (Combined DNA index system), locus STR (Short tandem repeat), Para estudiantes BACH, Para estudiantes ESO, perfil genético | Leave a comment
21
junio

ADN TARTAMUDO (I)

En el conjunto del ADN (genoma) existen secuencias que se repiten.  El tamaño de dichas secuencias en ocasiones es muy largo (Kb) ;  en otras, sólo centenares de pares de bases y también las hay de unos pocos pares de bases. El número de veces que se repiten también es muy variable. Algunas lo hacen miles de veces. Esas secuencias repetidas pueden estar dispersas en diferentes lugares del largo filamento de ADN o pueden estar situadas seguidas unas de otras. De estas secuencias repetidas seguidas – se les denomina repeticiones en tándem – a las que podemos considerar como “tartamudas”, es de lo que vamos a hablar en este post. Más concretamente de las de pequeño tamaño, y con un número de repeticiones no muy elevado,  conocidas en el argot biológico como secuencias STR (Short Tadem Repeat: repeticiones en tándem de secuencias cortas). Un ejemplo de secuencia STR indicada en una de las hebras del ADN:.. …. 5´ GCGTA GCGTA GCGTA GCGTA GCGTA GCGTA GCGTA 3´……. Secuencia de 5 pb que, en este caso se repite 7 veces seguidas.

adn tartamudo 1adn tartamudo 2adn tartamudo 3adn tartamudo 4Representación esquemática de una secuencia STR con diferente nº de repeticiones en cada caso

Todavía se desconoce el papel biológico que desempeñan este tipo de secuencias, pero tienen su utilidad,  ya que se ha comprobado que el número de repeticiones es variable entre los miembros de la población. Son como un gen con múltiples “alelos” diferentes por el nº de repeticiones, ya que según su número,  serán secuencias más cortas o más largas. Serán locus polimórficos de longitud. Y así, por su longitud es como se las detecta en los análisis.

Catalogados muchos de estos locus en el genoma humano se ha visto que para cada uno de ellos, en la población,  existe una variabilidad definida. Por ejemplo: entre 7 y 15 repeticiones o tartamudeos. Por tanto todas las personas tendremos: 7, 8, 9, 10, 11, 12, 13, 14 o 15 repeticiones; o sea, 9 variantes o alelos para ese locus.

En el ADN de la población humana existen muchos locus STR, situados en diferentes cromosomas o en lugares diferentes del mismo cromosoma, aunque cada secuencia STR específica ocupa siempre el mismo locus.  Cada individuo tiene 2 cromosomas homólogos y en sus locus homólogos STR tendrán un alelo igual o diferente en cuanto al nº de repeticiones, o sea, de igual o distinta longitud. Siguiendo con el ejemplo anterior una persona puede ser  (7, 12) o (8,14) o (9,13) ó (15,15) ó……cualesquiera de las combinaciones de 2 e 2 para los 9 alelos: total 45 posibles combinaciones o genotipos. ( n(n+1)/2 ; en este caso  9 x10/2 =45).,

Si escogemos un número suficiente  de esos locus presentes en la población humana para que la variabilidad en el conjunto de todos ellos y  situados en diferentes cromosomas para que la transmisión sea independiente, podremos identificar a cada individuo por el conjunto de variantes de locus STR. Se ha comprobado que con 13 de esos locus, en sus combinaciones de 2 en 2 para cada uno, serían suficientes para identificar a un individuo entre varios miles de millones de ellos que presentarán otras combinaciones diferentes.

Siguiendo con el ejemplo anterior: Para uno de esos locus 45 posibles combinaciones, y suponiendo que los 12 locus restantes tengan la misma variabilidad (9 alelos, que en muchos de esos 12 locus restantes es incluso mayor), y al ser independientes,  la variabilidad sería de 45x45x45x45x45x…..(hasta 13 veces) = 4513 = muchos cuatrillones de combinaciones o genotipos diferentes. Se puede decir que podríamos identificar a cada persona humana particular desde que existe la humanidad por el análisis de esos 13 genes. Sólo en las personas gemelos univitelinos serían coincidentes. Dicho de otro modo, la probabilidad de que 2 individuos , escogidos al azar, coincidieran en las 13 combinaciones sería = 0, 000.000.000.000.000.000.000.0001%; o dicho de otra forma la probabilidad de que esa combinación fuese única =99,999.999.999.999.999.999.999.999 %.

Para los cálculos anteriores hemos considerado que cada uno de los alelos de cada locus tiene exactamente la misma probabilidad de estar presente en la población que cualquiera de los restantes y, por tanto, cada una de las 45 posibilidades de cada locus tenga la misma probabilidad de presentarse.  En las poblaciones humanas reales, algunos alelos son más frecuentes que otros por lo que la probabilidad real se reduce un poco;  1 entre varios miles de millones = 99,999.999.999.999% de que cada combinación personal sea única.

Esa combinación de 13 pares de números es lo que actualmente conocemos como perfil genético o DNI genómico y como se puede comprobar, sólo analiza una pequeñísima parte del ADN. Una parte del ADN no codificante (denominado anteriormente ADN basura). Una parte del ADN que –por lo que actualmente conocemos- no influye para nada en los caracteres biológicos de cada individuo.

Y sin embargo, el ADN de cada persona se identifica por su “tartamudeo” específico. Todos somos tartamudos y  cada persona  tiene su peculiar forma de tartamudear. Y eso es lo que nos identifica genéticamente.

Posted in alelos STR, Artículos, CODIS (Combined DNA index system), DNA Didactic, locus STR (Short tandem repeat), Noticias, Para estudiantes BACH, Para estudiantes ESO, perfil genético | Leave a comment