alelos STR

7
noviembre

Matemáticas y ADN (5)

Genes, alelos y Genotipos

En esta ocasión vamos a intentar buscar una relación matemática entre las diferentes variantes (alelos) que puede presentar un gen  y el número de combinaciones binarias (genotipos) entre ellos en las especies diploides.

Empecemos, como siempre, por el caso más sencillo: 2 variantes o alelos para el mismo gen que, como siempre, ocuparán el mismo locus cromosómico.

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 y A2

 

(2)

1- A1 A1

2- A2 A2

1- A1 A2

(*)

2 homozigóticos

1 heterozigóticos

2 posibles 1 posible 3 posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 y A3

 

 

 

(3)

1-A1 A1

2- A2 A2

3- A3 A3

1-A1 A2

2- A1 A3

3- A2 A3

(*)

3 homozigóticos

3 heterozigóticos

3 posibles 3 posibles 6 posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 y A4

 

 

 

 

 

 

(4)

1-A1 A1

2- A2 A2

3- A3 A3

4- A4 A4

1-A1 A2

2-A1 A3

3-A1 A4

4-A2 A3

5-A2 A4

6-A3 A4

(*)

4 homozigóticos

6 heterozigóticos

4 posibles  6 posibles 10  posibles

 

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 , A4 y A5

 

 

 

 

 

 

 

 

 

 

(5)

A1 A1

A2 A2

A3 A3

A4 A4

A5 A5

A1 A2

A1 A3

A1 A4

A1 A5

A2 A3

A2 A4

A2 A5

A3 A4

A3 A5

A4 A5

(*)

5 homozigóticos

10 heterozigóticos

5  posibles  10  posibles 15  posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 , A4 , A5 y  A6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(6)

1-A1 A1

2- A2 A2

3- A3 A3

4- A4 A4

5- A5 A5

6- A6 A6

1-A1 A2

2- A1 A3

3- A1 A4

4- A1 A5

5- A1 A6

6- A2 A3

7- A2 A4

8- A2 A5

9- A2 A6

10- A3 A4

11- A3 A5

12- A3 A5

13- A4 A5

14- A4 A6

15- A5 A6

(*)

6 homozigóticos

15 heterozigóticos

6  posibles  15  posibles 21  posibles

 

(*) La combinación A1 A2 es la misma que A2A1 y por ello no se consideran como 2 combinaciones diferentes; y lo mismo A1 A3=A3 A1; A2 A4 = A4 A2,….. y así sucesivamente.

Por tanto:

Nº alelos Nº de Homozigotos Nº Heterozigotos Total genotipos
2 2 1 3
3 3 3 6
4 4 6 10
5 5 10 15
6 6 15 21

 

Conclusiones:

1.-  Parece seguro que el nº de homozigóticos coincide con el nº de alelos; si llamamos “n “ al nº de variantes alélicas (variable principal), el nº de genotipos homozigóticos para cualquier nº “n” será igual a “n”.

2.- Con el nº de heterozigóticos, en función de “n” parece que no es tan simple encontrar una relación: De 2, sólo 1; de 3 salen 3, de 4 salen 6, de 5 salen 10, de 6 salen 15, de “n”….saldrían?.

Podemos probar con el total de genotipos para ver si es más fácil la relación y luego descontar los homozigotos: de 2 salen 3; de 3 salen 6; de 4 salen 10; de 5 salen 15 de 6 salen 21, de “n”… parece que n . (n+1)/2 nos cuadra con cualquiera de los resultados obtenidos. 2×3/2 =3;  3×4/2=6;  4 x5/2 =10;  5×6/2 =15;  6×7/2=21.

Por lo que parece esta fórmula funciona, así que para el cálculo de los heterozigóticos = nºTotal – nº homozigóticos = n.(n+1)/2 –n  = (n. (n+1)-2n)/2  =  (n(n+1-2))/2  =  n(n-1)/2

Veamos si cumple: para 2, 2×1/2 =1; para 3, 3×2/2 =3; para 4,  4×3/2=6; para 5,  5×4/2 =10; para 6, 6×5/2 =15,… Vemos que se cumple también la fórmula en todos los casos.

Nota: Otra forma de calcular el nº total de genotipos que da resultado es  N= n +(n-1)+ (n-2)+ (n-3) +…….(n-(n-1)). Así para 5 alelos N= 5+4+3+2+1 = 15 genotipos.

Nota: para los que conocen combinatoria matemática, los heterozigóticos serían combinaciones (donde el orden no importa)  sin repetición de “n” elementos tomados de 2 en 2 = = n!/2! (n-2)! =n. (n-1).(n-2). (n-3)…/2. (n-2). (n-3)…= n (n-1)/2

Así para 2 alelos = 2!/2!(2-2)! = 2/ 2 =1  , recuérdese que 0!=1

Así para 3 alelos =3!/2! (3-2)! = 6/2 = 3

Así para 4 alelos = 4!/2! (4-2)! = 24/4= 6

Así para 5 alelos = 5!/2!(5-2)! = 120/12 =10

Lo mismo para el resto de alelos.

Por tanto y generalizando:

Nº alelos Nº de Homozigotos Nº Heterozigotos Total
n n n.(n-1)/2 n.(n+1)/2

 

Cualquier gen que presente “n” variantes (alelos), el nº de genotipos posibles será n. (n+1)/ 2, de los cuales “n” será el nº de genotipos homozigóticos y,   n. (n-1)/2 corresponderá con el nº de genotipos heterozigóticos posibles.

Los genes que presentan más de 2 alelos posibles se denominan genes con alelomorfismo múltiple.

Un ejemplo sencillo  de genes con alelomorfismo múltiple son los que determinan el grupo sanguíneo humano del Sistema ABO, siendo 3 los alelos posibles (A, B y O). Los genotipos homozigóticos serán 3: AA, BB y OO y los genotipos heterozigóticos, otros 3: AB, AO, BO. En este caso la diferente potencia de expresión de los diferentes alelos A=B>O, implica que los fenotipos resultantes sean A, B, O,  AB, A y B respectivamente. Sólo 4 fenotipos para 6 genotipos posibles. Como se ve, los fenotipos posibles dependerán de la fuerza expresiva que posean las diferentes variantes (alelos) del  gen en cuestión.

 

Otro caso humano de alelomorfismo múltiple es el caso de los genes STR. Los genes STR son genes situados en diferentes posiciones de la molécula del ADN nuclear humano que se caracterizan por presentar una secuencia corta de bases (Short=Corta) (la misma en cada gen STR) repetida a continuación una de otra  en un número de repeticiones bastante variado (Tandem Repeat= repetidas en tándem). Por ejemplo……..ACTG ACTG ACTG ACTG ACTG ACTG…… Esta secuencia se repite en el mismo locus o posición de la molécula de ADN de todos las personas y el nº de repeticiones puede variar entre, por ejemplo 6 a 18 veces. Por tanto, los alelos  o variantes posibles serán 6 repeticiones, 7, repeticiones, 8 repeticiones, nueve repeticiones,…….. y así hasta 18 repeticiones. Es decir 13 alelos diferentes. Las personas tendrán un genotipo concreto de entre los 13×14/2= 91 genotipos posibles. Así, por ejemplo un individuo será (11, 11) ó (8,18) ó ( 9, 16 ) ó cualquier combinación de 2 nºs de repeticiones entre el 6 y el 18. Se pueden analizar al detectar y diferenciarlos  por su longitud en electroforesis.

Estos genotipos, que se sepa, no determinan ningún fenotipo ni externo ni interno de cada individuo (aparentemente no tienen función fisiológica ninguna), pero se pueden analizar y diferenciar individuos por ellos. Así, analizando los 91 genotipos posibles para ese gen STR diferenciamos a 1 individuo entre 91 posibles.

El análisis de uno sólo de esos genotipos nos diferencia a una persona entre 91, pero  como en el ADN hay más lugares con repeticiones STR (con otra secuencia y con igual o superior nº de repeticiones en tándem y situados en diferentes cromosomas), la combinación de varios de esos locus nos amplía considerablemente y en progresión geométrica la diferenciación individual.

Por ejemplo:

Gen o Locus STR Secuencia repetida Localizado en el cromosoma…. Nº de variantes o alelos Diferenciación de Genotipos Diferenciación conjunta

(*)

STR 1 ACTG 2 13 13×14/2= 91;

1 de 91

 

1 de 91

STR 2 TATGC 4 9 9 x10/2 = 45

1 de 45

91 x 45 = 4.095

1 de 4.095

STR 3 GCTACC 7 18 18×19/2= 171

 

1 de 171

4.095 x 171 =

700.245

1 de 700.245

STR 4 TTAAG 13 14 14 x15/2 =105

 

1 de 105

700.245 x 105 =73.525.725

1 entre 7,5 millones

STR 5 CCGAT 18 20 20×21/2 = 210

 

1 de 210

73.525.725 x 210 = 15.440.402.250

1 entre 15,4 miles de millones

(*) Al ser cada locus STR independiente de cualquier otro, cada uno de ellos admite cualquier combinación del otro, por ello se multiplican las combinaciones al considerarlas conjuntamente.

Nota: los alelos STR del ejemplo son inventados. En realidad son muy similares y valen como ejemplo.

Analizando sólo 5 genes STR del genoma humano (siempre que se localicen en cromosomas diferentes para que sean genes independientes), podemos diferenciar por el genotipo conjunto de los 5 genes  a 1 persona entre 15, 4 miles de millones de personas.

El perfil genético que usa la policía en sus análisis de ADN (tan utilizado en cualquier delito) analiza nada menos que entre 13 y 16  de esos locus STR y así puede afirmar categóricamente –con una certeza muy próxima al 100%- de qué individuo se trata (siempre que tenga archivado el perfil genético de esa persona o que al sospechoso se le haga un análisis de su perfil genético y concuerde o no para confirmar su culpabilidad o inocencia).

El hecho de no poder llegar a una certeza absoluta del 100% se debe principalmente al hecho de que existen alelos y genotipos más frecuentes que otros en las poblaciones para los diferentes genes STR y no del modo que nosotros lo hemos considerado, con igualdad de posibilidades para todos ellos. Con todo, la coincidencia proporciona una confirmación del 99,99% o incluso mayor.

Estos análisis de perfil genético nos  sirven, además, para determinar parentescos entre personas. De los 2 alelos que una persona posee en cualquiera de sus genes STR, uno de ellos lo ha recibido de su padre biológico y el otro de su madre. Por tanto, el padre o supuesto padre biológico tiene que  tener en sus dos alelos de cada uno de los genes STR, uno de los 2 que posee el hijo o supuesto hijo; y lo mismo con la madre o supuesta madre.

Ver artículos en nuestro blog: http://bit.ly/235x0oa .  http://bit.ly/2opCTQF . Y el documento de perfiles genéticos: http://bit.ly/2x7fs2E

En las demandas judiciales de paternidad –tan de actualidad en estos días con respecto a personas famosas-  estas pruebas de comparación de perfiles genéticos constituyen una prueba fundamental. También para otro grado de parentesco pero no con tanta fiabilidad.

Posted in alelos STR, Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment
22
junio

ADN TARTAMUDO (III)

En este post , abundando en el mismo tema, os retamos a  realizar ejercicios prácticos. Un buen entretenimiento para las vacaciones.

Como ejercicio práctico, vamos a proponer que se determine el parentesco entre 20 perfiles genéticos. Y lo vamos a hacer simplificando a sólo 8 locus STR independientes ( que nombraremos A,B,C,D,E,F,G y H  y cada uno de ellos con sólo  6 alelos diferentes (numerados del 1 al 6).

Perfiles familia para encontrar parentescoPerfiles genéticos simplificados. V= varón; H= hembra

1.-Entre los 20 perfiles genéticos que proponemos se encuentran los de una misma familia: abuelos, padres-tíos, y nietos  e indicamos, además que en total son entre 8 y 14 miembros. El resto no son familiares. ¿Podrías averiguar los perfiles de cada uno por su parentesco indicando el número que identifica cada perfil?.

Nota: para que sea más fácil encontrarlos vamos a dar una pista: el perfil nº 10 corresponde a una nieta.

2.-Y, otra cosa…¿qué variabilidad y discriminación entre la población -suponiendo que todas las combinaciones de los alelos sean equiprobables-  se obtendría en este caso simplificado. Es decir, para 8 locus independientes y 6 alelos/locus?.

3.- Y ya, para rizar el rizo, ¿Podrías calcular las probabilidades en alelos coincidentes entre 2 hermanos en sus genotipos para los 8 locus STR? Es decir, que no tengan ninguna, que tengan sólo una coincidencia, que tengan 2, que tengan 3, 4, 5…….. hasta que coincidan en todos.

Las respuestas parciales o completas se pueden remitir con asunto: “ADN tartamudo” a info@dnadidactic.com  Posiblemente habrá alguna sorpresa para los participantes a la vuelta de vacaciones. Plazo: hasta el 31 de Agosto de 2017: todo un verano para entretenerse resolviendo estas cuestiones.

Posted in alelos STR, Artículos, CODIS (Combined DNA index system), DNA Didactic, locus STR (Short tandem repeat), Para estudiantes BACH, Para estudiantes ESO, perfil genético | Leave a comment
22
junio

ADN TARTAMUDO (II)

 

En el post anterior comentábamos que la combinación de los 2 alelos (genotipo) de cada locus STR en los 13 locus STR diferentes situados en los cromosomas homólogos de cada individuo indica su particular perfil genético. A este sistema de identificación también se le denomina CODIS (Combined DNA index system)

Pues bien en cada par de cromosomas que tenemos, uno de ellos ha sido recibido de un progenitor (padre biológico) y el otro homólogo del otro progenitor (madre biológica). De modo que si tenemos en un locus STR determinado la combinación o Genotipo (9, 12),  el 9 tiene que figurar en la combinación de uno de los progenitores (padre o madre biológicos) y el 12 en el otro progenitor (madre o padre biológicos) y lo mismo con los 12 restantes locus STR.

transmisión padres-hijosEn la figura ejemplo simplificado de transmisión de locus STR (Sólo 6 locus (A-F), con 6 alelos/locus cada uno (1-6) ).

En esto se basan las pruebas de ADN para determinar la paternidad/filiación. Para determinar otros tipos de parentesco, los perfiles genéticos no son  determinantes de modo absoluto, sino que se basan en  porcentajes de coincidencias. Así, por ejemplo, 2 hermanos tienen un porcentaje de coincidencia medio del 50%. Coincidirían, por término medio, en la mitad de los números entre las 13 combinaciones del perfil. Habrá hermanos que tengan más y otros que tengan menos, incluso podrían no coincidir en ninguno si hubiesen recibido de cada progenitor el cromosoma homólogo contrario al recibido  por el otro hermano, aunque será un caso muy poco probable. E, igualmente, por el motivo opuesto hasta podrían coincidir en todos.

Posted in alelos STR, Artículos, CODIS (Combined DNA index system), locus STR (Short tandem repeat), Para estudiantes BACH, Para estudiantes ESO, perfil genético | Leave a comment
21
junio

ADN TARTAMUDO (I)

En el conjunto del ADN (genoma) existen secuencias que se repiten.  El tamaño de dichas secuencias en ocasiones es muy largo (Kb) ;  en otras, sólo centenares de pares de bases y también las hay de unos pocos pares de bases. El número de veces que se repiten también es muy variable. Algunas lo hacen miles de veces. Esas secuencias repetidas pueden estar dispersas en diferentes lugares del largo filamento de ADN o pueden estar situadas seguidas unas de otras. De estas secuencias repetidas seguidas – se les denomina repeticiones en tándem – a las que podemos considerar como “tartamudas”, es de lo que vamos a hablar en este post. Más concretamente de las de pequeño tamaño, y con un número de repeticiones no muy elevado,  conocidas en el argot biológico como secuencias STR (Short Tadem Repeat: repeticiones en tándem de secuencias cortas). Un ejemplo de secuencia STR indicada en una de las hebras del ADN:.. …. 5´ GCGTA GCGTA GCGTA GCGTA GCGTA GCGTA GCGTA 3´……. Secuencia de 5 pb que, en este caso se repite 7 veces seguidas.

adn tartamudo 1adn tartamudo 2adn tartamudo 3adn tartamudo 4Representación esquemática de una secuencia STR con diferente nº de repeticiones en cada caso

Todavía se desconoce el papel biológico que desempeñan este tipo de secuencias, pero tienen su utilidad,  ya que se ha comprobado que el número de repeticiones es variable entre los miembros de la población. Son como un gen con múltiples “alelos” diferentes por el nº de repeticiones, ya que según su número,  serán secuencias más cortas o más largas. Serán locus polimórficos de longitud. Y así, por su longitud es como se las detecta en los análisis.

Catalogados muchos de estos locus en el genoma humano se ha visto que para cada uno de ellos, en la población,  existe una variabilidad definida. Por ejemplo: entre 7 y 15 repeticiones o tartamudeos. Por tanto todas las personas tendremos: 7, 8, 9, 10, 11, 12, 13, 14 o 15 repeticiones; o sea, 9 variantes o alelos para ese locus.

En el ADN de la población humana existen muchos locus STR, situados en diferentes cromosomas o en lugares diferentes del mismo cromosoma, aunque cada secuencia STR específica ocupa siempre el mismo locus.  Cada individuo tiene 2 cromosomas homólogos y en sus locus homólogos STR tendrán un alelo igual o diferente en cuanto al nº de repeticiones, o sea, de igual o distinta longitud. Siguiendo con el ejemplo anterior una persona puede ser  (7, 12) o (8,14) o (9,13) ó (15,15) ó……cualesquiera de las combinaciones de 2 e 2 para los 9 alelos: total 45 posibles combinaciones o genotipos. ( n(n+1)/2 ; en este caso  9 x10/2 =45).,

Si escogemos un número suficiente  de esos locus presentes en la población humana para que la variabilidad en el conjunto de todos ellos y  situados en diferentes cromosomas para que la transmisión sea independiente, podremos identificar a cada individuo por el conjunto de variantes de locus STR. Se ha comprobado que con 13 de esos locus, en sus combinaciones de 2 en 2 para cada uno, serían suficientes para identificar a un individuo entre varios miles de millones de ellos que presentarán otras combinaciones diferentes.

Siguiendo con el ejemplo anterior: Para uno de esos locus 45 posibles combinaciones, y suponiendo que los 12 locus restantes tengan la misma variabilidad (9 alelos, que en muchos de esos 12 locus restantes es incluso mayor), y al ser independientes,  la variabilidad sería de 45x45x45x45x45x…..(hasta 13 veces) = 4513 = muchos cuatrillones de combinaciones o genotipos diferentes. Se puede decir que podríamos identificar a cada persona humana particular desde que existe la humanidad por el análisis de esos 13 genes. Sólo en las personas gemelos univitelinos serían coincidentes. Dicho de otro modo, la probabilidad de que 2 individuos , escogidos al azar, coincidieran en las 13 combinaciones sería = 0, 000.000.000.000.000.000.000.0001%; o dicho de otra forma la probabilidad de que esa combinación fuese única =99,999.999.999.999.999.999.999.999 %.

Para los cálculos anteriores hemos considerado que cada uno de los alelos de cada locus tiene exactamente la misma probabilidad de estar presente en la población que cualquiera de los restantes y, por tanto, cada una de las 45 posibilidades de cada locus tenga la misma probabilidad de presentarse.  En las poblaciones humanas reales, algunos alelos son más frecuentes que otros por lo que la probabilidad real se reduce un poco;  1 entre varios miles de millones = 99,999.999.999.999% de que cada combinación personal sea única.

Esa combinación de 13 pares de números es lo que actualmente conocemos como perfil genético o DNI genómico y como se puede comprobar, sólo analiza una pequeñísima parte del ADN. Una parte del ADN no codificante (denominado anteriormente ADN basura). Una parte del ADN que –por lo que actualmente conocemos- no influye para nada en los caracteres biológicos de cada individuo.

Y sin embargo, el ADN de cada persona se identifica por su “tartamudeo” específico. Todos somos tartamudos y  cada persona  tiene su peculiar forma de tartamudear. Y eso es lo que nos identifica genéticamente.

Posted in alelos STR, Artículos, CODIS (Combined DNA index system), DNA Didactic, locus STR (Short tandem repeat), Noticias, Para estudiantes BACH, Para estudiantes ESO, perfil genético | Leave a comment