DNA Didactic

16
mayo

Química y ADN (3)

Cuantificar el ADN.- 3

En el post anterior vimos cómo los científicos disponen de cantidades irrisoria de ADN para realizar sus investigaciones.

Una forma de obtener más cantidad de ADN, que al menos, nos haga disponer de cantidades mayores en varios rangos de magnitud (ng o incluso µg) es la técnica de la PCR (Polymerase Chain Replication), que viene a ser como una fotocopiadora de un fragmento de ADN produciendo varios miles de copias idénticas, incluso millones de las mismas. Esto eleva la cantidad 1 o 2 rangos más la magnitud de la cuantía. Aun así, se obtienen nanogramos o microgramos.

Volvemos con la misma pregunta: ¿Es posible que una balanza nos mida la cantidad de ADN en esas cantidades tan exiguas? Tampoco es posible. Entonces, ¿cómo cuantificamos el ADN que tenemos para trabajar? Vamos a ello.

El ADN tiene otra peculiaridad peculiar: su absorbancia específica. Esta propiedad significa que absorbe la luz (radiación electromagnética) en una determinada longitud de onda, la de 260 nm, una radiación concreta dentro de la franja del ultravioleta. Además, dicha absorbancia es proporcional a la cantidad de ADN presente. Tener un aparato –espectrofotómetro- que mida la absorbancia obtenida en una muestra con ADN, traduce  la cantidad de ADN presente. Así es como se cuantifica el ADN presente y es una forma indirecta de hacerlo.

Aunque no es lo mismo, como analogía, nos puede servir el ejemplo del café: sólo, más o menos cortado o con más o menos leche. Observando su color, podemos determinar la mayor o menor cantidad de café presente.

Los científicos han calibrado los espectrofotómetros con cantidades de ADN conocidas para servir como referencia a cualquier otra cantidad. Así es como conseguimos determinar las cantidades exactas (en unidades de masa) con las que se trabaja.

Absorbancia: La espectrofotometría es un método científico utilizado para medir cuanta luz absorbe una sustancia química, midiendo la intensidad de la luz cuando un haz luminoso pasa a través de la solución muestra, basándose en la ley de Beer – Lambert.  Esta medición también puede usarse para medir la cantidad de un producto químico conocido en una sustancia.

Ley de Beer – Lambert: A = – log10 I1 /I0 , siendo A la medida de la absorbancia, I1 la intensidad de la luz al salir  e I0 la intensidad de la misma al entrar.

El ADN tiene la peculiaridad de presentar absorbancia específica con un determinado tipo de luz uV a 260 nm de longitud de onda.

Posted in Artículos, Cuantificar el ADN, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , | Leave a comment
24
abril

DIA DEL ADN 2018

25 de Abril de 1953. La revista científica “Nature” publica el famoso trabajo de Watson y Crick sobre la estructura del ADN.  Este trabajo supuso una auténtica revolución en Biología y constituyó la  base para múltiples investigaciones y descubrimientos posteriores que han revolucionado todos los campos donde la aplicación de los conocimientos biológicos han tenido lugar. Esa fecha es la que la comunidad internacional ha adoptado para celebrar cada año el día del ADNN. 65 años después nos encontramos en pleno siglo de la revolución biotecnológica.

La estructura que descubrieron Watson y Crick no es la única – aunque sí la más frecuente y habitual-  que el ADN puede adoptar y, para homenajear este día tan señalado,  vamos a indicar, a través de un cuadro comparativo, las otras dos estructuras que el ADN también puede presentar.  Estas otras estructuras se han denominado A-ADN y Z-ADN,  frente a la habitual de Watson y Crick que se denomina B-ADN. Todas ellas están  constituídas por una doble cadena (2 hebras) de polinucleótidos de ADN complementarias y antiparalelas, retorcidas en forma de doble hélice.

En la imagen puede apreciarse las diferencias estructurales entre las diferentes conformaciones que puede presentar el ADN. Químicamente son todas iguales: todos sus componentes químicos, posiciones de sus enlaces, tanto fuertes  (covalentes) como débiles (puentes de hidrógeno),  son coincidentes. La diferente conformación se debe a que, según condiciones, algunos enlaces pueden adoptar orientaciones diferentes forzando , en cada caso, una estructura distinta sin  romper esa unidad de estructura química.

¡¡¡ FELIZ DIA DEL ADN 2018 !!!

Posted in Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , , , | Leave a comment
31
enero

Control de la expresión génica (III)

Fuente: Imagen Google

 

A nivel de la traducción (formación de la cadena polipeptídica) también existen mecanismos de regulación. En este caso, ya no actúa el ADN que constituye los genes y por eso hablamos de mecanismos que actúan después. El proceso de traducción se produce fuera del nucleo celular en eucariotas. En procariotas, al carecer de nucleo, en el propio hialoplasma de la célula y, además, la transcripción y traducción acostumbran a ser procesos simultáneos. Se traduce al mismo tiempo que se va transcribiendo. En ambos tipos celulares son los ribosomas las “máquinas” que ejecutan dicho proceso.

Hemos mencionado en el artículo anterior la ribointerferencia (ARNi) como uno de estos procesos que impiden la traducción. También existe la acción del propio ARNm que puede actuar como ribointerruptor en el que determinadas secuencias del mismo regulan su propia expresión bien al final de la transcripción o en su proceso de maduración o también en su traducción. Normalmente se produce como consecuencia de la unión a dichas secuencias del ARNm de un metabolito (ligando) que provoca un cambio conformocional del mensajero que provoca una acción sobre la traducción del mismo.

La regulación de la traducción se ejerce fundamentalmente en su iniciación. Ésta es su etapa limitante. Se regula por la formación del complejo de iniciación ribosómico , la actividad de los factores de inicio eIF-2 y eIF-4 y por la influencia de estructuras secundarias en el ARNm.

Por último hay que subrayar que el polipéptido formado como consecuencia del proceso de traducción sufre una serie de modificaciones post-traducionales, algunas de ellas cuando todavía no se ha terminado de formar la totalidad del polipéptido (co-traduccionales). Podemos señalar algunas de ellas: unión de sustituyentes de determinados aminoácidos (acetilación, carboxilación, fosforilación, hidoxilación, Metilación); modificación con lípidos, incorporación de glúcidos,…; así como, en ciertos casos, la rotura del polipéptido formado para la formación de enzimas (ej: tripsina) u hormonas activas (ej: insulina). Todos estos procesos de modificación están regulados por enzimas y cofactores específicos.

Cabe señalar para finalizar –junto con el apartado anterior-  el control del mecanismo del plegamiento del polipéptido o proteína formada, que debe adquirir una conformación tridimensional concreta entre muchas posibles para que sea funcional. Este proceso está controlado por unas proteínas, denominadas carabinas o chaperonas, que mediante la adhesión al polipéptido, de algún modo, le fuerzan a conformarse tridimensionalmente en la forma adecuada.

Indicamos con un ejemplo las consecuencias de un plegamiento anómalo:  la enfermedad de las vacas locas (enfermedad de Creutzfeld –Jacob), fruto  de que la proteína priónica  (PrP) no presenta la conformación adecuada.

Posted in DNA Didactic, Para estudiantes BACH | Tagged , , , , | Leave a comment
29
enero

Control de la expresión génica (II)

(Fuente: Imagen Google)

Un segundo nivel de control de la expresión génica son aquellos que afectan de modo directo a los procesos de transcripción del ADN. Los consideramos como aquellos mecanismos que actúan durante la expresión génica; es decir en el proceso del traslado de  la información del ADN al ARN.

En el proceso de transcripción – conciertas diferencias entre procariotas y eucariotas- existen factores reguladores  de carácter genético ya que están involucradas otras secuencias del propio ADN: las propias secuencias promotoras de los genes (basal, proximal y distal), denominados factores que actúan en “cis” para diferenciarlos de otros factores proteicos, los denominados factores de transcripción (factores que actúan en “trans”) cuyos genes se encuentran alejados de esta región. Son genes cuyas proteínas  normalmente sirven de unión al ADN en las regiones promotoras (basal, proximal y distal) para formar, junto con la ARN polimerasa, el complejo de inicio de la transcripción facilitando el posicionamiento del complejo proteico y llevarla a cabo. Existe toda una gran familia de factores de transcripción (TF) según el tipo de gen a transcribir (para los ARNr, ARNt, o ARNm; es decir, para los genes constitutivos o de mantenimiento);  incluso otros que actúan sobre genes inducibles (llamados también regulables o de expresión diferencial), que habitualmente lo hacen sobre las regiones promotoras distales al gen, tanto para favorecer como para impedir la transcripción.

Mencionaremos muy brevemente el control post-transcripcional o procesamiento del ARNm transcrito primario. Éste sufre una serie de modificaciones previamente a su salida del núcleo celular para formar el ARN maduro funcional (salvo en procariotas que carecen de este proceso de maduración). Todo un conjunto de factores en función de cada tipo de gen, actúan regulando este proceso.

Conviene detenerse, no obstante en esta fase, en un elemento de control que posteriormente actuará controlando la traducción a proteínas . Se trata de los ARNi (ARN interferencia) que se transcriben inicialmente en Micro ARN (pri-Mic-ARN): éste sufre un pequeño procesamiento en el núcleo  (pre-mic-ARN) antes de salir al citoplasma. En el citosol sufre un segundo procesamiento y se asocia a un complejo proteico cuya acción es la de formar por complementariedad de bases  una doble cadena con parte de un ARNm específico para unirse a él, formando un ARN de doble cadena e impedir de ese modo la acción del mecanismo de traducción. Ese ARNm no formará su proteína (polipéptido) o dejará de hacerlo.

Se ha descubierto también otra función de estos micro-ARNs cuando todavía se encuentran en el interior del núcleo celular. Actúan sobre la región promotora de un gen remodelando su fibra cromatínica , ejerciendo, por tanto una regulación pre-transcripcional de represión de la transcripción.

Existen otros mecanismos de control específicos estudiados  para determinados genes inducibles. En algunos de ellos el control se realiza por modificar o no la accesibilidad del ARNm; en otros ejerciendo un control sobre la vida media del mensajero y, por tanto la cantidad de proteína producida. También el control puede realizarse sobre la formación del complejo de iniciación. Se controla bajo la presencia/ausencia de un determinado metabolito celular.

Otra forma de control de la expresión de los genes hace referencia a la cantidad de proteína requerida que, habitualmente se controla con la vida media del ARNm. Si el ARNm tarda en degradarse, actuaría excesivamente y el gen se sobre-expresaría traduciéndose en demasía  y si se degrada con rapidez, apenas se traduciría en proteínas.

Existen diferentes formas de regular esa vida media. Es un proceso que se realiza continuamente en la célula y en el que participan ribonucleasas celulares específicas: endo y exonucleasas,  que,  en función del tipo de gen, su acción es favorecida o impedida por otros mecanismos que podemos resumir en mecanismos constitutivos del propio ARNm, como es el hecho bioquímico de la caperuza en el extremo 5´y la poliadenilización de su extremo 3´ (cola poliA). También se controla por proteínas específicas que se unen al ARNm protegiéndole de su degradación o permitiéndola.

 

 

Posted in Artículos, DNA Didactic, Para estudiantes BACH | Tagged , , , , , , | Leave a comment
26
enero

Control de la expresión génica (I)

Factores externos influyen en la expresión de los genes de nuestro genoma (Fuente: Imagen Google)

El hecho de que todas las células posean la totalidad del genoma de un ser vivo, no quiere decir que sus genes se expresen por igual en ellas, ya que cada tipo celular tiene una fisiología propia y específica correspondiente al tejido y órgano al que pertenece y por eso existen una serie de mecanismos que facilitan o reprimen la expresión de los genes. Esto supone que la expresión de los genes es diferencial: unos se expresan en unas células que en otras no se expresan y al revés. Es cierto, sin embargo, que determinados genes; los genes denominados constitutivos, -aquellos necesarios para las funciones básicas y comunes a todas ellas- se expresan igualmente en todas.

Estos mecanismos actúan en diferentes fases del proceso de expresión y, algunos de ellos pueden estar influídos por factores externos: alimentación, contaminación, hábitos de vida, etc. . Los mecanismos celulares de la expresión génica los podemos considerar como previos, simultáneos y posteriores que se corresponden respectivamente con los 3 post con los que desarrollamos este tema.

Existen diferentes mecanismos que explican esta expresión diferencial  y, posiblemente, la investigación encontrará más o matizará con mayor profundidad  la acción de los que ya se conocen. En este artículo vamos a centrarnos en los mecanismos epigenéticos.Podemos considerarlos como mecanismos que actúan antes de la puesta en marcha de la expresión de los genes.

La epigenética estudia el conjunto de factores -muchos de ellos externos- que, sin alterar las secuencias del ADN, regulan la expresión de sus genes.

En primer lugar tenemos los factores epigenéticos que podemos definir como estructurales. Tienen que ver con la estructura del ADN, más concretamente, con la disposición espacial del mismo en el núcleo celular que impiden que determinadas secuencias del genoma sean inaccesibles para la maquinaria de transcripción y consecuentemente los genes contenidos en esas secuencias no pueden expresarse. Parece ser que la cromatina (ADN +nucleosomas), se encuentra organizada de diferente modo en el núcleo de cada tipo celular, muy “apelotonada” en unos tramos y más suelta en otros. Los tramos apelotonados constituiría lo que denominamos heterocromatina y los genes que contuviera serían inaccesibles a su transcripción. Las secuencias más o menos apelotonadas no tiene que corresponderse con la totalidad del ADN de un cromosoma. Determinados tramos, no necesariamente continuos, de un cromosoma concreto serían accesibles y otros no, ya que la estructura cromatínica puede perfectamente doblarse y plegarse en todas direcciones .

Sería la eucromatina, más suelta y accesible la que podría transcribir los genes contenidos en ella. Es posible que este primer control estructural de la expresión génica esté determinado por factores del entorno celular, siendo  la comunicación química intercelular quien lo determine en gran medida.

Un segundo nivel estructural sería la acetilación de las histonas, componentes de los nucleosomas en los que se enrolla el ADN en primera instancia, formando la estructura de la cromatina. Los nucleosomas acetilados hacen que las uniones entre histonas y ADN para el enrollamiento del ADN en ellos se debiliten y, de este modo el ADN pueda desenrollarse con más facilidad quedando accesible para que pueda realizarse su transcripción. Los nucleosomas desacetilados impiden la expresión de los genes, al estar  la fibra de ADN más firmemente enrollada  en el nucleosoma y no poder desplegarse.

Las células adultas poseen un patrón de acetilación específico -según tejido- que las especializa;  y, si todavía pueden dividirse por mitosis, deshacen este patrón para replicar el ADN y lo vuelven a reproducir en las células hijas, sin que sepamos, por el momento, el mecanismo que produce ese recuerdo. Muy posiblemente este mecanismo esté relacionado con la potencialidad celular de los diferentes tipos de células madre (células troncales), y, por lo que sabemos,  posiblemente sean algunos genes de su propio ADN los encargados de poner en funcionamiento este mecanismo de acetilación-desacetilación de histonas.

También en los nucleosomas se puede producir la metilación de Histonas. Está estudiado el caso de la metilación de las Lisinas 4, 17 y 36 de la Histona 3 del nucleosoma que activa la transcripción, y la metilación de las lisinas 9 y 27 la reprimen. Además se ha observado otras modificaciones en las histonas menos frecuentes con papel  no tan claramente definido.

Otro de los factores epigenéticos que afectan a la expresión de los genes es la metilación del propio ADN, concretamente la metilación de su base Citosina (en el carbono 5 de su anillo pirimidínico; convirtiéndose en 5-Metil Citosina).Las metilaciones producen 2 efectos: por un lado impiden la unión de factores de transcripción en las secuencias promotoras, anulando la transcripción; y por otro lado, cuando se producen en regiones CpG (tramos de ADN donde  el  par G-C es muy abundante), el ADN adopta una conformación tridimensional cerrada (herterocromatina) que anula su acceso para realizar la transcripción. Los tramos hipometilados de ADN se transcriben y los hipermetilados, no. Los tramos metilados de ADN obedecen a un patrón de metilación según el tipo celular. Si ésta se divide, se desmetilan para la replicación , pero vuelven de nuevo a metilarse según el patrón heredado, generando células clonales de patrón de metilación. Cuando, por cualquier circunstancia, se produce una desmetilación en ese patrón, dichas células entran en un proceso neoplásico que resulta proporcional a la gravedad de la enfermedad que producen.

 

Posted in Artículos, DNA Didactic, Para estudiantes BACH | Tagged , , , , , | Leave a comment
10
enero

Matemáticas y ADN (8)

Geometria

La forma geométrica más habitual del ADN (B-ADN) es el de una doble espiral cilíndrica dextrógira.

Los valores concretos de sus dimensiones geométricas varían según el texto que consultemos aunque en unos márgenes relativamente estrechos. Las dimensiones que definen esa doble espiral y que nosotros vamos a tomar son:

1.-Vuelta de hélice (3,4 nm);

2.- Diámetro o ancho de la molécula (2,1 nm);

3.- Número de pares de bases por vuelta de hélice (10);

4.- Surco menor (1,3 nm)

5.- Surco mayor (2,1nm).

Veamos las conclusiones geométricas que podemos deducir de todos ellos.

1.- Angulo pendiente de las espirales en su trazado sobre la superficie cilíndrica que envuelve al ADN.

Tomando 2 datos:

Diámetro del cilindro por el que discurren las espirales es de 2,1nm y la vuelta de hélice (cuando cualquiera de las 2 hebras realiza un giro completo de 360º) es de 3,4 nm.

– si desenrollamos el cilindro en una vuelta de cualquiera de las hélices, el trazado de la hélice sería como el de la figura siguiente:

Con este desarrollo podemos calcular el ángulo pendiente de cada hélice que podemos llamar ángulo de elevación en cualquiera de sus puntos (el mismo en la otra espiral ya que se disponen paralelas entre sí),  ya que su tangente = 3,4/6,59 = 0,5154.

El valor de un ángulo cuya tangente es 0,5154  –consultado en unas tablas de valores de tangentes de ángulos- se corresponde con un ángulo entre 27 y 28º. Tomamos el valor de 27,5º.

Conocemos por tanto el grado de la elevación geométrica de cualquiera de las espirales que forman la estructura básica del ADN.

2.- Se trata ahora de determinar la separación entre ambas espirales.

Sabemos que son paralelas en el trazado (antiparalelas en cuanto a la disposición de sus componentes químicos), pero desconocemos cuánto se separan. Podemos averiguarlo geométricamente. En los gráficos que exponemos a continuación figuran algunos de los posibles trazados de ambas espirales, ambas desenrrolladas sobre la superficie cilíndrica, como en el caso anterior (más o menos juntas). No obstante, debemos elegir aquél cuya distancia vertical entre uno y otro se corresponda con la del Surco menor– distancia que separa las hélices en zonas complementarias-  que es otra característica importante en la estructura de la doble espiral del ADN y que debe ser igual a 1,3 nm.

En los gráficos anteriores, puede observarse que si la separación en vertical (surco menor) tiene que ser de 1,3 nm, dicha separación supone que tiene que existir una distancia en horizontal  (reflejada por las líneas rojas en el desarrollo de la circunferencia del cilindro que comprende las 2 espirales)  también concreta, que podemos calcular por el mismo método utilizado anteriormente.

Así, la tangente del ángulo, que conocemos, será igual a 1,3 dividido por la distancia de separación en la horizontal (despliegue de la circunferencia cilíndrica), representada por la línea de color rojo.

0, 5154 = 1,3nm/x ; x = 1,3nm/0,5154 =  2,5223 nm

Este valor se corresponde con el valor del arco de la circunferencia cilíndrica que separa en todos los puntos de la superficie cilíndrica las dos espirales del ADN a la misma altura.

El valor en grados de ese arco (cerrada la molécula), también podemos calcularlo por una sencilla regla de tres: si los 360º (circunferencia completa) tiene una longitud de π. 2,1nm = 6,597nm; a un arco de 2,5223nm, le corresponderán “x” grados. Así,  “x” = 2,5223 x 360/6,597 = 137,64 º.

Arco de separación de las espirales (1 – 1´) = 137,6º (separación)

 

 

Las 2 espirales del ADN mantendrán en el mismo nivel de su trazado la misma separación 137,6 º a todo lo largo de  su recorrido por la superficie cilíndrica ya que tienen trazado paralelo.

4.- Por otro lado sabemos que por cada vuelta de hélice hay 10 pares de bases. Los pares de bases son la conexión horizontal entre las 2 hélices (se corresponderían con el punto de arranque de los pares de bases que conectan una espiral con la otra: A-T y G-C). Los puntos de conexión reflejados en la figura anterior se repetirán, por tanto, cada vez que el trazado de ambas asciende (también en sentido descendente) 36º, ya que en 360º debe haber 10 conexiones completando la vuelta completa.

Este sería el aspecto geométrico de la molécula de ADN cuando observamos el interior del cilindro en cada vuelta de hélice y volvería a repetirse vuelta tras vuelta puesto que cada  36 º vuelven a coincidir los puntos. Si bien, como las bases que unen una espiral con la otra no son líneas, (como en el gráfico) sino que se extienden con sus superficies y volúmenes correspondientes, este aspecto geométrico quedaría enmascarado.

5.- El surco mayor se correspondería con la distancia vertical entre una espiral y su inmediata complementaria, pero no a la misma altura, sino sobre el trazado en la superficie cilíndrica con la inmediata complementaria superior.

Sería =  valor de la vuelta de hélice – valor del surco menor = 3, 4 – 1,3 = 2,1 nm

6.-Conclusiones.

-Con todos estos valores definimos geométricamente todos los parámetros que caracterizan la estructura tridimensional más común del ADN. La estructura B-ADN.

– Como aspecto anecdótico (¿ó no?) cabe resaltar que B-ADN presenta un conjunto de proporciones aúreas,  o “divinas proporciones”, a las que también se conoce en geometría como “el número de oro”, simbolizado por la letra griega fí (ɸ).

– 1ª. Proporción entre  vuelta de hélice/diámetro de la Base= ɸ

– 2ª. Proporción  entre vuelta de hélice/ surco mayor = ɸ

– 3ª. Proporción surco mayor/ surco menor =ɸ

– 4ª. Proporción arco circunferencia surco mayor/ arco surco menor = ɸ

(tanto si lo medimos en distancia como en grados)

-5ª. Proporción entre valor circunferencia/ arco surco mayor = ɸ

(tanto en distancia como en grados)

Por otro lado:

-Uniendo los puntos 1,2,3….10 del gráfico anterior obtenemos un decágono regular, e igualmente si unimos los puntos 1´, 2´, 3´´,…10´. También el decágono presenta proporciones aúreas: si dividimos el valor del radio de la circunferencia que lo circunscribe, es decir, (1,05 nm: mitad del diámetro de la base= radio) por el valor del lado del decágono (x) ; Así 1,61 (valor de fí) = 1,05/x; x =1,05/1,61 = 0,65 nm, que sería la distancia proyectada en la base que separa los puntos de arranque de 2 pares de bases consecutivas.

-las lineas de los trazados entre bases entre  una y otra de las espirales determinan la formación de un espacio interior que tiene forma de decágono regular. También en este otro decágono se cumple la misma condición anterior.

Como puede comprobarse el ADN, base de la vida, tiene una geometría llena de oro.

Posted in Artículos, DNA curioseando, DNA Didactic, Noticias, Para estudiantes BACH, Para estudiantes ESO | Tagged , , , | Leave a comment
5
diciembre

Matemáticas y ADN (7b)

Genética de Poblaciones (2)

Continuamos con el post anterior para ver si también se cumplen sus conclusiones cuando se trata de genes con más de 2 alelos.

Si hubiera más de 2 alelos para un gen : Por ejemplo 3:  A1, A2, A3

Supongamos que  el cruzamiento inicial es A1 A2 x A2 A3

-Frecuencias génicas iniciales: A1 =1/4 =0,25; A2=2/4=0,5;A3=1/4= 0,25

-La primera generación dará:  1 A1 A2/ 1 A1 A3/ 1 A2 A2 / 1 A2 A3

-Las frecuencias génicas en esta primera generación son :A1 = 2/8 = 1/4 = 0,25; A2= 4/8= 1/2=0,5 y A3 = 2/8 = 1/4=0,25. Es decir que las frecuencias génicas son las mismas que la iniciales.

-Las frecuencias genotípicas son: A1 A2 =  1/4 = 0,25; A1 A3 = 1/4= 0,25; A2 A2 = 1/4=0,25 y A2 A3 = 1/4 = 0,25.

Pasemos a la 2ª generación :

Hagamos todos los cruzamientos posibles:

-La frecuencia de los genes: A1 = 12 +12+ 4 + 4= 32/ A2= 16+ 8 + 24+16 =64/ A3 = 4 +12 +4 +12 =32. Total genes (A1+A2+A3)= 128

Por tanto  la frecuencia de A1 = 32/128 = 0,25; la frecuencia decimal de A2 = 64/128= 0,5 y la de A3 = 32/128 = 0,25. Vemos que las frecuencias de los genes se mantiene.

Vayamos ahora a las frecuencias de los genotipos obtenidos

La suma total de los genotipos obtenidos= 4+16+8+16+116+4= 64

-Frecuencia Genotipo A1 A1= 4/64= 0,0625

-Frecuencia del Genotipo A1 A2 (=A2 A1) = 16/64 = 0,25

-Frecuencia del Genotipo A1 A3 (A3 A1) = 8/64 = 0,125

-Frecuencia del Genotipo A2 A2 = 16/64 = 0,25

-Frecuencia del Genotipo A2 A3 (=A3 A2) = 16/64 = 0,25

-Frecuencia del Genotipo A3 A3 = 4/64 = 0,0625

Si llamamos a la frecuencia génica de A1=a (0,25); de A2=b(0,5) y de A3=c(0,25)

a+b+c= 0,25 + 0,5 + 0,25 = 1

(a +b +c)2 = a2 +b2 +c2 + 2ab + 2ac + 2bc = 0,252 + 0,52 + 0,252 + 2.0,25.0,5 +2.0,25.0,25 + 2. 0,5.0,25 = 0,0625 + 0,25 + 0,0625 +0,25+0,125 + 0,25 = 1

Vemos que también se cumple para 3 genes:

-Frecuencia del genotipo A1 A1 = a2 = 0,0625

-Frecuencia del genotipo A2 A2 = b2 = 0,25

-Frecuencia del genotipo A3A3 = c2 = 0,0625

-Frecuencia del genotipo A1 A2 (= A2 A1)=  2.a.b = 0,25

-Frecuencia del genotipo A1 A3 (=A3 A1) = 2.a.c =  0,125

-Frecuencia del genotipo A2 A3 (A3 A2) = 2.b.c = 0,25

Por tanto, si generalizamos, cuando los cruzamientos en una población se realizan al azar, la frecuencia de los diferentes genotipos en la misma se obtiene a partir de la fórmula polinómica de la suma de las frecuencias génicas de sus diferentes alelos, elevando ésta al cuadrado.

Los sumandos de las frecuencias génicas al cuadrado corresponden a los genotipos homozigóticos y los sumandos restantes a los heterozigóticos.

Por ejemplo: gen con 4 alelos:

(a+b+c+d)2 = a2 + b2 + c2+ d2 + 2ab+ 2ac+ 2ad + 2bc+ 2bd + 2cd

a2 = frecuencia genotipo A1A1

b2= Frecuencia genotipo A2 A2

c2= frecuencia genotipo A3 A3

d2 = frecuencia  genotipo A4 A4

2ab= frecuencia genotipo A1 A2 (=A2A1)

2ac = frecuencia genotipo A1 A3 (=A3 A1)

2ad= frecuencia genotipo A1 A4 (= A4 A1)

2bc = frecuencia genotipo A2 A3 (=A3 A2)

2bd = frecuencia genotipo A2 A4 (=A4 A2)

2cd = frecuencia genotipo A3 A4 (= A4 A3)

Conclusión:

-Las frecuencias génicas y  genotípicas también permanecen constantes en las sucesivas generaciones de las poblaciones en el caso de genes con alelomorfismo múltiple (siempre y cuando los cruzamientos se realicen al azar y no haya variaciones de sus frecuencias génicas tal y como lo  expresamos en nuestro post anterior).

-Se perderá ese equilibrio en caso de variación de sus frecuencias génicas (mutaciones en alelos, emigración de individuos (más de un genotipo que de otros) de la población, inmigración de individuos (idem que en caso anterior) de otras poblaciones, selección de genotipos en la reproducción,…. y, en general cualquier causa que modifique las frecuencias génicas de partida). No obstante, transcurrido este evento, la población volverá a un nuevo equilibrio en sólo una generación posterior si las condiciones vuelven a ser las iniciales.

 

Posted in Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , | Leave a comment
7
noviembre

Matemáticas y ADN (5)

Genes, alelos y Genotipos

En esta ocasión vamos a intentar buscar una relación matemática entre las diferentes variantes (alelos) que puede presentar un gen  y el número de combinaciones binarias (genotipos) entre ellos en las especies diploides.

Empecemos, como siempre, por el caso más sencillo: 2 variantes o alelos para el mismo gen que, como siempre, ocuparán el mismo locus cromosómico.

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 y A2

 

(2)

1- A1 A1

2- A2 A2

1- A1 A2

(*)

2 homozigóticos

1 heterozigóticos

2 posibles 1 posible 3 posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 y A3

 

 

 

(3)

1-A1 A1

2- A2 A2

3- A3 A3

1-A1 A2

2- A1 A3

3- A2 A3

(*)

3 homozigóticos

3 heterozigóticos

3 posibles 3 posibles 6 posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 y A4

 

 

 

 

 

 

(4)

1-A1 A1

2- A2 A2

3- A3 A3

4- A4 A4

1-A1 A2

2-A1 A3

3-A1 A4

4-A2 A3

5-A2 A4

6-A3 A4

(*)

4 homozigóticos

6 heterozigóticos

4 posibles  6 posibles 10  posibles

 

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 , A4 y A5

 

 

 

 

 

 

 

 

 

 

(5)

A1 A1

A2 A2

A3 A3

A4 A4

A5 A5

A1 A2

A1 A3

A1 A4

A1 A5

A2 A3

A2 A4

A2 A5

A3 A4

A3 A5

A4 A5

(*)

5 homozigóticos

10 heterozigóticos

5  posibles  10  posibles 15  posibles

 

 

Alelos Combinaciones binarias iguales o Genotipos Homozigóticos Combinaciones binarias diferentes o Genotipos  heterozigóticos Total de posibles genotipos
A1 ,  A2 , A3 , A4 , A5 y  A6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(6)

1-A1 A1

2- A2 A2

3- A3 A3

4- A4 A4

5- A5 A5

6- A6 A6

1-A1 A2

2- A1 A3

3- A1 A4

4- A1 A5

5- A1 A6

6- A2 A3

7- A2 A4

8- A2 A5

9- A2 A6

10- A3 A4

11- A3 A5

12- A3 A5

13- A4 A5

14- A4 A6

15- A5 A6

(*)

6 homozigóticos

15 heterozigóticos

6  posibles  15  posibles 21  posibles

 

(*) La combinación A1 A2 es la misma que A2A1 y por ello no se consideran como 2 combinaciones diferentes; y lo mismo A1 A3=A3 A1; A2 A4 = A4 A2,….. y así sucesivamente.

Por tanto:

Nº alelos Nº de Homozigotos Nº Heterozigotos Total genotipos
2 2 1 3
3 3 3 6
4 4 6 10
5 5 10 15
6 6 15 21

 

Conclusiones:

1.-  Parece seguro que el nº de homozigóticos coincide con el nº de alelos; si llamamos “n “ al nº de variantes alélicas (variable principal), el nº de genotipos homozigóticos para cualquier nº “n” será igual a “n”.

2.- Con el nº de heterozigóticos, en función de “n” parece que no es tan simple encontrar una relación: De 2, sólo 1; de 3 salen 3, de 4 salen 6, de 5 salen 10, de 6 salen 15, de “n”….saldrían?.

Podemos probar con el total de genotipos para ver si es más fácil la relación y luego descontar los homozigotos: de 2 salen 3; de 3 salen 6; de 4 salen 10; de 5 salen 15 de 6 salen 21, de “n”… parece que n . (n+1)/2 nos cuadra con cualquiera de los resultados obtenidos. 2×3/2 =3;  3×4/2=6;  4 x5/2 =10;  5×6/2 =15;  6×7/2=21.

Por lo que parece esta fórmula funciona, así que para el cálculo de los heterozigóticos = nºTotal – nº homozigóticos = n.(n+1)/2 –n  = (n. (n+1)-2n)/2  =  (n(n+1-2))/2  =  n(n-1)/2

Veamos si cumple: para 2, 2×1/2 =1; para 3, 3×2/2 =3; para 4,  4×3/2=6; para 5,  5×4/2 =10; para 6, 6×5/2 =15,… Vemos que se cumple también la fórmula en todos los casos.

Nota: Otra forma de calcular el nº total de genotipos que da resultado es  N= n +(n-1)+ (n-2)+ (n-3) +…….(n-(n-1)). Así para 5 alelos N= 5+4+3+2+1 = 15 genotipos.

Nota: para los que conocen combinatoria matemática, los heterozigóticos serían combinaciones (donde el orden no importa)  sin repetición de “n” elementos tomados de 2 en 2 = = n!/2! (n-2)! =n. (n-1).(n-2). (n-3)…/2. (n-2). (n-3)…= n (n-1)/2

Así para 2 alelos = 2!/2!(2-2)! = 2/ 2 =1  , recuérdese que 0!=1

Así para 3 alelos =3!/2! (3-2)! = 6/2 = 3

Así para 4 alelos = 4!/2! (4-2)! = 24/4= 6

Así para 5 alelos = 5!/2!(5-2)! = 120/12 =10

Lo mismo para el resto de alelos.

Por tanto y generalizando:

Nº alelos Nº de Homozigotos Nº Heterozigotos Total
n n n.(n-1)/2 n.(n+1)/2

 

Cualquier gen que presente “n” variantes (alelos), el nº de genotipos posibles será n. (n+1)/ 2, de los cuales “n” será el nº de genotipos homozigóticos y,   n. (n-1)/2 corresponderá con el nº de genotipos heterozigóticos posibles.

Los genes que presentan más de 2 alelos posibles se denominan genes con alelomorfismo múltiple.

Un ejemplo sencillo  de genes con alelomorfismo múltiple son los que determinan el grupo sanguíneo humano del Sistema ABO, siendo 3 los alelos posibles (A, B y O). Los genotipos homozigóticos serán 3: AA, BB y OO y los genotipos heterozigóticos, otros 3: AB, AO, BO. En este caso la diferente potencia de expresión de los diferentes alelos A=B>O, implica que los fenotipos resultantes sean A, B, O,  AB, A y B respectivamente. Sólo 4 fenotipos para 6 genotipos posibles. Como se ve, los fenotipos posibles dependerán de la fuerza expresiva que posean las diferentes variantes (alelos) del  gen en cuestión.

 

Otro caso humano de alelomorfismo múltiple es el caso de los genes STR. Los genes STR son genes situados en diferentes posiciones de la molécula del ADN nuclear humano que se caracterizan por presentar una secuencia corta de bases (Short=Corta) (la misma en cada gen STR) repetida a continuación una de otra  en un número de repeticiones bastante variado (Tandem Repeat= repetidas en tándem). Por ejemplo……..ACTG ACTG ACTG ACTG ACTG ACTG…… Esta secuencia se repite en el mismo locus o posición de la molécula de ADN de todos las personas y el nº de repeticiones puede variar entre, por ejemplo 6 a 18 veces. Por tanto, los alelos  o variantes posibles serán 6 repeticiones, 7, repeticiones, 8 repeticiones, nueve repeticiones,…….. y así hasta 18 repeticiones. Es decir 13 alelos diferentes. Las personas tendrán un genotipo concreto de entre los 13×14/2= 91 genotipos posibles. Así, por ejemplo un individuo será (11, 11) ó (8,18) ó ( 9, 16 ) ó cualquier combinación de 2 nºs de repeticiones entre el 6 y el 18. Se pueden analizar al detectar y diferenciarlos  por su longitud en electroforesis.

Estos genotipos, que se sepa, no determinan ningún fenotipo ni externo ni interno de cada individuo (aparentemente no tienen función fisiológica ninguna), pero se pueden analizar y diferenciar individuos por ellos. Así, analizando los 91 genotipos posibles para ese gen STR diferenciamos a 1 individuo entre 91 posibles.

El análisis de uno sólo de esos genotipos nos diferencia a una persona entre 91, pero  como en el ADN hay más lugares con repeticiones STR (con otra secuencia y con igual o superior nº de repeticiones en tándem y situados en diferentes cromosomas), la combinación de varios de esos locus nos amplía considerablemente y en progresión geométrica la diferenciación individual.

Por ejemplo:

Gen o Locus STR Secuencia repetida Localizado en el cromosoma…. Nº de variantes o alelos Diferenciación de Genotipos Diferenciación conjunta

(*)

STR 1 ACTG 2 13 13×14/2= 91;

1 de 91

 

1 de 91

STR 2 TATGC 4 9 9 x10/2 = 45

1 de 45

91 x 45 = 4.095

1 de 4.095

STR 3 GCTACC 7 18 18×19/2= 171

 

1 de 171

4.095 x 171 =

700.245

1 de 700.245

STR 4 TTAAG 13 14 14 x15/2 =105

 

1 de 105

700.245 x 105 =73.525.725

1 entre 7,5 millones

STR 5 CCGAT 18 20 20×21/2 = 210

 

1 de 210

73.525.725 x 210 = 15.440.402.250

1 entre 15,4 miles de millones

(*) Al ser cada locus STR independiente de cualquier otro, cada uno de ellos admite cualquier combinación del otro, por ello se multiplican las combinaciones al considerarlas conjuntamente.

Nota: los alelos STR del ejemplo son inventados. En realidad son muy similares y valen como ejemplo.

Analizando sólo 5 genes STR del genoma humano (siempre que se localicen en cromosomas diferentes para que sean genes independientes), podemos diferenciar por el genotipo conjunto de los 5 genes  a 1 persona entre 15, 4 miles de millones de personas.

El perfil genético que usa la policía en sus análisis de ADN (tan utilizado en cualquier delito) analiza nada menos que entre 13 y 16  de esos locus STR y así puede afirmar categóricamente –con una certeza muy próxima al 100%- de qué individuo se trata (siempre que tenga archivado el perfil genético de esa persona o que al sospechoso se le haga un análisis de su perfil genético y concuerde o no para confirmar su culpabilidad o inocencia).

El hecho de no poder llegar a una certeza absoluta del 100% se debe principalmente al hecho de que existen alelos y genotipos más frecuentes que otros en las poblaciones para los diferentes genes STR y no del modo que nosotros lo hemos considerado, con igualdad de posibilidades para todos ellos. Con todo, la coincidencia proporciona una confirmación del 99,99% o incluso mayor.

Estos análisis de perfil genético nos  sirven, además, para determinar parentescos entre personas. De los 2 alelos que una persona posee en cualquiera de sus genes STR, uno de ellos lo ha recibido de su padre biológico y el otro de su madre. Por tanto, el padre o supuesto padre biológico tiene que  tener en sus dos alelos de cada uno de los genes STR, uno de los 2 que posee el hijo o supuesto hijo; y lo mismo con la madre o supuesta madre.

Ver artículos en nuestro blog: http://bit.ly/235x0oa .  http://bit.ly/2opCTQF . Y el documento de perfiles genéticos: http://bit.ly/2x7fs2E

En las demandas judiciales de paternidad –tan de actualidad en estos días con respecto a personas famosas-  estas pruebas de comparación de perfiles genéticos constituyen una prueba fundamental. También para otro grado de parentesco pero no con tanta fiabilidad.

Posted in alelos STR, Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment
13
octubre

Matemáticas y ADN (4)

 

Palíndromos y Re-palíndromos (4)

En el artículo anterior relacionamos las posibles secuencias de una de las hebras del ADN o del ARN (En este caso la complementariedad es A-U y G-C) con las posibles secuencias palíndromo (continuos o interrumpidos) que se podían presentar en ellas.

También podemos buscar las razones matemáticas para relacionar los palíndromos con los diferentes ADNs. Para ello tendremos que tener en cuenta que sólo los palíndromos continuos forman la misma molécula de ADN, mientras que los discontinuos no; ya que tienen parte NP y, por definición, no pueden ser idénticas en esa zona en ambas cadenas.

Conclusión :

La relación entre secuencias palíndromo (de cualquier tipo) y el nº de ADNs diferentes de ese mismo nº de unidades es de 1/2 en ADNs de nº impar y un poco menor en ADNs de nº par de unidades, aunque muy próximo a esa misma cantidad (1/2) .  Esto significa que si escribimos la secuencia de un ADN al azar, existe  1/2 de probabilidad de que contenga algún tipo de palíndromo.

Las secuencias palíndromo desempeñan diferentes funciones biológicas.

Muchas de ellas sirven de señalización (identifican puntos de interés en el ADN para, por ejemplo, localizar secuencias,  determinar lugares del ADN donde se unen determinados factores de transcripción o también en determinadas secuencias promotoras y terminadoras del mismo proceso,  lugares para escindir el ADN por enzimas de restricción o endonucleasas (tipo II) o también lugares  donde el ADN se “metila” para desactivar genes) o también como regiones transcribibles para que el ARN resultante pueda formar horquillas de apareamiento como en el caso de los ARN ribosómicos y transferente y los ARNmic transcritos primarios que originan los ARN-i (ARN de interferencia) . Las secuencias palíndromo también se encuentran presentes en los sistemas genómicos bacterianos CRISPR: CRI-SPR; las iniciales SPR (Short Palindromic Repeats = repeticiones palindrómicas cortas) que actúan de encaje a las secuencias espaciadoras, responsables directas de la inmunidad adquirida bacteriana, y  que es utilizado en la actualidad para la edición génica con múltiples aplicaciones.

 Los palíndromos en el ARN : RE-PALÍNDROMOS

Es frecuente observar que algunos tipos de moléculas de ARN (ejemplo: ARNt y ARNr) no tienen una estructura lineal, sino que en diferentes lugares presentan estructura doble (partes diferentes  de la cadena se han hibridado) presentando una estructura compleja tridimensional variada en su forma, incluso ARNs de estructura circular. Esto es debido a que las secuencias que hibridan son palíndromicas (por complementarias) y a su vez, en el intermedio de las mismas puede haber otras secuencias también palindrómicas produciéndose una primera y una segunda,.. hibridación en ellas. Casos que podríamos denominar re-palíndromos. En la imágenes  inferiores puede observarse la estructura lineal (rodeado de elipses en rojo las regiones palíndromas) de uno de los ARNt  y debajo su estructura tridimensional.

Su secuencia Re-palindrómica: 5´-P1-NP1-P2-NP2 (bucle izqdo.)-P´2-NP-P3-NP3( bucle anticodon)-P´3-NP4 (semibucle derecho)-P4-NP5 (bucle derecho)-P´4P´1-NP7-3´.

LOS PALINDOMOS EN EL ADN- Ver artículos Blog DNA didactic : Palindromos de ADN 1, 2 y 3 (http://www.dnadidactic.com/blog/secuencias-del-adn-palindromos-1/  http://www.dnadidactic.com/blog/secuencias-de-adn-palindromos-2-2/  http://www.dnadidactic.com/blog/secuencias-de-adn-palindromos-3/ )

 

 

 

Posted in Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment
10
octubre

Matemáticas y ADN (3)

 

También hay secuencias que forman los palindromos interrumpidos(3)

Las secuencias palindrómicas de los artículos anteriores son palíndromos continuos (o también llamados ininterrumpidos), pero también existen otras secuencias similares denominadas palíndromos interrumpidos. Son secuencias palíndromo que justo en medio se ha introducido 1, 2, 3, 4,….unidades que no son palindrómicas. (En lo sucesivo, mientras no indiquemos lo  contrario, hablaremos de secuencias y no haremos referencia a ADNs diferentes).

Ejemplo: ATCGT GGT ACGAT . Las unidades subrayadas forman un palíndromo,  interrumpido por una secuencia –en este caso de 3 unidades-que no igualaría la secuencia de la otra hebra en ese tramo, mientras que las adyacentes subrayadas sí.

Estas secuencias hacen que tanto los tramos de unidades pares como las impares puedan formar palíndromos interrumpidos.

Podemos igualmente aproximarnos a calcular su número, en función del número total de unidades de la secuencia.

En general podemos denominar a estos palíndromos interrumpidos del siguiente modo: P(n)-NP(m)-P´(n); siendo P(n) y P´(n) los tramos palíndomo de “n” (nº de unidades) y NP(m) el tramo no palíndromo de “m” (nº de unidades de ese tramo).

¿Podemos calcular el nº de secuencias posibles por ejemplo del  P(6)- NP (5)-P´(6); o sea un tramo de 17(6+5+6) unidades?. Pongámonos a ello partiendo de casos sencillos y busquemos, como en artículos  anteriores, una fórmula general que nos lo indique.

 

1.-Palíndromo interrumpido de 3 unidades

En este caso no pueden existir secuencias palíndromo continuos ya que un nº impar de unidades lo impide y sólo cabe el caso indicado a continuación.

1.a.- (P (1) – NP (1) – P´(1))

P: secuencia que forma el palíndromo/ NP: secuencia que no lo forma

P: puede tener 41 combinaciones posibles  que lo harían palíndromo en posiciones P y P´; respectivamente(A y T; T y A; Gy C y Cy G), cada una de ellas junto con las 4 posibles de NP (A,T,G,C), lo que haría un total de 41 x 41 = 42

 

 2.- Palíndromos de 4 unidades

2 casos posibles de palíndromo.

2.a.-Caso 1 (P (2)- NP (0)- P´(2)- Palíndromo continuo

En el continuo, los 2 primeros nucleótidos determinan los 2 siguientes para que se cumpliera la condición de palíndromo. Por tanto 42 combinaciones posible x 1 sola posibilidad en la 2ª parte del palíndromo = 42 x 1 = 42

2.b.- Caso 2 ( P (1)- NP(2) –P´(1))

Para el palíndromo interrumpido de 4 bases sólo cabe la posibilidad dibujada abajo. Su cálculo sería: 41 para constituir palíndromo (P y P´), multiplicado por aquellas secuencias posibles NP de 2 bases; éstas últimas serían 42 posibles de 2 unidadades  – 41 que las harían palíndromo continuo al añadir una unidad más al palíndromo (y estamos contemplando el caso  que no constituyan palíndromo). Por tanto, en total:  41 (42 – 41 ) = 43 – 42

2.c.-

La Suma total de secuencias de 4 bases que formarían un palíndromo (continuo o interrumpido) = 42 + (43 – 42) = 42 + 43 – 42 = 43

 

3.- Palíndromos interrumpidos de 5 unidades

2 casos posibles de palíndromo (ambos interrumpidos). No existe, en este caso la posibilidad de palíndromos continuos,  al ser una secuencia Impar.

3.a.- Caso 1:  (P (2)- NP(1)- P´(2))

En este primer caso se calcularía 42 (nº de P ) x 41 (posibilidades de NP: los 4 nucleótidos) = 43 posibilidades de secuencias diferentes

3.b.- Caso 2; (P (1)- NP(3)-P´(1))

En esta segunda posibilidad: 41 secuencia P x aquellas secuencias NP de 3 unidades que se calcularía 43 secuencias posibles, menos aquellas que las convirtiesen en palíndromo (que serían las indicadas para en apartado 1, o sea 42); por tanto, 41 ( 43 – 42) = 44 -43

3.c.- Si sumamos ambos casos 43 + (44 – 43) = 44 posibilidades de secuencias palíndromo diferentes

4.- Palíndromos de 6 unidades

Casos posibles:

4.a.- Caso 1:  (P(3)- NP(0)- P´(3)) – Palíndromo continuo

Palíndromo continuo donde los 3 primeros nucleótidos (43 combinaciones posibles) determinan una  y sólo una posibilidad en los 3 últimos: 43 X 1 = 43

4.b.- Caso 2:  (P(1)-NP(4)-P´(1))

Palíndromo interrumpido de 1 base en cada extremo

si le añaden una : 41 ( P y P´) x aquellas de 4 nucleótidos no palíndromos (44 – 43: las combinaciones posibles (44) menos las calculadas en el apartado 2c, que sería el nº de secuencias palíndromo posibles de 4 nucleótidos o pares de nucleótidos ): 41 (44 – 43) = 45 – 44

4.c.- Caso 3:  (P(2)-NP(2)-P´(2))

Palíndromo interrumpido de 2 bases en cada extremo:

Secuencias P= 42 multiplicado por aquellas combinaciones de 2 NP: (42 – 41: las posibles menos las indicadas en el razonamiento del  apartado 2b). Por tanto 42(42 – 41)= 44 – 43

4.d.-

La suma de todas las combinaciones palíndrómicas posibles sería: 43 (continuo) + (45– 44) añade 1, + (44 – 43) añade 2 = 43 + 45 – 44 + 44– 43= 45 secuencias palíndromos posibles

 

5.- Palíndromos interrumpidos  de 7 unidades

5.a.-Caso 1:  (P(1)-NP(5)-P´(1))

palíndromo interrumpido de 2 bases (uno en cada extremo) y 5 NP. Multiplicar el nº de unas por el nº de las otras

-Secuencias que forman el palíndromo: 41

-Secuencias NP (de 5 bases): 45 posibles menos aquellas que hicieran de esas 5 bases algún palíndromo; que como hemos calculado en el apartado (3) son 44.

Por tanto= 45– 44

-Total: 41 (45 – 44) = 46 – 45

5.b.-Caso 2:  (P(2)-NP(3)-P´(2))

palíndromo interrumpido que añade 4 bases (2 en cada extremo) y 3NP. Multiplicar el nº de unas por el nº de las otras.

-Secuencias posibles palíndromos: 42

-Secuencias NP( de 3 bases): las posibles 43 – aquellas que la convertirían a la secuencia NP en palíndromo, que como hemos calculado en el apartado (1) son 42. En total 43 – 42

-Total secuencias: 42 (43 – 42)= 45 – 44

5.c.- Caso 3:  (P(3)-NP(1)-P´(3))

Palíndromo interrumpido que añade 6 bases (3 en cada extremo) y 1 NP

Secuencias posibles que formarían el palíndromo;  43, multiplicadas por los posibles NP (los 4 nucleótidos) que en este caso es 41

Por tanto 43x 41 = 44 posibilidades de secuencias

5.d.-

Si sumamos los 3 casos: 46 – 45 + 45 – 44 + 44 = 46

 

6.- Palíndromos de 10 unidades

Pasamos ahora al caso en que la secuencia tenga 10 Pares de bases ( o nucleótidos)

6.a.-Caso 1:  (P(5)-NP(0)- P´(5))- Palíndromo continuo

Palíndromo continuo (5 y 5). Los 5 primeros nucleótidos (45) determinan una y sólo una combinación en los 5 restantes: 45 x 1 =45

6b.- Caso 2:  (P(1)- NP(8)-P´(1)

Palíndromo interrumpido de 1 base en cada extremo y 8 NP: Siguiendo los razonamientos anteriores: 41 x (48– 47)= 49 – 48

6.c.- Caso 3:  (P(2)-NP(6)-P´(2))

Palindromo interrumpido de 2 en cada extremo y 6 NP: 42 (46– 45)= 47– 46

6.d.- Caso 4:  (P(3)-NP(4)-P´(3))

Palíndromo interrumpido de 3 en cada extremo y 4 NP en medio: 43 (44– 43) = 47 – 46

6e.- Caso 5:  (P(4)-NP(2)-P´(4))

Palíndromos interrumpidos de 4 en cada extremo y 2 NP en medio: 44 (42– 41)=46 – 45

6.f.-La suma total de posibles secuencias palíndromo de 10:  45 +49-47 + 47-46 + 46-45 = 49

7.- Respuesta a la pregunta inicial

Podemos ahora responder a la pregunta con la que iniciábamos los cálculos de este apartado. El nº de secuencias posibles de un palíndromo (P6-NP(5)-P´(6))  es igual a  46 (45 -44) = 411 -410 = 410( 4 -1) = 3 x 410 = 3.145.728 ( Ver punto 5 de las conclusiones más abajo y todos los casos contemplados de palíndromos interrumpidos en los apartados anteriores 1a, 2b, 3a, 3b, 4b, 4c, 5a, 5b, 5c, 6b, 6c, 6d, 6e))

Tabla resumen de los cálculos realizados anteriormente

CONCLUSIONES

1.- En una secuencia de “n” nucleótidos o pares de nucleótidos, el nº de secuencias posibles es 4n y 4n-1 de ellas serán secuencias palíndromo (continuos e interrumpidos)

2.- La relación entre secuencias palíndromo y secuencias no palindrómicas de cualquier tamaño (n nucleótidos o pares de nucleótidos) viene dado por la fracción 4n-1/4n = 1/4. Una de cada cuatro secuencias al azar constituirán un palíndromo continuo o interrumpido.

3.- En las secuencias de nº par (n= nº par), el nº de secuencias palíndromos continuos será 4 n/2,  y el nº de secuencias palíndromo interrumpido será 4n-1 – 4n/2. (Véase en la tabla casos 2, 4 y 6 el cálculo del nº de palíndromos interrumpidos).

4.- En las secuencias de nº impar(n= nº impar), no es posible la existencia de palíndromos continuos y el nº de secuencias de palíndromos interrumpidos será 4n-1.

5.- En cualquier secuencia que constituya un palíndromo interrumpido de estructura general: P(n)- NP (m) –P´(n) el nº de secuencias posibles diferentes será el que viene dado por la fórmula: 4n (4m -4m-1) ; 4n para el palíndromo que forman P y P´; que habrá que multiplicar por las secuencias de “m” posibles que NO puedan formar palíndromos que serán todas las posibles (4m) menos aquellas que sí lo forman (4m-1), tal y como hemos visto en los cálculos realizados. Si queremos simplificar más esta fórmula, 4n (4m -4m-1)  = 4(n+m) – 4(n+m-1) = 4 (n+m-1) (4 -1) = 3 . 4 (n+m-1)  

6.- Estas conclusiones se pueden aplicar a cualquier tipo de secuencias simples, tanto ADN como ARN .

 

 

 

 

 

 

 

 

 

 

 

Posted in Artículos, DNA Didactic, Para estudiantes BACH, Para estudiantes ESO | Tagged , , | Leave a comment