En el post anterior (https://www.dnadidactic.com/blog/dnaword/ ) explicamos este juego y planteamos una serie de cuestiones a resolver en relación al mismo.

Las 3 cuestiones hacían referencia a ciertas probabilidades de acierto al realizar una primera propuesta de secuencia, respecto a la secuencia desconocida original a descubrir. Vayamos a por las 2 primeras

Consideraciones iniciales:.

1- En cada una de las 5 posiciones de la secuencia problema sólo caben 4 posibles letras (A, T, G y C), por tanto, la posibilidad de acierto en esa posición es de 1/4.

2- Si consideramos también los medio-aciertos (A por T o al revés; y G por C o al revés), tendríamos una posibilidad de medio-acierto de 1/4, puesto que sólo se produciría el medio-acierto con una de las 4 letras respecto a la que hubiera en esa posición (si hubiese una A, sólo se produciría el medio-acierto poniendo una T; ó A si hubiese T; ó G si hubiese C; ó C si hubiese G). Por tanto la posibilidad de obtener un medio-acierto también es de 1/4  por posición.

3-La posibilidad de no-acierto  sólo se produciría, descartando el acierto y el medio-acierto, colocando cualquiera de las otras 2 letras restantes. Así, si hubiese una A, el no- acierto se produciría sólo si colocásemos una G o una C, ya que si colocásemos A, sería acierto, y si T sería medio-acierto. Por tanto el no-acierto se produciría en 2 de las 4 posibles (con G ó C): 2/4 = 1/2.

4-Ahora bien, son 5 las posiciones independientes unas de otras (la secuencia desconocida de 5 es aleatoria) dónde podría producirse cualquiera de los 3 resultados posibles por posición, pudiendo denominar a éstos con “A” (acierto); “a” (medio-acierto) y “na” (no acierto).

Respuestas

Dicho lo anterior, damos respuesta a las 2 primeras cuestiones que planteábamos (con otra entrada en el blog daremos respuesta a la tercera)

a.- Probabilidad de acertar la secuencia completa con las 5 letras (A,A,A,A,A)

– Probabilidad “A” en la primera letra=1/4; en la segunda=1/4; lo mismo en la tercera=1/4; igualmente en la cuarta= 1/4; y en la quinta=  1/4 . Probabilidad de acierto en las 5= (1/4)5 = 1/1024 = 0,00097 en frecuencia decimal y en porcentaje 0,097%. Muy poco probable. El denominador, en este caso, indica el nº total de secuencias posible de 5 letras (4 elevado a 5)..

Sólo una concreta de las secuencias propuestas pudiera obtener este resultado (1 entre 1024).

b.- Probabilidad de no acertar, ni medio-acertar,  ninguna de las 5 letras de la secuencia completa (na,na,na,na,na)

-Probabilidad de “na” en la primera letra =1/2; en la segunda=1/2; lo mismo en la tercera=1/2; igualmente en la cuarta=1/2; y en la quinta=1/2. Probabilidad de no-acierto en las 5 = (1/2)5 = 1/32 = 0,03125 en frecuencia decimal y en porcentaje = 3,125%. Bastante más probable (32 veces que la anterior de obtener los 5 aciertos),  y, aun así, bastante poco probable. (3 de cada 100).

Si la frecuencia decimal obtenida, 1/32,  la transformamos en función  del nº de secuencias diferentes que producirían ese mismo resultado, tendríamos que multiplicar por 32 (tanto numerador como denominador) para que el denominador nos diera el nº total de secuencias posibles en 5 posiciones. Obtendríamos la fracción equivalente 32/1024. Por eso habrá 32 secuencias diferentes que nos den el resultado: (na,na,na,na,na).

Y es así, porque en cada una de las posiciones, el resultado no-acierto puede darse indistintamente con 2 de las 4 letras. (2 x2 x2 x2 x 2 = 32). Y por tanto el nº de secuencias concretas diferentes obedecerá  al cálculo anterior y obtendremos ese nº.

 

Nota: En ambos casos hemos tenido en cuenta que el acierto y el no acierto se dan en las 5 posiciones de la secuencia, o sea, siempre y para cada posición el resultado es el mismo. En el primer caso solo una secuencia de las 1024 posibles produciría los 5 aciertos y en el segundo caso 32 de las 1024 posibles.

Pero, -recordando que en este juego no se señalan las posiciones donde se producen los resultados sino el nº de ellos-  y si, por ejemplo hablamos de obtener un resultado de 3 aciertos, 1 medio-acierto y 1 no- acierto….., estos 3 resultados diferentes pueden darse en diversas posiciones de las 5. ¿En qué posiciones concretas se producen los 3 aciertos: en la primera y segunda y tercera; en la primera, segunda y cuarta; en la primera, segunda y quinta; en la segunda, tercera y cuarta…….etc?. ¿Y en qué posiciones el medio acierto?; ¿y en qué posiciones el no-acierto?. Por tanto, según y dónde se produjeran, las secuencias propuestas, obedecerían a un orden de posiciones diferente y serían diferentes secuencias pero con el mismo resultado de aciertos.

Por lo que vemos, caben diferentes propuestas de secuencias que, en diferentes posiciones, obtendrían el resultado 3A, 1a, 1na ( por ejemplo: A,A,A,a,na/ A,A,A,na,a/ A,a,A,A,na/ A,na,A,A,a/…etc.). Cada una de estas opciones tendría la misma probabilidad: (1/4)3 .1/4 .1/2= 1/512;  pero al ser unas cuantas habría que sumar las probabilidades de todas o lo que es los mismo, multiplicarlas por el nº de opciones que pudieran darse según las 5 posiciones de la secuencia con el mismo resultado final.

En este caso es imprescindible dar con ese número concreto de ellas, para ver todas las opciones en que se darían tales resultados para calcular la probabilidad final al contemplar todas las posibles.

No sucede así en el caso de los resultados anteriores ya que las 5 posiciones producen el mismo resultado (A,A,A,A,A  y na,na,na,na,na), no habiendo opción a variación del mismo en función de la posición ocupada.

¿Te animas a hacer el cálculo de la probabilidad con el ejemplo propuesto en esta nota?