La distribución binomial
“Bi” significa “dos” (como una bicicleta tiene dos ruedas) … |
|
Lanzar una moneda:
- ¿Tenemos cabezas (H) o
- Colas (T)
Decimos que la probabilidad de que la moneda caiga H es ½
Y la probabilidad de que la moneda caiga T es ½
Lanzar un dado:
- ¿Recibimos un cuatro …?
- … o no?
Decimos que la probabilidad de un cuatro es 1/6 (una de las seis caras es un cuatro)
Y la probabilidad de no cuatro es 5/6 (cinco de las seis caras no son cuatro)
Tenga en cuenta que un dado tiene 6 lados, pero aquí vemos solo dos casos: “cuatro: sí” o “cuatro: no” [19459011 ]
¡Arrojemos una moneda!
Lanza una moneda justa tres veces … ¿cuál es la posibilidad de obtener dos cabezas ?
Lanzar una moneda tres veces ( H es para caras, T para Colas) puede obtener cualquiera de estos 8 resultados :
HHH | ||
HHT | ||
HTH | ||
HTT | ||
THH | ||
THT | ||
TTH | ||
TTT |
¿Qué resultados queremos?
“Dos cabezas” podrían estar en cualquier orden: “HHT”, “THH” y “HTH” tienen dos cabezas (y una cola).
Entonces 3 de los resultados producen “Dos cabezas”.
¿Cuál es la probabilidad de cada resultado?
Cada resultado es igualmente probable, y hay 8 de ellos, por lo que cada resultado tiene una probabilidad de 1/8
Entonces, la probabilidad del evento “Dos cabezas” es:
Número de resultados que queremos |
Probabilidad de cada resultado |
||
3 | × | 1/8 | = 3/8 |
Entonces la posibilidad de obtener dos cabezas es 3/8
Utilizamos palabras especiales:
- Resultado : cualquier resultado de tres lanzamientos de monedas (8 posibilidades diferentes)
- Evento : “Dos cabezas” de tres lanzamientos de monedas (3 resultados tienen esto)
3 cabezas, 2 cabezas, 1 cabeza, ninguna
Los cálculos son (P significa “Probabilidad de”):
- P (tres cabezas) = P ( HHH ) = 1/8
- P (dos cabezas) = P ( HHT ) + P ( HTH ) + P ( THH ) = 1/8 + 1/8 + 1/8 = 3/8
- P (Una cabeza) = P ( HTT ) + P ( THT ) + P ( TTH ) = 1/8 + 1/8 + 1/8 = 3/8
- P (Cabezas cero) = P ( TTT ) = 1/8
Podemos escribir esto en términos de una Variable aleatoria , X, = “El número de caras de 3 lanzamientos de una moneda”:
- P (X = 3) = 1/8
- P (X = 2) = 3/8
- P (X = 1) = 3/8
- P (X = 0) = 1/8
Y así es como se ve como un Gráfico de barras :
¡Es simétrico!
Haciendo una fórmula
Ahora imagine que queremos las posibilidades de 5 caras en 9 lanzamientos : ¡enumerar los 512 resultados llevará mucho tiempo!
Entonces, hagamos una fórmula.
En nuestro ejemplo anterior, ¿cómo podemos obtener los valores 1, 3, 3 y 1?
Bueno, ¡en realidad están en Triángulo de Pascal !
¿Podemos hacerlos usando una fórmula?
Claro que podemos, y aquí está:
A menudo se le llama “n elige k”
- n = número total
- k = número que queremos
- el “!” significa ” factorial “, por ejemplo 4! = 1 × 2 × 3 × 4 = 24
Puedes leer más
sobre esto en Combinaciones y permutaciones .
Probémoslo:
Ejemplo: con 3 lanzamientos, ¿cuáles son las posibilidades de 2 cabezas?
Tenemos n = 3 y k = 2 :
Entonces hay 3 resultados que tienen “2 cabezas”
(Ya lo sabíamos, pero ahora tenemos una fórmula para ello)
Vamos a usarlo para una pregunta más difícil:
Ejemplo: con 9 lanzamientos, ¿cuáles son las posibilidades de 5 cabezas?
Tenemos n = 9 y k = 5 :
Entonces 126 de los resultados tendrán 5 cabezas
Y para 9 lanzamientos hay un total de 2 9 = 512 resultados, por lo que obtenemos la probabilidad:
Número de resultados que queremos |
Probabilidad de cada resultado |
|||
126 | × | 1 512 | = | 126 512 |
Entonces:
P (X = 5) = 126 512 = 0,24609375
Aproximadamente un 25% de probabilidad .
(Más fácil que enumerarlos a todos)
¡Sesgo!
Hasta ahora, las posibilidades de éxito o fracaso han sido igualmente probables .
Pero, ¿qué pasa si las monedas están sesgadas (aterrizan más en un lado que en el otro) o las opciones no son 50/50.
Ejemplo: vendes sándwiches. El 70% de las personas elige pollo, el resto elige otra cosa.
¿Cuál es la probabilidad de vender 2 sándwiches de pollo a los siguientes 3 clientes?
Esto es como el ejemplo de cara y cruz, pero con 70/30 en lugar de 50/50.
Dibujemos un diagrama de árbol :
Se resaltan los casos de “Dos pollos”.
Las probabilidades para “dos pollos” resultan ser 0.147 , porque estamos multiplicando dos 0.7s y uno 0.3 en cada caso. En otras palabras
0.147 = 0.7 × 0.7 × 0.3
O, utilizando exponentes:
= 0,7 2 × 0,3 1
El 0.7 es la probabilidad de cada opción que queramos, llámela p
El 2 es la cantidad de opciones que queremos, llámelo k
Y tenemos (hasta ahora):
= p k × 0,3 1
El 0.3 es la probabilidad de la opción opuesta, por lo que es: 1 − p
El 1 es el número de opciones opuestas, por lo que es: n − k
Lo que nos da:
= p k (1-p) (n-k)
Donde
- p es la probabilidad de cada opción que queremos
- k es la cantidad de opciones que queremos
- n es el número total de opciones
Ejemplo: (continuación)
- p = 0,7 (posibilidad de pollo)
- k = 2 (opciones de pollo)
- n = 3 (opciones totales)
Entonces obtenemos:
que es lo que obtuvimos antes, pero ahora usando una fórmula
Ahora sabemos que la probabilidad de cada resultado es 0.147
Pero tenemos que incluir que hay tres formas en que puede suceder: (pollo, pollo, otro) o (pollo, otro, pollo) o (otro, pollo, pollo)
Ejemplo: (continuación)
El número total de resultados de “dos pollos” es:
Y obtenemos:
Número de resultados que queremos |
Probabilidad de cada resultado |
|||
3 | × | 0,147 | = | 0,441 |
Entonces, la probabilidad del evento “2 de cada 3 personas eligen pollo” = 0.441
OK. Eso fue mucho trabajo para algo que ya sabíamos, pero ahora tenemos una fórmula que podemos usar para preguntas más difíciles.
Ejemplo: Sam dice “70% elige pollo, por lo que 7 de los siguientes 10 clientes deberían elegir pollo” … ¿cuáles son las posibilidades de que Sam tenga razón?
Entonces tenemos:
- p = 0,7
- n = 10
- k = 7
Y obtenemos:
Esa es la probabilidad de cada resultado.
Y el número total de esos resultados es:
Y obtenemos:
Número de resultados que queremos |
Probabilidad de cada resultado |
|||
120 | × | 0,0022235661 | = | 0.266827932 |
Entonces, la probabilidad de que 7 de cada 10 elijan pollo es solo de 27%
Moraleja de la historia: a pesar de que el promedio a largo plazo es del 70%, no esperes 7 de los próximos 10.
Poniendo todo junto
Ahora sabemos cómo calcular cuántos :
n! k! (N-k)!
Y la probabilidad de cada :
p k (1-p) (n-k)
Cuando se multiplican juntos obtenemos:
Probabilidad de k de n maneras:
P (k de n) = n! k! (N-k)! p k (1-p) (n-k)
La fórmula general de probabilidad binomial
Notas importantes:
- Los ensayos son independientes ,
- Solo hay dos resultados posibles en cada ensayo,
- La probabilidad de “éxito” en cada ensayo es constante.
Quincunx
Juega con el Quincunx (luego lee Quincunx explicado ) para ver la distribución binomial en acción.
Tira el dado
Se lanza un dado justo cuatro veces. Calcule las probabilidades de obtener:
- 0 Dos
- 1 Dos
- 2 Dos
- 3 Dos
- 4 Dos
En este caso n = 4 , p = P (Dos) = 1/6
X es la variable aleatoria “Número de dos por cuatro lanzamientos”.
Sustituye x = 0 a 4 en la fórmula:
P (k de n) = n! k! (N-k)! p k (1-p) (n-k)
Como esto (con 4 decimales):
- P (X = 0) = 4! ¡0! 4! × (1/6) 0 (5/6) 4 = 1 × 1 × (5/6) 4 = 0.4823
- P (X = 1) = 4! 1! 3! × (1/6) 1 (5/6) 3 = 4 × (1/6) × (5/6) 3 [ 19459062] = 0.3858
- P (X = 2) = 4! 2! 2! × (1/6) 2 (5/6) 2 = 6 × (1/6) 2 × (5 / 6) 2 = 0.1157
- P (X = 3) = 4! 3! 1! × (1/6) 3 (5/6) 1 = 4 × (1/6) 3 × (5 / 6) = 0.0154
- P (X = 4) = 4! 4! 0! × (1/6) 4 (5/6) 0 = 1 × (1/6) 4 × 1 = 0,0008
Resumen: “para los 4 lanzamientos, hay un 48% de posibilidades de no tener dos, un 39% de posibilidades de 1 dos, un 12% de posibilidades de 2, un 1.5% de posibilidades de 3 y un pequeño 0.08% de posibilidades de todos arroja ser un dos (¡pero aún podría suceder!) “
Esta vez el Gráfico de barras no es simétrico:
¡No es simétrico!
Es sesgado porque p no es 0,5
Bicicletas deportivas
Su empresa fabrica bicicletas deportivas. El 90% pasa la inspección final (y el 10% falla y debe repararse).
¿Cuál es la media esperada y varianza de las 4 próximas inspecciones?
Primero, calculemos todas las probabilidades.
- n = 4,
- p = P (Pase) = 0.9
X es la variable aleatoria “Número de pases de cuatro inspecciones”.
Sustituye x = 0 a 4 en la fórmula:
P (k de n) = n! k! (N-k)! p k (1-p) (n-k)
Así:
- P (X = 0) = 4! ¡0! 4! × 0,9 0 0,1 4 = 1 × 1 × 0,0001 = 0,0001
- P (X = 1) = 4! 1! 3! × 0.9 1 0.1 3 = 4 × 0.9 × 0.001 = 0.0036
- P (X = 2) = 4! 2! 2! × 0.9 2 0.1 2 = 6 × 0.81 × 0.01 = 0.0486
- P (X = 3) = 4! 3! 1! × 0.9 3 0.1 1 = 4 × 0.729 × 0.1 = 0.2916
- P (X = 4) = 4! 4! 0! × 0.9 4 0.1 0 = 1 × 0.6561 × 1 = 0.6561
Resumen: “para las 4 próximas bicicletas, hay una pequeña probabilidad de 0.01% de no pases, 0.36% de posibilidades de 1 pase, 5% de posibilidades de 2 pases, 29% de posibilidades de 3 pases y una enorme probabilidad de 66% todos pasan la inspección “.
Media, varianza y desviación estándar
Calculemos la Media , Varianza y desviación estándar para las inspecciones de bicicletas deportivas.
Hay fórmulas (relativamente) simples para ellos. Son un poco difíciles de probar, ¡pero funcionan!
La media, o “valor esperado”, es:
μ = np
Para las bicicletas deportivas:
μ = 4 × 0,9 = 3,6
Entonces podemos esperar que 3.6 bicicletas (de 4) pasen la inspección.
Realmente tiene sentido … 0.9 posibilidades por cada bicicleta multiplicada por 4 bicicletas es igual a 3.6
La fórmula para la varianza es:
Varianza: σ 2 = np (1-p)
Y la desviación estándar es la raíz cuadrada de la varianza:
σ = √ (np (1-p))
Para las bicicletas deportivas:
Varianza: σ 2 = 4 × 0.9 × 0.1 = 0.36
La desviación estándar es:
σ = √ (0,36) = 0,6
Nota: también podríamos calcularlos manualmente, haciendo una tabla como esta:
X | P (X) | X × P (X) | X 2 × P (X) |
0 | 0,0001 | 0 | 0 |
1 | 0,0036 | 0,0036 | 0,0036 |
2 | 0,0486 | 0,0972 | 0,1944 |
3 | 0.2916 | 0,8748 | 2.6244 |
4 | 0,6561 | 2.6244 | 10.4976 |
SUMA: | 3,6 | 13,32 |
La media es la Suma de (X × P (X)) :
μ = 3,6
La varianza es la Suma de (X 2 × P (X)) menos Media 2 :
Varianza: σ 2 = 13.32 – 3.6 2 = 0.36
La desviación estándar es:
σ = √ (0,36) = 0,6
Y obtuvimos los mismos resultados que antes (¡sí!)
Resumen
- La fórmula general de probabilidad binomial:
P (k de n) = n! k! (N-k)! p k (1-p) (n-k)
- Valor medio de X: μ = np
- Varianza de X: σ 2 = np (1-p)
- Desviación estándar de X: σ = √ (np (1-p))