La distribución binomial

“Bi” significa “dos” (como una bicicleta tiene dos ruedas) …
… así que se trata de cosas con dos resultados .

bicycle

head tails dollar

Lanzar una moneda:

  • ¿Tenemos cabezas (H) o
  • Colas (T)

Decimos que la probabilidad de que la moneda caiga H es ½
Y la probabilidad de que la moneda caiga T es ½

die

Lanzar un dado:

  • ¿Recibimos un cuatro …?
  • … o no?

Decimos que la probabilidad de un cuatro es 1/6 (una de las seis caras es un cuatro)
Y la probabilidad de no cuatro es 5/6 (cinco de las seis caras no son cuatro)

Tenga en cuenta que un dado tiene 6 lados, pero aquí vemos solo dos casos: “cuatro: sí” o “cuatro: no” [19459011 ]

¡Arrojemos una moneda!

Lanza una moneda justa tres veces … ¿cuál es la posibilidad de obtener dos cabezas ?

Lanzar una moneda tres veces ( H es para caras, T para Colas) puede obtener cualquiera de estos 8 resultados :

HHH coin head coin head coin head
HHT coin head coin head coin tail
HTH coin head coin tail coin head
HTT coin head coin tail coin tail
THH coin tail coin head coin head
THT coin tail coin head coin tail
TTH coin tail coin tail coin head
TTT coin tail coin tail coin tail

¿Qué resultados queremos?

“Dos cabezas” podrían estar en cualquier orden: “HHT”, “THH” y “HTH” tienen dos cabezas (y una cola).

Entonces 3 de los resultados producen “Dos cabezas”.

¿Cuál es la probabilidad de cada resultado?

Cada resultado es igualmente probable, y hay 8 de ellos, por lo que cada resultado tiene una probabilidad de 1/8

Entonces, la probabilidad del evento “Dos cabezas” es:

Número de
resultados que queremos
Probabilidad de
cada resultado
3 × 1/8 = 3/8

Entonces la posibilidad de obtener dos cabezas es 3/8

Utilizamos palabras especiales:

  • Resultado : cualquier resultado de tres lanzamientos de monedas (8 posibilidades diferentes)
  • Evento : “Dos cabezas” de tres lanzamientos de monedas (3 resultados tienen esto)

3 cabezas, 2 cabezas, 1 cabeza, ninguna

Los cálculos son (P significa “Probabilidad de”):

  • P (tres cabezas) = ​​P ( HHH ) = 1/8
  • P (dos cabezas) = ​​P ( HHT ) + P ( HTH ) + P ( THH ) = 1/8 + 1/8 + 1/8 = 3/8
  • P (Una cabeza) = P ( HTT ) + P ( THT ) + P ( TTH ) = 1/8 + 1/8 + 1/8 = 3/8
  • P (Cabezas cero) = P ( TTT ) = 1/8

Podemos escribir esto en términos de una Variable aleatoria , X, = “El número de caras de 3 lanzamientos de una moneda”:

  • P (X = 3) = 1/8
  • P (X = 2) = 3/8
  • P (X = 1) = 3/8
  • P (X = 0) = 1/8

Y así es como se ve como un Gráfico de barras :

binomial 1
¡Es simétrico!

Haciendo una fórmula

Ahora imagine que queremos las posibilidades de 5 caras en 9 lanzamientos : ¡enumerar los 512 resultados llevará mucho tiempo!

Entonces, hagamos una fórmula.

En nuestro ejemplo anterior, ¿cómo podemos obtener los valores 1, 3, 3 y 1?

pascals triangle

Bueno, ¡en realidad están en Triángulo de Pascal !

¿Podemos hacerlos usando una fórmula?

Claro que podemos, y aquí está:

binomial n choose k = n! / k!(n-k)!

A menudo se le llama “n elige k”

  • n = número total
  • k = número que queremos
  • el “!” significa ” factorial “, por ejemplo 4! = 1 × 2 × 3 × 4 = 24

Puedes leer más
sobre esto en Combinaciones y permutaciones .

Probémoslo:

Ejemplo: con 3 lanzamientos, ¿cuáles son las posibilidades de 2 cabezas?

Tenemos n = 3 y k = 2 :

 

 

n! k! (N-k)! = 3! 2! (3-2)!

 

= 3 × 2 × 1 2 × 1 × 1

 

= 3

 

Entonces hay 3 resultados que tienen “2 cabezas”

(Ya lo sabíamos, pero ahora tenemos una fórmula para ello)

Vamos a usarlo para una pregunta más difícil:

Ejemplo: con 9 lanzamientos, ¿cuáles son las posibilidades de 5 cabezas?

Tenemos n = 9 y k = 5 :

 

n! k! (N-k)! = 9! 5! (9-5)!

 

= 9 × 8 × 7 × 6 × 5 × 4 × 3 × 2 × 1 5 × 4 × 3 × 2 × 1 × 4 × 3 × 2 × 1

 

= 126

 

 

Entonces 126 de los resultados tendrán 5 cabezas

 

Y para 9 lanzamientos hay un total de 2 9 = 512 resultados, por lo que obtenemos la probabilidad:

Número de
resultados que queremos
Probabilidad de
cada resultado
126 × 1 512 = 126 512

Entonces:

P (X = 5) = 126 512 = 0,24609375

Aproximadamente un 25% de probabilidad .

(Más fácil que enumerarlos a todos)

¡Sesgo!

Hasta ahora, las posibilidades de éxito o fracaso han sido igualmente probables .

Pero, ¿qué pasa si las monedas están sesgadas (aterrizan más en un lado que en el otro) o las opciones no son 50/50.

Ejemplo: vendes sándwiches. El 70% de las personas elige pollo, el resto elige otra cosa.

¿Cuál es la probabilidad de vender 2 sándwiches de pollo a los siguientes 3 clientes?

Esto es como el ejemplo de cara y cruz, pero con 70/30 en lugar de 50/50.

Dibujemos un diagrama de árbol :

tree chicken other

Se resaltan los casos de “Dos pollos”.

Las probabilidades para “dos pollos” resultan ser 0.147 , porque estamos multiplicando dos 0.7s y uno 0.3 en cada caso. En otras palabras

0.147 = 0.7 × 0.7 × 0.3

O, utilizando exponentes:

= 0,7 2 × 0,3 1

El 0.7 es la probabilidad de cada opción que queramos, llámela p

El 2 es la cantidad de opciones que queremos, llámelo k

Y tenemos (hasta ahora):

= p k × 0,3 1

El 0.3 es la probabilidad de la opción opuesta, por lo que es: 1 − p

El 1 es el número de opciones opuestas, por lo que es: n − k

 

Lo que nos da:

= p k (1-p) (n-k)

Donde

  • p es la probabilidad de cada opción que queremos
  • k es la cantidad de opciones que queremos
  • n es el número total de opciones

Ejemplo: (continuación)

  • p = 0,7 (posibilidad de pollo)
  • k = 2 (opciones de pollo)
  • n = 3 (opciones totales)

Entonces obtenemos:

p k (1-p) (nk) = 0.7 2 (1-0.7) [19459061 ] (3-2)

 

= 0.7 2 (0.3) (1)

 

= 0.7 × 0.7 × 0.3

 

= 0.147

 

que es lo que obtuvimos antes, pero ahora usando una fórmula

Ahora sabemos que la probabilidad de cada resultado es 0.147

Pero tenemos que incluir que hay tres formas en que puede suceder: (pollo, pollo, otro) o (pollo, otro, pollo) o (otro, pollo, pollo)

Ejemplo: (continuación)

El número total de resultados de “dos pollos” es:

n! k! (N-k)! = 3! 2! (3-2)!

 

= 3 × 2 × 1 2 × 1 × 1

 

= 3

 

Y obtenemos:

Número de
resultados que queremos
Probabilidad de
cada resultado
3 × 0,147 = 0,441

Entonces, la probabilidad del evento “2 de cada 3 personas eligen pollo” = 0.441

OK. Eso fue mucho trabajo para algo que ya sabíamos, pero ahora tenemos una fórmula que podemos usar para preguntas más difíciles.

Ejemplo: Sam dice “70% elige pollo, por lo que 7 de los siguientes 10 clientes deberían elegir pollo” … ¿cuáles son las posibilidades de que Sam tenga razón?

Entonces tenemos:

  • p = 0,7
  • n = 10
  • k = 7

Y obtenemos:

p k (1-p) (nk) = 0.7 7 (1-0.7) [19459061 ] (10-7)
= 0.7 7 (0.3) (3)
= 0,0022235661

Esa es la probabilidad de cada resultado.

Y el número total de esos resultados es:

n! k! (N-k)! = 10! 7! (10-7)!
= 10 × 9 × 8 × 7 × 6 × 5 × 4 × 3 × 2 × 1 7 × 6 × 5 × 4 × 3 × 2 × 1 × 3 × 2 × 1
= 10 × 9 × 8 3 × 2 × 1
= 120

Y obtenemos:

Número de
resultados que queremos
Probabilidad de
cada resultado
120 × 0,0022235661 = 0.266827932

Entonces, la probabilidad de que 7 de cada 10 elijan pollo es solo de 27%

Moraleja de la historia: a pesar de que el promedio a largo plazo es del 70%, no esperes 7 de los próximos 10.

Poniendo todo junto

Ahora sabemos cómo calcular cuántos :

n! k! (N-k)!

Y la probabilidad de cada :

p k (1-p) (n-k)

Cuando se multiplican juntos obtenemos:

Probabilidad de k de n maneras:

P (k de n) = n! k! (N-k)! p k (1-p) (n-k)

La fórmula general de probabilidad binomial

Notas importantes:

  • Los ensayos son independientes ,
  • Solo hay dos resultados posibles en cada ensayo,
  • La probabilidad de “éxito” en cada ensayo es constante.

Quincunx

quincunx

Juega con el Quincunx (luego lee Quincunx explicado ) para ver la distribución binomial en acción.

Tira el dado

die

Se lanza un dado justo cuatro veces. Calcule las probabilidades de obtener:

  • 0 Dos
  • 1 Dos
  • 2 Dos
  • 3 Dos
  • 4 Dos

En este caso n = 4 , p = P (Dos) = 1/6

X es la variable aleatoria “Número de dos por cuatro lanzamientos”.

Sustituye x = 0 a 4 en la fórmula:

P (k de n) = n! k! (N-k)! p k (1-p) (n-k)

Como esto (con 4 decimales):

  • P (X = 0) = 4! ¡0! 4! × (1/6) 0 (5/6) 4 = 1 × 1 × (5/6) 4 = 0.4823
  • P (X = 1) = 4! 1! 3! × (1/6) 1 (5/6) 3 = 4 × (1/6) × (5/6) 3 [ 19459062] = 0.3858
  • P (X = 2) = 4! 2! 2! × (1/6) 2 (5/6) 2 = 6 × (1/6) 2 × (5 / 6) 2 = 0.1157
  • P (X = 3) = 4! 3! 1! × (1/6) 3 (5/6) 1 = 4 × (1/6) 3 × (5 / 6) = 0.0154
  • P (X = 4) = 4! 4! 0! × (1/6) 4 (5/6) 0 = 1 × (1/6) 4 × 1 = 0,0008

Resumen: “para los 4 lanzamientos, hay un 48% de posibilidades de no tener dos, un 39% de posibilidades de 1 dos, un 12% de posibilidades de 2, un 1.5% de posibilidades de 3 y un pequeño 0.08% de posibilidades de todos arroja ser un dos (¡pero aún podría suceder!) “

Esta vez el Gráfico de barras no es simétrico:

binomial 0 to 4 skewed
¡No es simétrico!

Es sesgado porque p no es 0,5

bike

Bicicletas deportivas

Su empresa fabrica bicicletas deportivas. El 90% pasa la inspección final (y el 10% falla y debe repararse).

¿Cuál es la media esperada y varianza de las 4 próximas inspecciones?

Primero, calculemos todas las probabilidades.

  • n = 4,
  • p = P (Pase) = 0.9

X es la variable aleatoria “Número de pases de cuatro inspecciones”.

Sustituye x = 0 a 4 en la fórmula:

P (k de n) = n! k! (N-k)! p k (1-p) (n-k)

Así:

  • P (X = 0) = 4! ¡0! 4! × 0,9 0 0,1 4 = 1 × 1 × 0,0001 = 0,0001
  • P (X = 1) = 4! 1! 3! × 0.9 1 0.1 3 = 4 × 0.9 × 0.001 = 0.0036
  • P (X = 2) = 4! 2! 2! × 0.9 2 0.1 2 = 6 × 0.81 × 0.01 = 0.0486
  • P (X = 3) = 4! 3! 1! × 0.9 3 0.1 1 = 4 × 0.729 × 0.1 = 0.2916
  • P (X = 4) = 4! 4! 0! × 0.9 4 0.1 0 = 1 × 0.6561 × 1 = 0.6561

Resumen: “para las 4 próximas bicicletas, hay una pequeña probabilidad de 0.01% de no pases, 0.36% de posibilidades de 1 pase, 5% de posibilidades de 2 pases, 29% de posibilidades de 3 pases y una enorme probabilidad de 66% todos pasan la inspección “.

Media, varianza y desviación estándar

Calculemos la Media , Varianza y desviación estándar para las inspecciones de bicicletas deportivas.

Hay fórmulas (relativamente) simples para ellos. Son un poco difíciles de probar, ¡pero funcionan!

La ​​media, o “valor esperado”, es:

μ = np

Para las bicicletas deportivas:

μ = 4 × 0,9 = 3,6

Entonces podemos esperar que 3.6 bicicletas (de 4) pasen la inspección.
Realmente tiene sentido … 0.9 posibilidades por cada bicicleta multiplicada por 4 bicicletas es igual a 3.6

La ​​fórmula para la varianza es:

Varianza: σ 2 = np (1-p)

Y la desviación estándar es la raíz cuadrada de la varianza:

σ = √ (np (1-p))

Para las bicicletas deportivas:

Varianza: σ 2 = 4 × 0.9 × 0.1 = 0.36

La ​​desviación estándar es:

σ = √ (0,36) = 0,6

Nota: también podríamos calcularlos manualmente, haciendo una tabla como esta:

X P (X) X × P (X) X 2 × P (X)
0 0,0001 0 0
1 0,0036 0,0036 0,0036
2 0,0486 0,0972 0,1944
3 0.2916 0,8748 2.6244
4 0,6561 2.6244 10.4976
SUMA: 3,6 13,32

La ​​media es la Suma de (X × P (X)) :

μ = 3,6

La ​​varianza es la Suma de (X 2 × P (X)) menos Media 2 :

Varianza: σ 2 = 13.32 – 3.6 2 = 0.36

La desviación estándar es:

σ = √ (0,36) = 0,6

Y obtuvimos los mismos resultados que antes (¡sí!)

Resumen

  • La fórmula general de probabilidad binomial:

    P (k de n) = n! k! (N-k)! p k (1-p) (n-k)

  • Valor medio de X: μ = np
  • Varianza de X: σ 2 = np (1-p)
  • Desviación estándar de X: σ = √ (np (1-p))