Teorema de Bayes
¡Bayes puede hacer magia!
¿Alguna vez se preguntó cómo las computadoras aprenden acerca de las personas?
Ejemplo:
Una búsqueda en Internet de “cordones de zapatos automáticos de películas” trae “Regreso al futuro”
¿El motor de búsqueda ha visto la película? No, pero sabe de muchas otras búsquedas lo que la gente probablemente está buscando.
Y calcula esa probabilidad usando el Teorema de Bayes.
El teorema de Bayes es una forma de encontrar una probabilidad cuando conocemos ciertas otras probabilidades.
La fórmula es:
P (A | B) = P (A) P (B | A) P (B)
Lo que nos dice: | con qué frecuencia sucede A dado que B sucede , escrito P (A | B) , | |
Cuando sabemos: | con qué frecuencia sucede B dado que sucede A , escrito P (B | A) | |
y cuán probable es que A esté solo, escrito P (A) | ||
y la probabilidad de que B esté solo, escrito P (B) |
Digamos que P (Fuego) significa con qué frecuencia hay fuego, y P (Humo) significa con qué frecuencia vemos humo, entonces:
P (Fuego | Humo) significa con qué frecuencia hay fuego cuando podemos ver humo
P (Humo | Fuego) significa con qué frecuencia podemos ver humo cuando hay fuego
Entonces la fórmula nos dice “hacia adelante” P (Fuego | Humo) cuando sabemos “hacia atrás” P (Humo | Fuego)
Ejemplo:
- los incendios peligrosos son raros (1%)
- pero el humo es bastante común (10%) debido a las barbacoas,
- y el 90% de los incendios peligrosos producen humo
Entonces podemos descubrir la probabilidad de incendio peligroso cuando hay humo :
Por lo tanto, todavía vale la pena echarle un vistazo para saber si hay humo.
Ejemplo: Día de picnic
Estás planeando un picnic hoy, pero la mañana está nublada
- ¡Oh no! ¡El 50% de todos los días lluviosos comienzan nublados!
- Pero las mañanas nubladas son comunes (aproximadamente el 40% de los días comienzan nublados)
- Y este suele ser un mes seco (solo 3 de 30 días tienden a ser lluviosos, o el 10%)
¿Cuál es la probabilidad de lluvia durante el día?
Usaremos Lluvia para significar lluvia durante el día, y Nube para significar mañana nublada.
La probabilidad de lluvia dada Cloud se escribe P (Rain | Cloud)
Entonces pongamos eso en la fórmula:
P (Lluvia | Nube) = P (Lluvia) P (Nube | Lluvia) P (Nube)
- P (Lluvia) es Probabilidad de lluvia = 10%
- P (Nube | Lluvia) es Probabilidad de nube, dado que la lluvia ocurre = 50%
- P (Nube) es Probabilidad de nube = 40%
P (Lluvia | Nube) = 0.1 x 0.5 0.4 = .125
O una probabilidad de lluvia del 12.5%. No está mal, ¡hagamos un picnic!
Solo 4 números
Imagina a 100 personas en una fiesta, y cuentas cuántos visten de rosa o no, y si eres hombre o no, y obtienes estos números:
¡El teorema de Bayes se basa solo en esos 4 números!
Hagamos algunos totales:
Y calcule algunas probabilidades:
- la probabilidad de ser hombre es P (Hombre) = 40 100 = 0,4
- la probabilidad de usar rosa es P (rosa) = 25 100 = 0.25
- la probabilidad de que un hombre use rosa es P (Rosa | Hombre) = 5 40 = 0.125
- la probabilidad de que una persona vestida de rosa sea un hombre P (Hombre | Rosa) = …
¡Y luego llega el cachorro! Qué lindo perrito.
¡Pero todos sus datos están recortados ! Solo sobreviven 3 valores:
- P (Hombre) = 0,4,
- P (rosa) = 0,25 y
- P (Rosa | Hombre) = 0,125
¿Puedes descubrir P (Hombre | Rosa) ?
Imagina que un invitado vestido de rosa deja dinero atrás … ¿fue un hombre? Podemos responder esta pregunta usando el Teorema de Bayes:
P (Hombre | Rosa) = P (Hombre) P (Rosa | Hombre) P (Rosa)
P (Hombre | Rosa) = 0.4 × 0.125 0.25 = 0.2
Nota: si todavía tuviéramos los datos sin procesar podríamos calcular directamente 5 25 = 0.2
Siendo general
¿Por qué funciona?
Reemplacemos los números con letras:
Ahora veamos las probabilidades . Entonces tomamos algunas proporciones:
- la probabilidad general de “A” es P (A) = s + t s + t + u + v
- la probabilidad de “B dada A” es P (B | A) = s s + t
Y luego multiplícalos juntos de esta manera:
Ahora hagamos eso nuevamente pero use P (B) y P (A | B) :
Ambas formas obtienen el mismo resultado de s s + t + u + v
Entonces podemos ver que:
P (B) P (A | B) = P (A) P (B | A)
Agradable y simétrico, ¿no?
En realidad, tiene que ser simétrico ya que podemos intercambiar filas y columnas y obtener la misma esquina superior izquierda.
Y también es Bayes Formula … solo divide ambos lados por P (B):
P (A | B) = P (A) P (B | A) P (B)
Recordando
Primero piensa “AB AB AB”, luego recuerda agruparlo como: “AB = A BA / B”
P ( A | B ) = P ( A ) P ( B | | | ] A ) P ( B )
Alergia a los gatos?
Uno de los usos famosos del Teorema de Bayes es Positivos falsos y falsos negativos .
Para aquellos tenemos dos casos posibles para “A”, como Pase / Fallo (o Sí / No, etc.)
Ejemplo: ¿alergia o no?
Hunter dice que le pica. Hay una prueba de alergia a los gatos, pero esta prueba no siempre es correcta:
- Para las personas que realmente tienen tienen alergia, la prueba dice “Sí” 80% de las veces
- Para las personas que no tienen alergia, la prueba dice “Sí” 10% de las veces (“falso positivo”)
Si el 1% de la población tiene alergia, y La prueba de Hunter dice “Sí” ,
¿Cuáles son las posibilidades de que Hunter realmente tenga la alergia?
Queremos saber la posibilidad de tener alergia cuando la prueba dice “Sí”, escrita P (Alergia | Sí)
Obtengamos nuestra fórmula:
P (Alergia | Sí) = P (Alergia) P (Sí | Alergia) P (Sí)
- P (alergia) es probabilidad de alergia = 1%
- P (Sí | Alergia) es Probabilidad de que la prueba diga “Sí” para personas con alergia = 80%
- P (Sí) es Probabilidad de que la prueba diga “Sí” (a cualquiera) = ??%
¡Oh no! Nosotros no sabemos cuál es la posibilidad general de la prueba que dice “Sí” es …
… pero podemos calcularlo sumando los con y los sin la alergia:
- 1% tiene alergia, y la prueba dice “Sí” al 80% de ellos
- El 99% no tiene alergia y la prueba dice “Sí” al 10% de ellos
Agreguemos eso:
P (Sí) = 1% × 80% + 99% × 10% = 10.7%
Lo que significa que aproximadamente el 10.7% de la población obtendrá un resultado “Sí”.
Entonces ahora podemos completar nuestra fórmula:
P (Alergia | Sí) = 1% × 80% 10.7% = 7.48%
P (Alergia | Sí) = aproximadamente 7%
Este es el mismo resultado que obtuvimos en Falsos positivos y falsos negativos .
De hecho, podemos escribir una versión especial de la fórmula de Bayes solo para cosas como esta:
P (A | B) = P (A) P (B | A) P (A) P (B | A) + P (no A) P ( B | no A)
“A” con tres (o más) casos
Acabamos de ver “A” con dos casos (A y no A), de los cuales nos ocupamos en el resultado final.
Cuando “A” tiene 3 o más casos, los incluimos todos en la línea inferior:
P (A1 | B) = P (A1) P (B | A1) P (A1) P (B | A1) + P (A2) P (B | A2) + P (A3) P (B | A3) + … etc
Ejemplo: El concurso de arte tiene entradas de tres pintores: Pam, Pia y Pablo
- Pam realizó 15 pinturas, el 4% de sus obras ganó el Primer Premio.
- Pia puso 5 pinturas, el 6% de sus obras ha ganado el Primer Premio.
- Pablo colocó 10 pinturas, el 3% de sus obras ha ganado el Primer Premio.
¿Cuál es la posibilidad de que Pam gane el primer premio?
P (Pam | Primero) = P (Pam) P (Primero | Pam) P (Pam) P (Primero | Pam) + P (Pia) P (Primero | Pia) + P (Pablo) P (Primero | Pablo)
Ingrese los valores:
Multiplica todo por 30 (facilita el cálculo):
¡Una buena oportunidad!
Pam no es la artista más exitosa, pero sí hizo muchas entradas.
Ahora, de vuelta a los motores de búsqueda.
Los motores de búsqueda toman esta idea y la amplían mucho (además de algunos otros trucos).
¡Parece que pueden leer tu mente!
También se puede usar para filtros de correo, servicios de recomendación de música y más.