01 agosto 2012

Inverosímil

Después del desastre causado al enviar un trozo de hojalata a Marte, nuestro hipotético protagonista el señor Morcillo (me parece más adecuado que hablar en segunda persona), decidió retirarse a una vida de paz y tranquilidad, lejos de la civilización, ¿y qué mejor sitio que Guinea Ecuatorial? Bueno, en realidad hay otros muchos sitios, pero el señor Morcillo no anda muy puesto en idiomas, ni tampoco en historia contemporánea porque de haber sabido que en Guinea Ecuatorial hay una de las dictaduras más opresoras del mundo, nunca habría ido allí.  Aunque algo bajito, muy moreno no es pero, entre reformas laborales y otras mamandurrias varias, tan quemado estaba que pasaba desapercibido entre la población pigmea local. No le sería fácil adaptarse a sus costumbres, pero después de unas pocas decenas de años seguro que se sentiría como en casa.


He aquí un mapa, para los despistados. Licencia CC Wikimedia Commons

Tan lejos de la civilización y, por consiguiente, cualquier forma de entretenimiento moderno, el señor Morcillo tenía que hacer algo para mantener su mente ocupada, que eso de estar en territorio salvaje parece muy interesante en supervivientes pero en realidad aburre bastante. Después de muchas horas intentando ejercitar poderes paranormales sobre la fauna local de cabras, que aparentemente sólo funciona si eres George Clooney, desarrolló cierta curiosidad sobre la verdadera altura de los pigmeos. ¿Cuál será la estatura del pigmeo medio?
Por desgracia, medir a todos y cada uno de los pigmeos no era una solución viable. Una de las maneras más comunes de resolver este tipo de problemas es tomando una muestra representativa de la población. Una vez tenemos un número de sujetos más manejable, podremos estimar la media y extrapolar ese número al total de la población. Si lo que estás pensando es que con tomar la media aritmética de la muestra ya obtendríamos la solución a nuestro problema, estás equivocado y te recomiendo que sigas leyendo.


El señor Morcillo, posando con parte de la muestra de la población. Licencia CC Wikimedia Commons

¿Por qué la media de la muestra no es suficiente? Porque con la media estamos asumiendo que la distribución de la estatura es completamente uniforme y, además, descartamos parámetros importantes a tener en cuenta como la varianza o el tipo de distribución. Para una distribución normal, una simple media aritmética acaba resultando en una aproximación bastante decente y en muchos casos puede ser suficiente, pero no es la manera más correcta. ¿Y si tuviéramos un método que, además de ser más correcto, funcionase con otro tipo de distribuciones conocidas? Pues lo tenemos, y se llama estimación por máxima verosimilitud.


Cualquiera que tenga una mínima idea de estadística sabrá que la distribución de la estatura, además de ser un tipiquísimo ejemplo, suele ser aproximadamente una distribución normal o gaussiana; en otras palabras, la campana de toda la vida. Una vez conocida la distribución correspondiente a nuestra muestra, simplemente estimamos el verdadero valor de la media mediante la estimación por máxima verosimilitud. Para hacer tal estimación, básicamente estaremos aplicando ingeniería inversa sobre la función de densidad correspondiente a la distribución que creamos sea la más aproximada a la distribución real. Las matemáticas detrás de estos conceptos son más feas que una nevera por detrás, así que me voy a limitar a describir los pasos a seguir conceptualmente:


  1. Encontrar la función de densidad conjunta de todas las estimaciones. Que en cristiano es lo mismo que coger la función de densidad que hayamos elegido, y meter los valores que hayamos medido (multiplicando cada función, porque las probabilidades conjuntas siempre se multiplican).
  2. Como el verdadero valor de la media es desconocido, el resultado del paso anterior debería estar en función de tal valor como variable. Entonces sólo queda maximizar la ecuación resultante para, dadas nuestras mediciones, encontrar el verdadero valor de la media con el que es más probable que nuestras mediciones sean las correspondientes a la distribución elegida.


Visualización realista de los pasos a seguir para la estimación de máxima verosimilitud. Licencia CC Wikimedia Commons

¡Y ya está! El método que conceptualmente es tan poco complejo es un pilar fundamental para la aplicación práctica de nuestros conocimientos sobre estadística usando mediciones reales. Uno de los ejemplos prácticos más importantes son los modelos lineares que, los conozcas o no, nos afectan a tí, a mí y al señor Morcillo todos los días en cosas como los precios en el súper, la tarifa de la luz, el pronóstico del tiempo... Y otra infinidad de ejemplos que me sería imposible de enumerar.

No hay comentarios:

Publicar un comentario