domingo, 17 de febrero de 2013

Estadísticas


Una de las muchas cosas que aprendí de mi director de tesis, el Prof. Juan Arana, es que hay mentiras, grandes mentiras y estadísticas. Después, con el correr de los años, llegué a descubrir la existencia de otra escala en esa jerarquía, la que incluye lo que la gente dice en los foros de Internet. Pero no es de este último eslabón del que quiero hablar, sino del anterior. Las omnipresentes estadísticas son dioses con pies de barro. Elaborar una estadística exige una cuidadosa recogida de datos que, la mayor parte de las veces, resulta impracticable. Para empezar está la cuestión de qué es una muestra significativa. ¿A cuántos hay que preguntar y a quién hay que preguntar? ¿a cualquiera? ¿a personas directamente afectadas por la cuestión de que se trate? ¿a personas seleccionadas al azar, o, como suele ser habitual, a grupos de personas predispuestas a responder a las cuestiones, es decir, opinadores pseudoprofesionales? Suponiendo que se haya solventando exitosamente esta cuestión no habremos avanzado gran cosa. El siguiente obstáculo es qué preguntar y cómo. Hay una famosa encuesta realizada en España hacia mediados de los años setenta los domingos por la mañana. A una parte de los encuestados se les preguntaba si eran católicos practicantes, algo que respondieron afirmativamente más del 75% de los participantes. A otra parte se les preguntaba qué actividades habían realizado esa dominical mañana. Menos del 25% incluía en su respuesta haber asistido a misa. ¿Cuántos católicos practicantes había realmente en España? Es sabido que menos del 40% de las personas acaban comprando exactamente lo que dijeron a la entrada del supermercado que iban a comprar. Supongamos que ya hemos superado este obstáculo y tenemos datos “objetivos”, por ejemplo, que en los últimos cinco años la superficie de un bosque se quemó, sucesivamente, en un 50%, un 30%, un 20%, un 0% y un 0%. Se puede hallar la media, la mediana, la desviación típica y la tendencia de dicha curva. Podemos establecer una correlación entre ella y el dinero invertido en la prevención de incendios en esa zona. Nada mejor que utilizar los diferentes tipos de regresión estadística para hallar si, efectivamente, hay una relación causal de dicho factor o no, sin descartar el empleo de herramientas mucho más complejas y sutiles. ¿Cuál es la realidad subyacente a semejantes estadísticas? Pues, probablemente, la realidad subyacente es que nuestro “bosque” consta desde hace dos años de un único árbol, en torno al cual juegan al mus los retenes antiincendios.
Las estadísticas pueden decir mucho, poco o nada acerca de una realidad. Pero si las estadísticas hay que tratarlas con muchísimo cuidado, cuando van acompañadas de una gráfica, podemos tener por seguro que nos van a dar el timo del tocomocho. Lo primero que hay que entender es que cualquier gráfica es una simplificación de la realidad, jamás la realidad misma. Por si fuera poco, el tipo de gráfica que se elija es cualquier cosa menos inocente. Diferencias, aparentemente estéticas, como presentar el gráfico en dos o en tres dimensiones, puede afectar sensiblemente su legilibilidad, pues estamos bastante capacitados para comparar figuras de dos dimensiones, pero no tanto para hacerlo con figuras tridimensionales. Una gráfica del tipo “tarta” muestra una realidad permanente, es una instantánea. En general, no nos las apañamos bien si tenemos que comparar el aumento o disminución de las porciones de esa “tarta” y siempre cabe la posibilidad de utilizar colores semejantes para diferentes sectores y así ocultar cualquier cosa. Peor son las estadísticas con barras. En ellas, la elección de las unidades para el eje vertical lo es todo. Tomemos el caso de una serie de magnitudes aleatorias, como son los números de la lotería primitiva. Si utilizamos como unidad del eje vertical diez apariciones de un número, el resultado serán 49 barras separadas unas de otras por algo más de unos milímetros. La impresión es que todos los números salen con la misma frecuencia, que es lo que ocurre. Pero si la unidad que tomamos es una aparición, entonces, las barras de unos y otros pueden estar claramente separadas, dando la impresión de que hay números que salen mucho más que otros. Aún peor es si, para el mismo caso, tomamos una gráfica de puntos enlazados por líneas para formar una curva. Ahora todo depende de las unidades que elijamos para el eje horizontal. Tomando en él la totalidad de sorteos de tres meses, la curva tenderá a ser una recta, con muy pocas variaciones y poco aliciente para ulteriores análisis. Tomando como unidad dos o tres sorteos, tendremos una curva tipo “dientes de sierra”, con subidas y bajadas como las de la bolsa y rápidamente despertará en nosotros el deseo de aplicarle herramientas estadísticas para ver si podemos predecir futuras apariciones de números... ¿Podemos?
Es relativamente fácil crear una fórmula cuyos resultados coincidan, más o menos, con los de la aparición, hasta ahora, de un determinado número en un sorteo cualquiera. Ese “más o menos”, alude a una serie de técnicas que constituyen el último eslabón para hacer locuaz lo que, por definición, no dice nada, esto es, las estadísticas. Los científicos las conocen bien. Incluyen la famosa técnica del punto gordo y la de la recta astuta, entendiendo por tal, una recta que pasa por tres puntos no necesariamente alineados. Pero, ¡ay! contrariamente a lo que dicen las herramientas estadísticas, dos curvas que han coincidido hasta ahora en un millar de puntos no tienen por qué seguir haciéndolo en el punto 1001. 
Teniendo en cuenta todo lo anterior, resulta hilarante que los inspectores educativos lleguen a los centros andaluces estampando en la cara de los profesionales una serie de estadísticas, nada menos que como “evidencias”. Lo único evidente en este modo de proceder es que quien así actúa, acude cargado con una serie de prejuicios destinados a hacer todo lo posible para taparse los ojos y no ver una realidad que sus superiores jerárquicos se niegan a leer en los informes que les presentan. Y aquí llegamos a la clave de por qué las estadísticas, a diferencia de las mentiras que pueden leerse en los foros de Internet, se han vuelto tan peligrosas: su uso demagógico por parte de los políticos. En esencia, todo político que apoya sus argumentos en una estadística, está mintiendo. Es fácil verlo en estos días. Exhibir estadísticas macroeconómicas para demostrar que la situación de un país está mejorando, mientras miles de familias tienen por única comida diaria la que pueden obtener de los servicios de caridad, es una repugnante muestra de hasta qué punto los políticos están dispuestos a negar los hechos si con ello pueden seguir manteniendo sus despachos, sus coches oficiales y sus muy lujosas amantes. Porque la realidad que se oculta detrás de la supuesta estabilización de los indicadores macroeconómicos es que a nuestro bosque ya sólo le queda un árbol.

No hay comentarios:

Publicar un comentario