La IMD, la Intensidad media diaria medida en vehículos/día, es el dato estrella del Mapa de Tráfico y es al que más atención prestamos y que terminamos por usar siempre en nuestros análisis de aforos.
Normalmente consideramos la IMD como un dato bastante aleatorio, sin voluntad externa de manipularlo y sin errores muy grandes o sistemáticamente repetidos.
¿Cuántos de esos números de intensidad empiezan por 1? O mejor, ¿qué porcentaje de ellos empiezan por 1, 2,… 9?
Es muy fácil pensar, con toda sensatez, que los números estén distribuidos de manera equitativa aproximadamente, es decir, un noveno de los números empezará por 1, otro noveno por 2 y así hasta un noveno que empieza por 9. Pero, aunque pueda parecer fuera de toda lógica, a nivel probabilístico no debería ser así.
La Ley de Benford (o Ley del primer dígito) es una distribución de probabilidad que describe la posibilidad de que un número, presente en una colección de datos reales (población de municipios, precios de las acciones, constantes físicas o matemáticas, etc.), comience por un dígito determinado. Esta función de probabilidad es igual a:
1 | 30,103% |
2 | 17,609% |
3 | 12,494% |
4 | 9,691% |
5 | 7,918% |
6 | 6,695% |
7 | 5,799% |
8 | 5,115% |
9 | 4,576% |
En realidad, ya antes de Benford, parece que esta ley había sido descubierta a finales del siglo XIX, por el matemático y astrónomo Simon Newcomb. Newcomb se dio cuenta de que las páginas de los libros con tablas de logaritmos que hacían referencia a números con el 1 como primer dígito estaban másque las demás. Dedujo que probablemente se debía a que se utilizaban con más frecuencia. Sin embargo, se argumentó que en cualquier libro, en el que se accede a las páginas de forma secuencial, las primeras páginas siempre se utilizarían más que las últimas.
Esta ley es indiferente con respecto a la escala de medición adoptada y también se puede utilizar con cadenas de más de un dígito (por ejemplo, cadenas entre 10 y 99 para estudiar la frecuencia de los primeros dos dígitos o entre 100 y 999 para los primeros tres dígitos).
Para que la frecuencia de los primeros dígitos de los datos referidos a cualquier conjunto sea lo más cercana posible a las probabilidades benfordianas, es crucial respetar algunas reglas:
- los números tienen que ser expresados en el sistema decimal (no vale el binario);
- el conjunto de números debe ser elegido en base a una variable aleatoria;
- todos los dígitos del 1 al 9 deben tener la misma probabilidad de estar en primer lugar en los números que constituyen el conjunto, sin ningún límite incluso inconsciente (por ejemplo la ley no se puede utilizar para verificar la latitud de unos puntos en España porque todos empezarán con 3 o 4);
- los números del conjunto deben ser muchos, evitando las repeticiones;
- el conjunto no debe estar constituido por números asignados (por ejemplo, el ID de las estaciones de aforo);
- los números del conjunto considerado deben estar formados por más dígitos (mejor si al menos cuatro).
La Ley de Benford es una ley empírica y, como tal, es difícil buscar una base teórica. Sin embargo, en el artículo The Law of Anomalous Numbers, Benford señala cómo muchos fenómenos de la naturaleza se caracterizarían por seguir escalas logarítmicas o geométricas en lugar de aritméticas. En general, en los campos más diversos esta situación tendería siempre a producirse, negando, por tanto, la «naturalidad» del concepto de proporcionalidad constante. Como afirma el propio Bendford al final de su artículo, «las cosas pequeñas son más numerosas que las grandes y hay una tendencia a que el paso entre tamaños sea igual a una fracción fija del último fenómeno o acontecimiento precedente».
Son varios los ámbitos en los que se ha aplicado la Ley de Benford: desde las investigaciones sobre presuntos fraudes electorales, hasta los controles realizados en los mercados financieros durante la crisis de 2007/2008 o sobre la veracidad de los resultados publicados en las revistas científicas.
Ahora es útil retomar la IMD y verificar si respeta la Ley de Benford. Los ensayos han sido efectuados sobre los datos de la IMD del total de los vehículos, de los ligeros y de los pesados de las 3577 estaciones de aforo del Mapa de Tráfico 2017 y las 3590 del Mapa de Tráfico 2018 del Ministerio de Transportes, Movilidad y Agenda Urbana del Gobierno de España.
Los dos conjuntos de datos respetan todas las reglas ya definidas por lo que esperamos que cumplan con la Ley de Benford.
Tomamos como ejemplo la estacíon de aforo con ID M-115-0, situada en Madrid en la carretera M-40 en el punto kilometrico 23,85. Su IMD general (contando vehículos ligeros y pesados) del 2018 es 193565.
Estudiando el primer dígito (1 en el ejemplo), tanto el número total como el número de vehículos ligeros y pesados se reparten con pequeñas variaciones según los porcentajes calculados con la fórmula logarítmica en ambas ediciones del Mapa de Tráfico.
También cuando analizamos el reparto según la frecuncia de los primeros dos dígitos (19 en el ejemplo) la Ley es válida.
Y hasta con el análisis de los primeros tres dígitos (193 en el ejemplo) los resultados son comparables con la Ley de Benford, aunque los errores son mucho más visibles.
Lejos de sugerir un modelo de predicción o señalar errores individuales en la medición, que está más allá del alcance descriptivo y analítico de este trabajo, se puede imaginar que las IMD de los Mapas de tráfico siguen una distribución logaritmica y que la Ley de Benford parece confirmarse.
Esta entrada del blog propone dos retos. El primero, a corto plazo, es verificar si la Ley de Benford sigue siendo válida en otros estudios de tráfico y en las mediciones que forman parte de la cotidianidad en la ingeniería de tráfico. El reto a largo plazo es más dificil, laborioso y quizás costoso, pero seguramente ofrecería más variables de cara a la toma de decisión; se empezaría a desarrollar un espacio compartido entre profesionales del transporte, de la estadística y analistas de datos.
Gracias por su lectura.
Francesco Mitolo | Arquitecto – Urbanista
Referencias
Benford, F. (1937). The Law of Anomalous Numbers. 571.
Elba, F. (2020). Dati Covid e legge di Benford.
Martínez Gámez, R. A., & Canizales Rivera, C. E. (2009). Ley de Benford y sus aplicaciones.
Ministerio de Transportes, M. y. (2017). Mapa de Tráfico 2017. Tratto da https://www.mitma.gob.es/carreteras/trafico-velocidades-y-accidentes-mapa-estimacion-y-evolucion/mapas-de-trafico/2017
Ministerio de Transportes, M. y. (2018). Mapa de Tráfico 2018. Tratto da https://www.mitma.es/carreteras/trafico-velocidades-y-accidentes-mapa-estimacion-y-evolucion/mapas-de-trafico/2018