Mapas de coropletas – Una guía para la clasificación de datos

Intervalos iguales, cuantiles, roturas naturales, roturas bonitas. Cada método de clasificación de datos genera diferentes mapas de coropletas. Explicamos las ventajas y desventajas de usar este tipo de mapas.

Cómo hacer mapas de cloropletas utilizando la clasificación de datos

Tiene sus datos cuantitativos listos para usar. Su ratón se encuentra sobre “clasificar” en espera de generar los muchos colores de los mapas de cloropletas.

Pero no puede evitar preguntarse si está eligiendo el modo de clasificación de datos correcto.

Intervalos iguales, cuantiles, roturas naturales, roturas bonitas – hay mucho de donde escoger. Pero, ¿cuál es la diferencia entre cada uno de ellos?

Este post le ayudará a entender los tipos de mapas de coropletas que existen y cuál elegir.

Elija su número de clases

En primer lugar, se deben agregar datos basados en una serie de clases. Cuando tienes más clases, obtienes más variación, lo que a veces dificulta la separación de los sombreados. Si desea probar diferentes sombreados, ColorBrewer tiene una herramienta de asesoramiento de color.

Por ejemplo, aquí hay 10 clases:

Mientras que un menor número de clases proporciona una menor separación entre ellas, como por ejemplo 5 clases más abajo.

Después de todo, el número de clases que decidas depende realmente del propósito de tu mapa.

Seleccione su método de clasificación de datos

En segundo lugar, tendrá que decidir cómo clasificar sus datos. En otras palabras, la clasificación de datos los ordena con límites para separar clases. Puede separar sus clases con un modo de intervalo igual:

Intervalos iguales

Alternativamente, puede seleccionar un tipo de clasificador de cuantiles en el que se ordenen los datos de forma diferente (más información a continuación).

Histograma-Quantiles

Cada técnica de clasificación de datos produce mapas de coropletas únicos. Pero todos pintan una historia diferente para el lector de mapas. Lo único que debe tener en cuenta es que está utilizando los mismos datos en cada mapa de coropletas, pero lo que realmente está cambiando es la forma en que clasifica los datos.

Nuestros datos de ejemplo

Lo más importante que tienes que tener en cuenta es que para cada uno de estos mapas de coropletas que creamos, usamos los mismos datos. Lo que está cambiando es cómo clasificamos los datos.

En este ejemplo, se cuenta el número de letras de los nombres de los países. Por ejemplo:

  • Malí, Cuba y Perú y otros tienen son países con cuatro letras.
  • Mientras que Bosnia y Herzegovina tiene 22 caracteres.

Si dibujas de 4 a 22 caracteres, tendrá muchos colores.

Por ejemplo, los países de cuatro letras son los tonos más claros de verde. A medida que aumenta el número de letras, el sombreado se oscurece.

Mapa-de-clases

¿Qué país pertenece a qué grupo? Es difícil de decir.

Por eso utilizamos la clasificación de datos. Cuando agrupamos por clases, hay menos sombreado y agregamos los datos por grupo.

En última instancia, la pregunta es ¿cómo definimos esos límites de clase o contenedores? En otras palabras, ¿cómo clasificamos los datos en grupos?

Primero, intentemos dividir las clases en grupos espaciados uniformemente como intervalos iguales, a continuación veamos qué sucede.

Clasificación de datos en intervalos iguales

El mismo intervalo se corta y se seca. Todo lo que realmente hace es dividir las clases en grupos iguales.

  • Clase 1: 4 – 8 (113 países que tienen cuatro, cinco, seis, siete u ocho letras)
  • Clase 2: 8 – 12 (41)
  • Clase 3: 12 – 16 (12)
  • Clase 4: 16 – 20 (8)
  • Clase 5: 20 – 24 (2)

El número mínimo de caracteres de un país es de 4 como Perú. El número máximo de caracteres es de 24, que es la República Centroafricana. Cuando se traza cada país, su número de caracteres en un mapa, se ve así (los paréntesis indican el número):

Map-coropletas-intervalos-iguales

La clasificación de datos a intervalos iguales resta el valor máximo del valor mínimo (24-4=20). En nuestro ejemplo, generamos 5 clases pero el número de clases depende totalmente de ti. Luego, se divide 20 por 5 y se obtiene un intervalo (20/5=4).

Casi siempre, los mapas de coropletas de intervalos iguales dan como resultado un recuento desigual de países por clase. Por ejemplo, la clase 1 tiene 113 países de 176 países con cuatro, cinco, seis y siete letras.

Sin embargo, sólo 2 países tienen más de 20 cartas. Como resultado, este mapa muestra más colores sombreados claros en comparación con sólo 2 con el sombreado oscuro.

Pero, ¿qué sucede si se desea que el recuento de países en cada clase sea casi igual? Ahí es cuando deberías usar un mapa de cuantiles.

Clasificación de Cuantiles (Equivalente)

El mapa de cuantiles intenta encasillar el mismo número de características en cada una de las 5 clases. En otras palabras, los mapas de cuantiles intentan organizar los grupos para que tengan la misma cantidad. Como resultado, el sombreado se verá igualmente distribuido en tipos de mapas de cuantiles.

Histograma-Quantiles-
  • Clase 1: 4 – 6 (56 países tienen nombres de 4, 5 o 6 letras)
  • Clase 2: 6 – 7 (38)
  • Clase 3: 7 – 8 (19)
  • Clase 4: 9 – 11 (36)
  • Clase 5: 12 – 24 (27)

Los mapas de cuantiles toman el total del número de características (176 países en nuestro caso). Luego, divide el total por el número de clases para obtener el promedio (176/5=35.2). Finalmente, los mapas de cuantiles cuentan la cantidad en cada grupo y los colocan lo más cerca posible del promedio.

Usted puede ver como el conteo de cada clase se ve muy similar y está cerca de 35.2. Para cada clase, no hay demasiados o muy pocos para contar.

A pesar del estilo equilibrado de los mapas de coropletas de cuantiles, también pueden ser engañosos. Son engañosos porque la gente tiende a mirar una sombra y agruparla en la misma categoría. Por ejemplo, un país de 12 letras recibe el mismo matiz oscuro que un país de 24 letras… y ¿dónde está la justicia en eso?

Clasificación con Natural Breaks (Jenks)

Lo primero que hay que recordar sobre la clasificación de Natural Breaks (Jenks) es que es un método de optimización para mapas de coropletas. En resumen, ordena cada grupo de modo que haya menos variación en cada clase o sombreado.

Natural-Breaks-Histogram
  • Clase 1: 4 – 6 (56)
  • Clase 2: 6 – 8 (57)
  • Clase 3: 8 – 12 (41)
  • Clase 4: 12 – 18 (18)
  • Clase 5: 18 – 24 (4)

Natural Breaks (Jenks) toma un enfoque iterativo al comparar la suma de las desviaciones cuadradas entre clases con la media del sistema. Entonces, el algoritmo utiliza una bondad de ajuste de varianza con 1 como ajuste perfecto y 0 como ajuste pobre.

Natural-Breaks-Jenks-Choropleth-Map

El fundador del método de clasificación de datos de Natural Breaks fue un cartógrafo llamado George Frederick Jenks. Se especializó en el monitoreo de los movimientos oculares de las personas cuando miran un mapa. Y los resultados de este mapa también se veían muy bien.

Puede ver cómo este método de clasificación de datos minimiza la variación en cada grupo. Como tenemos muchos nombres de países más cortos, encuentra rangos de clases adecuados. Pero aún así logra agrupar los valores atípicos con nombres de países más largos en una clase propia.

Clasificación por desviación estándar

La desviación estándar es un tipo de mapa de técnica estadística basado en la diferencia entre los datos y la media. Se mide la media y la desviación estándar de los datos. Entonces, cada desviación estándar se convierte en una clase en sus mapas de coropletas.

Deviacion-estandard

En nuestro caso, el número medio de caracteres es de unos 8,5 con una desviación estándar de 3,7 caracteres. Como resultado, todos los países con 5 a 8 caracteres se colocarán en el grupo de desviación estándar 0 a -1. Asimismo, los países con 9 a 12 letras se agrupan en un rango de desviación estándar de 0 a 1 como éste:

Mapa-desviacion-estandard
  • Clase 1: <-1 σ (9)
  • Clase 2: -1 a 0 σ (104)
  • Clase 3: 0 a 1 σ (41)
  • Clase 4: 1 a 2 σ (10)
  • Clase 5: 2 a 3 σ (9)
  • Clase 6: 3 a 4 σ (2)
  • Clase 7: >=4 σ (1)

Las categorías en bruto como salida necesitan un poco de aclaración para el lector. ¿Cuál es el promedio? ¿Cuál es el rango para cada desviación estándar?

A pesar de estas inconsistencias, los tipos de mapas de desviación estándar podrían ser uno de los más apropiados debido a su origen estadístico. Los países de 4 letras son <-1 desviaciones estándar. Los países con 5 a 8 letras son de -1 a 0 desviaciones estándar. El país de 24 letras es >4 desviaciones estándar debido a su desviación extrema de la media de 8,5.

Clasificación de Pretty Breaks

Si quieres números redondos en tus rangos, entonces deberías elegir descansos agradables. Lo único que hace un buen descanso es redondear cada punto de descanso hacia arriba o hacia abajo. Así que en lugar de tener un punto de ruptura como 599.364 se convertirá en 600.000 con bonitas rupturas.

Es un poco difícil ver qué tan redondos son los números (está agrupado por 5) en este ejemplo porque todos los ejemplos anteriores también producen números redondos. Pero cuando se tienen grandes cantidades, como las estimaciones de población (ver más adelante), se generan algunas rupturas muy bonitas.

  • Clase 1: 4 – 5 (29)
  • Clase 2: 5 – 10 (111)
  • Clase 3: 10 – 15 (24)
  • Clase 4: 15 – 20 (10)
  • Clase 5: 20 – 24 (2)

Como resultado de hacer números redondeados, las pausas bonitas también serán muy selectivas para el número de clases que decidas.

Resumiendo las técnicas de clasificación

He aquí cómo se comparan las estimaciones de población entre las técnicas de clasificación de datos:

Intervalo igual:

Cuantiles:

Cuantiles

Natural Breaks (Jenks):

Pretty Breaks. Eso sí que es bonito:

Pruébelo usted mismo

Los mapas de coropletas utilizan diferentes sombras y colores para mostrar la cantidad o el valor en áreas definidas.

A menudo, el fabricante del mapa utiliza un tipo de clasificación de datos para producir su propio mapa de coropletas único. Cada método de clasificación de datos tiene un impacto diferente en el lector.

Hay varias maneras de clasificar los datos en el SIG. Hemos resumido sus diferencias con diferentes ejemplos de mapas de coropletas. Utilice esta guía para clasificar prácticamente cualquier cosa, como las tasas de criminalidad, el nivel de educación y la política.

Traducido desde: GISGeography

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.