¿Cómo seleccionar el mejor método de interpolación?

Realizar una interpolación es un procedimiento cada vez más sencillo, solo bastan unos clics.

Sin embargo, la teoría subyacente no es tan simple, en los artículos: entendiendo la interpolación, interpolación distancia inversa ponderada, interpolación bilineal se explican los fundamentos.

Para saber cómo interpolar sus datos pueden visitar el artículo: interpolación espacial en  QGIS 3.

Existe una infinidad de métodos de interpolación, ante aquello se pueden dar ciertas interrogantes ¿Cómo seleccionamos el mejor para nuestros datos? ¿Cómo evaluamos el ajuste del método aplicado?

El procedimiento que se describirá a continuación es útil para cualquier interpolación, no obstante, en Modelos Digitales de Terreno deben considerarse otras evaluaciones complementarias que abordaremos con detalle en próximos artículos.

Caso de estudio

Continuamos con la evaluación de muestras de un análisis de suelos, en el artículo evaluando parámetros de suelos interpolados, vimos algunos métodos para explorar dichos datos.

En esta ocasión se aplicaron seis métodos de interpolación del parámetro Potasio (K), se presenta un método que permita escoger la más apropiada (descargar datos del ejercicio).

Métodos:

En la imagen se muestran los métodos de interpolación con la misma escala de valores y paleta de colores.

1 Métodos exactos o aproximados

La primera interrogante que debemos responder, es si el método aplicado es exacto o aproximado.

Interpoladores exactos ‘honran’ los datos de muestra. En otras palabras, en la ubicación de un punto de muestra, la superficie interpolada tiene el mismo valor del punto de la muestra original.

En interpoladores aproximados, hay un reconocimiento que debido a la medida y de otros tipos de error, la mejor superficie de ajuste no puede pasar directamente a través de todos los puntos de la muestra. Sin embargo, el valor de una superficie aproximada en un punto de la muestra será próximo al valor de la muestra inicial. (Fuente: GEOG 486 – Cartography and Visualization )

La evaluación nos dirá si los valores de los puntos conocidos se mantienen luego de la interpolación y que tan marcada es la desviación, dependiendo de la naturaleza de la variable decidirá cual método descartar.

Procedimiento

1.1.- Instale y active el complemento Point Sampling Tool, (detalles consulte el articulo Estadísticas zonales en QGIS 3)

1.2.- Luego, cree un duplicado a partir de la capa Soilsamp (análisis_K.shp), agréguela en QGIS 3, edítela y elimine todos los campos excepto el Potasio.

1.3.- Posteriormente, seleccione menú Complementos > Analyses > Point Sampling Tools. En “Layer containig Samples Point” seleccione la nueva capa análisis_K.shp.

En la misma caja de dialogo seleccione el campo K y los seis raster, puede verificar los campos que serán creados en la pestaña Field.

 

Finalmente, de un nombre al archivo de salida (K_metodos.shp) y clic en Ok.

1.4.- Al abrir la tabla de atributos de la nueva capa, note que cada punto tiene el valor medido y el interpolado por los métodos.

1.5.- Luego, genere un campo para almacenar el cálculo de la diferencia entre el valor medido y el estimado por cada método.

El cálculo lo realiza utilizando la calculadora de campos, para detalles consulte el articulo Operaciones básicas con Tablas en QGIS 3.

En la imagen el  valor medido y las diferencias con cada método, los valores positivos indican donde el valor medido fue mayor que el estimado y los negativos el caso contrario

1.6.- Seguidamente, consulte para cada diferencia las estadísticas: mínimo, máximo, media y desviación estándar

Para calcular estadísticas de campo consulte el artículo: estadísticas de campos en QGIS 3.

En la tabla se han colocado las estadísticas en una hoja de Excel.

Ahora, puede evaluar que tanto “respetan” los métodos de interpolación el valor medido o real.

El método de Distancia Angular Ponderada (ADW) es el más fiel a los datos de entrada, seguido por el IDW.

El método TIN presenta alta desviación estándar, algo atípico dado que es un método exacto, es recomendable recalcularlo.

2.- Evaluando la precisión de los métodos de interpolación

El procedimiento anterior no evalúa que tan bueno es un método como estimador.

El cálculo del Error de la Raíz Cuadrada de la Media permite comparar los valores estimados y los observados.

Para ello se escogerá un 10% de los puntos, se repetirá la interpolación sin ellos, finalmente, se evaluara que tan bien predicen sus valores.

Procedimiento:

2.1.- Selección una muestra del 10% de los puntos de análisis de suelos para ello, menú Vectorial > Herramientas de investigación > Selección Aleatoria:

2.2.- En capa de entrada seleccione “análisis_K.shp”, el método “Porcentaje de Objetos Seleccionados”, en “Numero/porcentaje de objetos seleccionados” coloque 10.

De esta forma se han seleccionado aleatoriamente 7 puntos de los 74.

2.3.- Luego, cree una nueva capa con los puntos seleccionados, llame a la capa “puntos de validación”.

2.4.- Posteriormente, active la edición de la capa “análisis_K.shp” y elimine los puntos seleccionados, realice de nuevo las interpolaciones.

Calculo del Error de la Raíz Cuadrada de la Media (RMSE)

2.5.- Seleccione menú Complementos > Analyses > Point Sampling Tools. En “Layer containig Samples Point” seleccione la capa puntos_validación.shp

Luego, en la caja de dialogo, seleccione el campo K y los seis raster recién creados. De un nombre al archivo de salida.

2.6.- Repita los pasos 1.5 al 1.6, el campo con las menores diferencias identifica el mejor estimador.

Puede observar puntos en los métodos presentaron una mala estimación, esto puede indicar valores atípicos o la presencia de patrones direccionales (anisotropía).

2.7.- El RMSE consiste en el cálculo de la media de las desviaciones entre valores observados y predichos:

Dónde:

  • RMSE: Error de la Raíz Cuadrada de la Media
  • O: valor observado o medido
  • P: valor estimado
  • N: número de puntos, 67

Luego, extraiga la estadística suma de cada diferencia y realice las operaciones en una tabla de Excel:

En este caso el método IDW genero la mejor estimación, pudo deberse a  una modificación en los parámetros al volver a interpolar con ADW.

El valor del RMSE se encuentra en las unidades de la variable, puede definir un umbral de error admisible

Finalmente, puede repetir el proceso con otros puntos de validación.

También, es recomendable alterar o agregar más métodos de interpolación, aplicar variaciones y ajustes.

Autor: Luis Eduardo Pérez Graterol
Profesión: Ingeniero en Recursos Naturales
País: Venezuela
Web: www.mundocartogeo.blogspot.com

12 comentarios en “¿Cómo seleccionar el mejor método de interpolación?”

  1. Hola, como siempre excelentes artículos, ahora bien, como se calcula o se hace la interpolacion ADW en QGIS?

    Muchas gracias

    Eddison

  2. Hola, como siempre excelentes artículos, ahora bien, como se calcula o se hace la interpolacion ADW en QGIS?

    Muchas gracias!

    Eddison

  3. El artículo está muy bien.
    Yo el problema que le veo al krigging es que no sabes qué variograma utiliza y sus parámetros. Supongo que utilizará algún procedimiento de ajuste automático, pero si quieres utilizar este procedimiento en algún estudio o informe necesitaríamos saber algo más y poder incluso probar tú mismo con distintas opciones.

    • Hola Luis, gracias por tu comentario e interés.
      Tienes toda la razón estos métodos, incluso los deterministicos tienen una serie de parámetros que deben ser configurados acorde con los datos de entrada.
      Mucho más los geoestadísticos inicialmente ver si el numero de datos es suficiente para su aplicación, luego explorar su comportamiento y estadísticas, tienen un comportamiento normal, estacionariedad, tendencias dominantes y esto se extiende.
      La idea del articulo es hacerlo de la forma mas didáctica y sencilla posible, si entro en estos detalles puedo confundir al lector novicio, el objetivo es que comprenda el procedimiento, sus alcances y pueda repetirlo
      Es más ni siquiera (Que me han preguntado) se desea valorar que método de interpolación es mejor, ni como se generan muchos de ellos, estos temas podrán abordarse en posteriores artículos y de forma paulatina cubrir la integralidad del tema

      • Luis, te comento, de todos los métodos de interpolación el que no pude lograr es el krigging justamente por lo que acota Luis Solis, sin embargo, te invito a que instales el complemento de R para QGIS y pruebes la extensión que hace el mejor cálculo de variograma posible y te hace la interpolación estadística más precisa y correcta, en mi caso no me dió el tiempo para entender los resultados para presentarlos en el congreso donde participé, en fin, esto es tema de tarea que se puede trabajar para presentar.

        • Hola Mauricio, sería bueno para todos que publiques el paso a paso de lo comentas con R en Qgis, asi viendo tu proceso muchos aprendemos.

          Gracias

          Eddison

          • Sería muy útil para todos, si gustas los puedes enviar a: soporte (arroba) arcgeek . com
            Luego lo podemos publicar en este blog.

  4. Hola Franz,

    Quisiera consultarte porque cuando realizo el “point sampling tool” no me arroja sólo la columna de valores de interpolación, pero no me mantiene la de los variables observados que dejé en la capa.
    Que será lo que estoy haciendo mal?
    Bueno, desde ya, muchas gracias.

Los comentarios están cerrados.