¿Qué es el análisis de componentes principales en los SIG?

Curso de ArcGIS Pro | Curso de QGIS | Curso de ArcGIS 10

PCA. Probablemente ya haya visto este acrónimo. PCA significa «Análisis de Componentes Principales».

Pero, ¿qué es? ¿Y cómo lo utilizamos en los SIG y la teledetección?

A veces, las variables están altamente correlacionadas de tal manera que se encontraría información duplicada en otra variable. El análisis de componentes principales identifica los datos duplicados en varios conjuntos de datos. A continuación, el ACP agrega sólo la información esencial en grupos denominados «componentes principales».

El poder del PCA es que crea un nuevo conjunto de datos con sólo la información esencial.

El resultado final es que se reduce la redundancia cuando se utiliza el PCA.

Ejemplo de análisis de componentes principales en ArcGIS

¿Qué pasa con los datos de elevación, pendiente y sombra de la colina?

¿Hay redundancia en estos tres conjuntos de datos?

A continuación se explica cómo realizar un análisis PCA con bandas de elevación, sombra de colina y pendiente en ArcGIS:

1. Ejecute la herramienta «Composite Bands» (bandas compuestas)

La herramienta «Composite Bands» combina los rásteres de elevación, sombra de colina y pendiente en un único ráster de 3 bandas. Utilice los siguientes rásteres como entradas:

  • ELEVACIÓN: Banda 1
  • HILLSHADE: Banda 2
  • PENDIENTE: Banda 3

Haga salir el nuevo ráster como Compuesto

2. Ejecutar la herramienta «Componentes principales»

Utilizando la extensión del analista espacial en ArcGIS, ejecute la herramienta «Componentes principales» con los siguientes criterios:

  • RASTER DE ENTRADA: Compuesto
  • RÁSTER DE SALIDA: PCA
  • NÚMERO DE COMPONENTES PRINCIPALES: 3
  • ARCHIVO DE DATOS DE SALIDA: PrincipalComponents.txt

El resultado será un compuesto PCA de 3 canales y un archivo de datos que muestra la cantidad de redundancia.

3. Analice la tabla de componentes principales

El «Porcentaje de valores propios» muestra la cantidad que representa cada componente principal.

Esta tabla muestra que el primer componente representa el 67,1% de la covarianza.

Cuando se añade el segundo canal, éste representa el 98,1% de la covarianza. El tercer componente no aporta mucha información adicional (1,9%) y es ligeramente redundante con los componentes principales 1 y 2.

¿Cómo utilizar el ACP en teledetección?

La realización de un análisis de componentes principales en tres bandas fue útil porque descubrimos que el tercer componente no añadía mucha información.

¿Qué pasa con una imagen multiespectral de 10 bandas? ¿O incluso 100 o 200 bandas (imágenes hiperespectrales)?

Aquí es donde el PCA es realmente útil: el análisis multiespectral e hiperespectral.

Por ejemplo, si la mayor parte de la varianza (valor propio) se encuentra en los componentes principales uno, dos y tres, sólo es necesario utilizar estos tres componentes principales. Para la clasificación de la cubierta del suelo, es mucho más fácil utilizar tres bandas en comparación con las 10 bandas.

En resumen, el PCA identifica los datos duplicados en varios canales, reduce la redundancia y acelera el tiempo de procesamiento. Esto es clave para el procesamiento de imágenes por análisis de componentes principales.

Traducido desde: gisgeography