Los datos espacialmente explícitos (ej. datos que muestran la distribución de las especies) generalmente manifiestan autocorrelación espacial. La autocorrelación espacial ocurre cuando los valores de las variables muestreadas en puntos cercanos no son independientes entre sí o, dicho de otro modo, cuando muestras próximas entre sí exhiben valores más parecidos que con muestras más alejadas. La causa principal de la autocorrelación espacial es la relación existente entre la distancia y determinados procesos biológicos como la especiación, la extinción, la dispersión o las interacciones entre especies. Existen dos causas más que pueden producir dependencia espacial de los residuos del modelo (no autocorrelación espacial en sentido estricto), pero a efectos estadísticos, los efectos de dicha dependencia espacial suponen los mismos problemas que los de la autocorrelación espacial. Estas son: (1) el intento de modelar linealmente relaciones no lineales entre la variable respuesta y las variables ambientales; y (2) la ausencia en el modelo de variables ambientales que están espacialmente estructuradas y, que por tanto, causan una estructura espacial en la variable respuesta (ej. variables climáticas).
La autocorrelación espacial es a la vez una oportunidad para explicar determinados procesos (ej. procesos de contagio, dispersión geográfica, organización social, etc.) y un reto para el análisis de datos espaciales, ya que los residuos de los modelos no son totalmente independientes y esto conlleva un aumento del error de tipo I (esto es, rechazar la hipótesis nula siendo cierta). Por ello se han desarrollado en los últimos años una gran variedad de métodos para corregir los efectos de la autocorrelación espacial. En este artículo se presentan y explican seis métodos concretos: el mapeo espacial de vectores propios (spatial eigenvector mapping, SEVM), generalización de mínimos cuadrados (generalised least squares, GLS), modelos autorregresivos condicionales (conditional autoregressive models, CAR), modelos autorregresivos simultáneos (simultaneous autoregressive models, SAR), modelos lineales generalizados mixtos (generalised linear mixed models, GLMM) y ecuaciones de estimación generalizadas (generalised estimation equations, GEE). También se discute en qué condiciones el uso de uno u otro modelo es más adecuado y se provee el código en R para implementar estas funciones.
Todos estos modelos asumen la existencia de estacionariedad (spatial stationarity) e isotropía (isotropic spatial autocorrelation). La estacionariedad se refiere al hecho de que la autocorrelación espacial es constante en el espacio. Esto no siempre es necesariamente cierto. Por ejemplo, en el caso de la capacidad de dispersión de un organismo, ésta podría cambiar al pasar de la llanura a la montaña, en dónde el movimiento está más restringido. La isotropía se refiere a qué la autocorrelación espacial actúa de la misma forma en todas las direcciones. Algunos factores ambientales que podrían causar anisotropía son el viento (dando a un organismo que se dispersa con el viento una dirección de movimiento preferente), las corrientes de agua (ej. en el movimiento del plancton) o la direccionalidad en el transporte del suelo a favor de pendiente.
La autocorrelación espacial es a la vez una oportunidad para explicar determinados procesos (ej. procesos de contagio, dispersión geográfica, organización social, etc.) y un reto para el análisis de datos espaciales, ya que los residuos de los modelos no son totalmente independientes y esto conlleva un aumento del error de tipo I (esto es, rechazar la hipótesis nula siendo cierta). Por ello se han desarrollado en los últimos años una gran variedad de métodos para corregir los efectos de la autocorrelación espacial. En este artículo se presentan y explican seis métodos concretos: el mapeo espacial de vectores propios (spatial eigenvector mapping, SEVM), generalización de mínimos cuadrados (generalised least squares, GLS), modelos autorregresivos condicionales (conditional autoregressive models, CAR), modelos autorregresivos simultáneos (simultaneous autoregressive models, SAR), modelos lineales generalizados mixtos (generalised linear mixed models, GLMM) y ecuaciones de estimación generalizadas (generalised estimation equations, GEE). También se discute en qué condiciones el uso de uno u otro modelo es más adecuado y se provee el código en R para implementar estas funciones.
Todos estos modelos asumen la existencia de estacionariedad (spatial stationarity) e isotropía (isotropic spatial autocorrelation). La estacionariedad se refiere al hecho de que la autocorrelación espacial es constante en el espacio. Esto no siempre es necesariamente cierto. Por ejemplo, en el caso de la capacidad de dispersión de un organismo, ésta podría cambiar al pasar de la llanura a la montaña, en dónde el movimiento está más restringido. La isotropía se refiere a qué la autocorrelación espacial actúa de la misma forma en todas las direcciones. Algunos factores ambientales que podrían causar anisotropía son el viento (dando a un organismo que se dispersa con el viento una dirección de movimiento preferente), las corrientes de agua (ej. en el movimiento del plancton) o la direccionalidad en el transporte del suelo a favor de pendiente.
F. Dormann, C., M. McPherson, J., B. Araújo, M., Bivand, R., Bolliger, J., Carl, G., G. Davies, R., Hirzel, A., Jetz, W., Daniel Kissling, W., Kühn, I., Ohlemüller, R., R. Peres-Neto, P., Reineking, B., Schröder, B., M. Schurr, F., & Wilson, R. (2007). Methods to account for spatial autocorrelation in the analysis of species distributional data: a review Ecography, 30 (5), 609-628 DOI: 10.1111/j.2007.0906-7590.05171.x