Fundamentos de Modelado e Interpolación de Datos Geográficos

Conceptos Fundamentales en Geografía y Modelado Espacial

Extrapolación:
Se refiere a la estimación de valores fuera del área de estudio.
Convolución:
Es la transformación de imágenes rasterizadas (documentos, fotos aéreas o imágenes de satélites) de una resolución espacial y orientación a otra.
MDT (Modelo Digital del Terreno):
Es una estructura numérica de datos que representa la distribución espacial de una variable cuantitativa y continua.
MDE (Modelo Digital de Elevación):
Estructura numérica de datos que representa la distribución espacial de la altitud de la superficie del terreno.
Variable Aleatoria Regionalizada:
Son variables que pueden tomar cualquier valor dentro de un rango determinado y tienen una posición en el espacio.
Estimación:
Es obtener valores desconocidos a partir, no solo de los conocidos, sino también de su estructura de continuidad espacial.
Error Medio:
Distancia dirigida que tiene el dato xi de la media aritmética muestral o poblacional (promedio). Es decir, qué tan cercano o lejano está el dato del promedio.
Estimación Kriging:
Consiste en la obtención de un valor estimado, de un valor real y desconocido, basándose en una combinación lineal de pesos asociados a cada localización donde fue muestreado un valor del fenómeno estudiado, teniendo en cuenta dos condiciones: que el estimador sea insesgado y que la varianza sea mínima.
Modelo Vectorial:
Objetos geométricos definidos por las coordenadas de sus nodos y vértices; los atributos del terreno se representan en puntos, líneas y polígonos.
Modelo Ráster:
Localizaciones espaciales a las cuales se les asigna un valor para la unidad de la superficie; los datos se interpretan como el valor medio de las unidades de la superficie.
Simulación:
Es una modelización de objetos que permite generar escenarios futuros o reconstruir escenarios.
Co-Kriging:
Método que nos permite generar datos, utilizando los valores que son dependientes para generar una proyección con base en los valores que son independientes. Hay variables que generan estimación a través de los datos que ya existen.
Variograma:
Se define como la media aritmética de todos los cuadrados de las diferencias entre pares de valores experimentales separados una distancia h.
Semivariograma:
Depende del número de pares de la distancia h de los valores y de las localizaciones de donde provienen los valores.

Métodos y Técnicas de Interpolación y Modelado Espacial

1. ¿Qué es la Interpolación?

El proceso de interpolación consiste en la estimación de valores que alcanza una variable Z en un conjunto de puntos definidos por un par de coordenadas X e Y, partiendo de los valores de Z medidos en una muestra de puntos situados en la misma área de estudio.

2. ¿Cuáles son las fuentes de datos más comunes para realizar Interpolación?

  • Fotos aéreas estereoscópicas.
  • Escáneres instalados tanto en satélites como en aviones.
  • Muestras puntuales de un atributo usando diferentes tipos de patrones de adquisición de datos.
  • Mapas que han sido digitalizados.

3. Nombre los patrones de adquisición de datos más comunes en la Interpolación espacial:

  • Muestreo sistemático: Se toma en un orden predeterminado.
  • Muestreo aleatorio: Sin ningún tipo de orden en el mismo espacio.
  • Muestreo en transecta.
  • Muestreo sistemático aleatorio.
  • Muestreo en clúster: Agrupamiento.
  • Muestreo curvas de nivel.

4. De acuerdo con la clasificación de métodos de interpolación, desarrolle en qué consisten los métodos globales:

Los métodos globales asumen una dependencia de la variable a interpolar, así como de otras variables de apoyo. Se pueden dar dos situaciones en función del tipo de variable de apoyo que se utilice:

  • Los métodos de clasificación emplean una variable de apoyo cualitativa.
  • El método de regresión utiliza una variable que indica el análisis de regresión previo, donde se genera un modelo de interpolación de tipo polinómico.

5. ¿En qué se diferencian los métodos IDW, Spline y Kriging?

Los métodos de interpolación local, como IDW y Spline, utilizan información proveniente de los puntos vecinos para calcular el valor del atributo. Esto implica definir una región alrededor de la ubicación donde el valor del atributo debe ser calculado, determinar cuántos puntos vecinos se encuentran al interior de esta región, encontrar una función matemática que represente la variación del conjunto de puntos y evaluar esta situación en una malla regular. El método Kriging, por su parte, incorpora la correlación espacial.

IDW (Inverse Distance Weighting)

Combina la idea de puntos vecinos con la de un cambio gradual de la superficie como una tendencia. Supone que el valor del atributo Z en una posición donde el valor del atributo no es conocido es un promedio de los valores de sus puntos vecinos, pero donde los más cercanos tienen más peso que los más alejados.

Spline

Estima valores usando una función matemática que reduce al mínimo la curvatura de la superficie total, dando como resultado una superficie lisa que pasa sobre los puntos muestreados. Este método es ideal para modelar superficies variables como elevación, concentración de contaminación y alturas en superficies del agua.

Kriging

Describe la correlación tanto espacial como temporal que existe entre los valores de un atributo, utilizando en la estimación las características de variabilidad y correlación espacial del fenómeno estudiado. Por lo cual, requiere un análisis previo de la información con el objetivo de definir, a partir de esta información inicial, un modelo que represente su continuidad espacial.

6. Explique diferencias fundamentales entre modelo TIN e INTERCON:

Modelo TIN (Triangulated Irregular Network)

Se genera a partir de información vectorial, en forma de líneas, puntos o una combinación de ambos. Produce polígonos triangulares, donde cada uno de ellos posee atributos de área, perímetro, altitud y pendiente.

Modelo INTERCON

Se genera a partir de información rasterizada, específicamente de isolíneas en formato vectorial. No admite puntos en combinación con las líneas ni opera con puntos de forma independiente. Para el cálculo del error medio, se obtienen mejores resultados con el modelo INTERCON que con el TIN.

Captura y Evaluación de Datos Geográficos

7. Explique métodos directos e indirectos de captura de información para crear Modelos de Elevación Digital (MDE):

Métodos Directos

Se dividen en altímetros, GPS y estaciones topográficas.

  • Altímetros:
    • Radar: Sensor pasivo que recibe la fracción de luz reflejada por el suelo ante la radiación electromagnética del sol.
    • Láser: Sensor activo que lanza un pulso a la superficie y la energía reflejada se captura con una antena. El tiempo transcurrido permite calcular la distancia entre la antena y el suelo.
  • GPS (Sistema de Posicionamiento Global): Permite obtener valores de las tres coordenadas espaciales para un lugar concreto de la superficie terrestre mediante métodos de triangulación a través de satélites.
  • Estaciones Topográficas: Generan y almacenan los resultados de sus medidas en formato digital, que pueden ser incorporados y tratados por algunos SIG.

Métodos Indirectos

Consisten en la restitución fotogramétrica, la interferometría radar, la digitalización automática y la manual.

  • Restitución Fotogramétrica: Consiste en un estudio de imágenes de una zona, parcialmente solapadas y tomadas desde puntos de vista diferentes, formando pares estereoscópicos. Examinando puntos homólogos entre los pares es posible deducir de su paralaje las cotas de referencia necesarias para reconstruir la topografía.
  • Interferometría Radar: Es una comparación entre dos imágenes del mismo lugar tomadas desde una misma posición pero en momentos diferentes. La diferencia de fases exhibe patrones de interferencia bastante claros.
  • Digitalización Automática: Consiste en un análisis mediante escáner de un documento, en el cual el dispositivo traduce la superficie del mapa a un cierto número de niveles de gris.
  • Digitalización Manual: Se realiza con una mesa digitalizadora sobre la que se coloca el mapa. Las curvas de nivel se siguen manualmente con el cursor, de forma que el ordenador recibe ciertos intervalos prefijados que definen la trayectoria de la línea.

8. Explique la importancia de la creación de los MDT en el desarrollo de la investigación científica de índole geográfica en cuanto a visualización, modelado de variables y simulación de datos geográficos:

Los Modelos Digitales del Terreno (MDT) tienen una versión analógica en mapas que pueden representar las mismas características del terreno, pero codificándolas sobre un soporte físico mediante convenciones gráficas; los mapas que representan las mismas variables que los MDT constituyen, por lo tanto, Modelos Analógicos del Terreno (MAT). Las ventajas que ofrece la codificación numérica son claras en algunos aspectos, pero los mapas impresos son imprescindibles actualmente para el manejo práctico de la información.

9. Explique la importancia del valor RMS (Root Mean Square) en la aplicación de un modelo digital:

La importancia del valor RMS (Root Mean Square) en la aplicación de un modelo digital radica en su capacidad para cuantificar la exactitud posicional. Sirve como una medida estándar del error, permitiendo evaluar la precisión de las predicciones del modelo frente a los valores observados. Por ejemplo, en el caso de la exactitud posicional, se pueden definir medidas de error como el RMS total, el RMS en X, el RMS en Y, etc., lo que facilita la comparación y validación de diferentes modelos o conjuntos de datos.

10. Explique cómo se generan modelos de elevación digital a partir de levantamientos directos de datos:

El levantamiento directo de información para generar Modelos de Elevación Digital (MDE) se realiza a través de altímetros, GPS y estaciones topográficas, permitiendo el registro directo de datos de altitud en formato digital.

  • Altímetros:
    • Altímetros de Radar: Los sensores ópticos reciben la fracción de la luz reflejada por el suelo ante la radiación electromagnética del sol.
    • Altímetros de Láser: Desde el satélite o avión se lanza un breve pulso hacia la superficie; una fracción de la energía es reflejada por la superficie y devuelta hacia una antena receptora, donde el tiempo transcurrido permite calcular la distancia entre la antena y el suelo.
  • GPS: Utiliza un conjunto de satélites de referencia y, mediante métodos de triangulación, permite obtener valores de las tres coordenadas espaciales para un lugar concreto de la superficie terrestre.
  • Estaciones Topográficas: Pueden generar y almacenar los resultados de sus medidas en formato digital.

11. De acuerdo con la clasificación de métodos de interpolación, desarrolle en qué consisten los métodos locales:

Los métodos locales usan la información proveniente de los puntos vecinos para calcular el valor del atributo. Esto significa:

  1. Definir una región alrededor de la ubicación donde el valor del atributo debe ser calculado.
  2. Determinar cuántos puntos vecinos se encuentran al interior de esta región.
  3. Encontrar una función matemática que representa la variación de este conjunto de puntos.
  4. Evaluar esta variación por puntos en una malla regular.

Un ejemplo de interpolación local son los polígonos de Thiessen. Estos tipos de métodos de interpolación se encuentran disponibles en la mayoría de los programas SIG. Este procedimiento debe ser repetido hasta que todos los puntos en la malla regular hayan sido calculados.

Estadística Descriptiva en Geografía: Formas de Describir Datos

Las representaciones gráficas

Son esquemas visuales que muestran ideas por medio de variables que son organizadas según reglas que permiten acceder a la información. Según Bertin, son «la construcción gráfica en la que las correspondencias en un plano pueden establecerse entre todas las divisiones de una y otra componente que explican un fenómeno».

La distribución de frecuencias

Es un método que utiliza tablas denominadas de distribución de frecuencias, con las que se busca ordenar los datos y describir el número de veces que ocurre un resultado dentro de un conjunto de observaciones. Según Carrera, «la distribución de frecuencias permite expresar con claridad el grado de regularidad o irregularidad con que se distribuyen los valores que toma una variable». Por su parte, Harnett y Murphy la definen como una «indicación más precisa de la información disponible».

Las medidas de resumen

Son técnicas cuantitativas que hacen una descripción general de los datos, a partir de la obtención de un solo dato. De acuerdo con Harnett y Murphy, el propósito es reducir la información a una medida simple. Este tipo de medidas son útiles para el análisis espacial en tanto que hacen posible describir la distribución de un fenómeno geográfico en función de su concentración o su dispersión, lo que permite inferir que los datos implicados en este tipo de medidas tienen un carácter puntual. Las medidas de resumen se clasifican en dos grupos:

  • Las medidas de tendencia central: moda, mediana y media.
  • Las medidas de dispersión: desviación típica, varianza y covarianza.

Conclusiones sobre las medidas de tendencia central

  • Su aplicación es conveniente en casos que lo ameriten, ya que existen fenómenos que no solo basta localizarlos, sino que es necesario tener en cuenta algunas condiciones para ello.
  • Se constituyen en una herramienta para el simple análisis de localizaciones ideales o artificiales, pero no para fenómenos que tienen un comportamiento natural que no siempre es predecible.