sábado, 14 de enero de 2017

BIG DATA aplicada a los datos geográficos

La importancia de los datos.


Vivimos en un mundo interconectado y globalizado donde diariamente se genera gigantescos volúmenes de datos de todo tipo, desde una fotografía captada por una pequeña cámara fotográfica en un dispositivo móvil, que puede contener incluso datos de posicionamiento satelital, datos climatológicos en tiempo real, millones de mensajes de textos, email, tweets, cientos de horas de video, estadísticas y un sinfín de documentos, películas y otros tantos más.

Los avances tecnológicos en la ciencia de la información han permitido abaratar los costos de almacenamiento masivo de datos, impulsando exponencialmente la acumulación de todo tipo de datos valiosos, utilizados para predecir comportamientos de clientes potenciales e identificar tendencias de datos para diseñar nuevos productos y ofrecer  servicio personalizado. Todos estos datos sustentan los análisis complejos de comportamiento humano y predicciones que forman la base de lo que se conoce como inteligencia artificial.


Debido a la abundancia de instrumentos de medición como: sensores, micrófonos, cámaras, escáneres, geo posicionamiento, entre otros, los datos generados por las personas, a partir de estos instrumentos, serán en muy poco tiempo, el segmento más grande de todos los datos disponible en el mundo.

Los datos actuales no se contemplan como elementos estáticos que soportan un estudio específico, cuya utilidad desaparece en cuanto se alcanza el objetivo para el cual habían sido recopilados. Por el contrario, los datos se convierten en materia prima para las grandes empresas modernas que buscan obtener ventajas comparativas, utilizando los análisis complejos de los datos como factor vital y generador de nuevas formas de valor económico. Los datos pueden ser reutilizados eficientemente para obtener nuevos productos y servicios e innovar en los existentes.

Con la consolidación de la tecnología espacial, los satélites artificiales modernos, mantienen en su carga útil, diferentes sensores para la captura de datos geográficos diversos, como por ejemplo: imágenes de la superficie terrestre, datos climatológicos, temperatura, velocidad de los vientos, altimetría, entre otros, permitiendo crear grandes series de datos temporales que pueden ser aplicados para predecir fenómenos naturales, que pueden presentarse en un futuro inmediato, permitiendo a las personas tomar las previsiones para evitar en lo posible víctimas fatales.

Otras grandes cantidades de datos geográficos pueden ser generados, por la cotidiana interacción de las personas con sus redes sociales, portales, sitios web y juegos, ya que muchos ellos, permiten compartir ubicación geográfica y temporal de manera instantánea, llegando incluso a ser mostrada en mapas globales en forma permanente.

Todos estos datos generados por la interacción de las personas en su entorno digital, facilita la utilización de la herramienta de manejo de datos masivos, conocido con el nombre de Big Data para predecir con anticipación la ubicación probable y el comportamiento e intención de visitar sitios de interés.

 
Tratamiento de los Datos
Big Data. Tratamiento de los datos

 Big Data.


El concepto de Big Data (Datos Masivos), engloba modernas técnicas de almacenamiento de grandes cantidades de datos de diferentes tipos y los procedimientos basados en algoritmos matemáticos complejos, diseñados para encontrar patrones de análisis en forma muy rápida, permitiendo la administración eficiente de grandes cantidades de datos, para generar valor agregado a un costo muy bajo de mantenimiento.

La Big Data describe la estrategia de administración de datos de una forma integral, que incluye muchos tipos de datos: estructurados, semiestructurados y no estructurados, almacenados en forma eficiente mediante el uso de moderna tecnología, programas especializados y robustos algoritmos matemáticos de análisis e interpretación que permite su aplicabilidad para inferir o predecir comportamiento humano, fenómenos naturales e incluso toma de decisiones. Sus fortalezas son aplicadas en el área de inteligencia artificial.
 
La característica fundamental de la definición de Big Data, implica su aplicabilidad para todos aquellos datos que no pueden ser procesados, analizados o interpretados con la utilización de procesos o herramientas tradicionales de manejo de datos, ya sea por su intrínseca complejidad o por lo costoso de procesarlos.

La implementación de una solución empresarial basada en la estrategia de Big Data, implica la integración de diversos componentes de un sistema único y necesario, para analizar grandes cantidades de datos diversos, permitiendo una mayor eficiencia en la administración de los datos y la disminución de los costos, por desarrollo adicional de algoritmos que permitan la administrar de cada componente por separado, como por ejemplo: manejo de eventos, conectividad, alta disponibilidad, seguridad, optimización y desempeño, depuración, monitoreo y administración de las aplicaciones entre otros elementos fundamentales de la empresa.

Se debe aclarar, que esta técnica de administración de datos, no se sustenta únicamente en la visión del manejo de grandes volúmenes de datos, ya que siempre han existido soluciones viables, para la administración de forma tradicional de grandes volúmenes de datos relacionales. Este concepto va más allá de esta única característica y engloba aspectos como las 4V: volumen de los datos, variabilidad de los datos, velocidad de repuesta y generación de valor de los datos.

Las 4V de la Big Data
Big Data. Las 4V


La Big Data potencia la capacidad de predicción con el uso de la inteligencia artificial y la aplicación de las matemáticas al análisis de grandes cantidades de datos para poder inferir probabilidades de que ocurra algún evento en cuestión, aplicando para ello principios de lógica difusa, entre otros elementos de análisis complejo. La ventaja que tiene este sistema, es que son alimentados con grandes cantidades de datos sobre los que basan sus predicciones, estos sistemas se perfeccionan a lo largo del tiempo mientas se le suministren más datos, siendo capaces de aprender y mejorar sus predicciones.

Los datos geográficos y la estrategia Big Data.

 

 1. Datos Geográficos.


Los datos geográficos son entidades espacio temporales que cuantifican la distribución, el estado y los vínculos de los distintos fenómenos u objetos naturales y sociales del mundo real. Un dato geográfico se caracteriza por tener principalmente los siguientes elementos:

• Posición absoluta: sobre un sistema de coordenadas conocido (x, y, z).
• Posición relativa: frente a otros elementos del paisaje (topología).
• Figura geométrica que lo representa (punto, línea, polígono).
• Atributos que lo describen (características del elemento o fenómeno).

Los datos geográficos son la clave para diferenciar un Sistema de Información Geográfica (SIG) de otro sistema de información tradicional. Además, se debe comprender la naturaleza de los datos geográficos; por ejemplo, su ubicación ¿dónde está?, y a sus características, como longitud, nombre y dirección.

La ubicación del dato geográfico, también es llamada geometría o forma (figura), que representa los datos espaciales. Así, si tenemos un elemento geográfico, por ejemplo, el elemento vías, este tiene dos componentes: el espacial y sus atributos (Kang–Tsung Chang, 2004).

Los datos geográficos cuentan con tres componentes básicos, que hacen referencia a su localización, atributos y a la variable tiempo.

Componente espacial, se refiere a la localización geográfica, las propiedades espaciales de los objetos y las relaciones espaciales que existen entre ellos (Gutiérrez y Gould, 1994).

Componente temático, son las características que se conocen como atributos de los objetos con los que representamos el mundo real. Cada objeto puede registrar un determinado valor para sus atributos (variables), los cuales pueden presentar cierta regularidad en el espacio y en el tiempo y, además, pueden ser de distinto tipo y escala de medida (Gutiérrez y Gould, 1994).

Componente temporal, la consideración de la dimensión temporal en un SIG supone la necesidad de almacenar y tratar grandes volúmenes de datos, ya que cada estrato, capa o nivel de datos se debe almacenar tantas veces como momentos temporales se consideren para el análisis del área de estudio (Gutiérrez y Gould, 1994).

2. Bases de Datas Geográficas.


Las Bases de Datas Geográficas o Espaciales ofrecen capacidades para el manejo apropiado de datos geográficos, incluyendo modelos de representación de objetos espaciales, métodos de recuperación rápidos y lenguajes de análisis y consulta específicos.

Las bases de datos geográficas pueden ser diseñadas para almacenar grandes cantidades de datos de diferente índole, aplicando para ello técnicas modernas de Big Data que faciliten su administración y generación de análisis  espacial.

3. Big Data y los Datos Geográficos.


El almacenamiento masivo de datos geográficos por las principales empresas que dominan el mundo electrónico (Google, Amazon, Facebook, Twitter, entre otras), les permiten tener datos suficientes para generar algoritmos matemáticos que facilitan la aplicación de algoritmos de análisis y de interpretación de correlaciones de los datos para predecir necesidades y luego aplicar esa información para generar productos y servicios innovadores que logren dominar el mercado.

Es claro entender que con el surgimiento tecnológico de este siglo, que nos arrastra inexorablemente hacia un mundo digital, la generación de datos geográficos cada vez se simplifica y se masifica, aún más, al disponer en nuestros dispositivos móviles, con potencialidades de utilización de tecnología de posicionamiento satelital y la facilidad de compartir en tiempo real nuestra ubicación espacial, por medio de las redes sociales. La potencialidad del uso de esos datos geográficos, por parte de grandes corporaciones, permiten obtener ventajas comparativas para ofrecer productos y servicios innovadores que faciliten el mercadeo y aseguren su hegemonía del mercado.

La consolidación de tecnologías innovadoras, como por ejemplo, el internet de las cosas, la inteligencia artificial, la realidad aumentada, los sistemas autónomos de conducción de vehículos, entre otras, sustentan su viabilidad en la utilización de técnicas de manejo de datos, como la Big Data, por su eficiente manejo de los datos y veloz respuesta en los análisis de los datos, ya que para su aplicabilidad, se requiere un análisis en tiempo real, que permita responder a infinidades de situaciones en un tiempo muy reducido y que facilite interactividad y aprendizaje de los sistemas autónomos.

Los datos geográficos son fundamentales para soportar estas nuevas tecnologías, en especial aquellas que intentan hacer realidad los sistemas autónomos de conducción de vehículos, ya que ellas requieren, una continua ubicación espacial del vehículo y un análisis e interpretación de los datos geográficos en tiempo real para definir la ruta del recorrido, los elementos geográficos presente y la toma de decisiones en forma muy rápida. Sin estos elementos no puede existir una segura autonomía para la circulación de estos vehículos.

El futuro de esta herramienta Big Data, dependerá en gran medida de su potencial aplicabilidad al soporte de los nuevos avances tecnológicos. Varias empresas como Oracle e IBM apuestan a su potencial desarrollo e invitan a las empresas a soportar sus procesos medulares con técnicas eficientes de administración de datos que potencien el valor agregado de los datos. Solo nos queda apostar por un futuro prometedor en donde se revalorice la importancia de los datos y en especial de los datos geográficos, su uso y aplicabilidad en el análisis espacial.


      




Hablemos de SIG, Actualizado en: 6:18 p.m.

Autor:

Jorge Viloria Rivera


Especialista en SIG, Catastro, Cartografía y Tecnologías web. Facilitador de cursos Online y trabajos freelance.