El nuevo Laboratorio de Big Data de la UVG

Borrador automático

Se estima que actualmente se generan 1.7 Megabytes de datos por segundo, por persona, en el mundo; y los guatemaltecos no son la excepción. Al analizar toda la información que se genera en el país se pueden lograr grandes avances en diferentes campos.  Por ello el Centro de Estudios en Informática Aplicada (CEIA) ha creado el Data Science Lab. Uno de los objetivos de esta nueva unidad es recolectar, almacenar y preservar la mayor cantidad de datos posibles, generados en Guatemala. Con esta información se creará un repositorio de datos abiertos; lo que significa que los datos estarán disponibles sin restricciones, con la condición de citar la fuente y compartir.

El nuevo Data Science Lab es una propuesta innovadora porque además de trabajar con bases de datos pequeñas, será uno de los pioneros en trabajar Big Data en el país y de poner al alcance de los guatemaltecos herramientas para trabajar con los datos.

¿Qué es el Big Data?

El término Big Data se refiere a conjuntos de datos de gran tamaño y complejidad, que son tan voluminosos que se necesitan mayores recursos computacionales para trabajar con ellos. A pesar de su popularidad aún no se cuenta con un consenso de su definición, por lo que podemos simplificarlo al decir que: si los recursos que se tienen no alcanzan para procesar los datos, se trata de Big Data.

Las “tres V” 

La idea de las “tres V” responde a las características necesarias para que el Big Data sea relevante. Estas son:

  • Volumen: La cantidad de datos que tenemos importa porque nos dice qué herramientas utilizar para estructurar y procesar los datos.
  • Velocidad: Esta característica se refiere al ritmo con el que se reciben los datos y se aplica alguna acción sobre ellos. En ocasiones estos datos pueden obtenerse en tiempo real, lo que requiere una evaluación y actuación a la misma velocidad.
  • Variedad: Esto se refiere a los diferentes tipos de datos disponibles. Antes, los datos convencionales eran estructurados y podían organizarse claramente en una base de datos relacional. Con el aumento del Big Data, la información es más difícil de estructurar, pues surgen elementos como el texto, audio o video.

Frecuentemente se manejan otras “dos V”: valor y veracidad. Estas responden a que los datos poseen un valor intrínseco. Sin embargo, no tienen ninguna utilidad hasta que dicho valor se descubre. Para ser de algún valor, los datos deben poder utilizarse, y esto depende de su conservación.

Resulta igualmente importante asegurarse de que los datos provengan de fuentes respetables y confiables. Por ello el CEIA pretende llenar un vacío en el país, al crear el Data Science Lab como un punto de referencia para que los investigadores y empresas de los diversos sectores puedan obtener datos relevantes. 

Los futuros proyectos del Data Science Lab

El Data Science Lab empezará sus funciones con 2 proyectos, que estarán disponibles al público:

  • Data Lake (Lago de Datos)Es un repositorio centralizado que permite almacenar datos estructurados y no estructurados a cualquier escala.  Se pueden almacenar los datos tal y como se encuentren, sin antes tener que estructurarlos. Asociado a este repositorio se tendrán herramientas de gestión de metadatos y un graficador interactivo.
  • Guatemala en Datos: Este proyecto se desarrolla en conjunto con el Observatorio Económico Sostenible (OES) de la UVG y busca ser una plataforma de datos de referencia para Guatemala. En ella se podrán encontrar los datos más relevantes sobre la realidad nacional que estén disponibles. La plataforma será de libre acceso, los datos podrán ser descargados libremente, el aporte de contenido será colaborativo y éste será del más alto rigor e imparcialidad.

Con la creación del Data Science Lab, el CEIA pretende ayudar a la conservación y mantenimiento de datos valiosos, con los que a largo plazo se pueden realizar más investigaciones que ayudarán al desarrollo del país. Este laboratorio de datos y la información que dispondrá son herramientas claves para entender nuestra realidad y actuar sobre ella.

¿Sabías que UVG es la universidad líder en programas de ciencia y tencología? Conoce más de nuestro programas innovadores aquí.

También te puede interesar:

Marie André Destarac: pionera y activista por más mujeres en la ciencia

Jorge Luján Muñoz, indagador permanente de la historia de Guatemala 

¿Cómo proteger nuestra privacidad en redes sociales? 

 

Last modified: 15/07/2021

Anterior

Nuevo repunte del IES para el 1 de julio

Te presentamos la actualización del índice económico semanal (IES) para el 1 de julio de 2021: El IES para...

Siguiente

EL CIT fue el escenario de las Graduaciones UVG 2020

La Plaza Dra. Isabel Gutiérrez de Bosch se vistió de gala al celebrarla en ella las Graduaciones UVG 2020...

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *