CIENCIA.
Día a día crece la cantidad de datos que los seres humanos creamos y almacenamos en la web. En la Argentina, y solo en un minuto, Google recibe cerca de dos millones y medio de nuevas búsquedas, se suben 3,9 horas de video a YouTube, Facebook recibe más de 55.000 “me gusta”, se generan poco menos de 10.000 tuits, y se gastan cerca de 76.000 pesos en comercio electrónico, según datos del Observatorio de Internet en Argentina a través de su web
inter.net.ar.
Tradicionalmente la información se almacenaba en bases de datos, pero con la llegada del mundo digital hubo una explosión en la cantidad de datos no estructurados provenientes del uso de redes sociales, correos electrónicos, informes médicos digitales, compras online, declaraciones de impuestos, sensores y circuitos cerrados de video, entre otros. Trabajar en el almacenamiento, clasificación, análisis y gestión de este gran cúmulo de información es el desafío de Big Data, o “grandes datos”.
A diferencia de los datos estructurados, como por ejemplo los que figuran en las bases de datos de la Afip, los datos no estructurados necesitan ser analizados con nuevas herramientas y enfoques, explica el computador Javier Martínez Viademonte, investigador docente del Instituto de Industria (IDEI) de la UNGS. Así, según los especialistas, el Big Data debe lidiar con las denominadas “tres v”: gestionar un gran volumen de datos, con la mayor velocidad posible, y teniendo en cuenta su gran variedad.
“Sin el uso de nuevas técnicas de Big Data simplemente hay información que no podría obtenerse debido a su volumen y al tiempo que llevaría procesarla. Quizá podría pensarse que Big Data es un tema transversal que posibilita o complementa el desarrollo de otras áreas, como la inteligencia artificial o internet de las cosas, referido a la interconexión digital de objetos cotidianos con internet, por ejemplo”, sostiene Javier Godoy, estudiante de la Licenciatura en Informática y becario del IDEI.
Campos tan variados como la salud, la genética, el agro, las redes sociales, el marketing y las finanzas utilizan el análisis que proporcionan los grandes datos para la toma de decisiones. “El enfoque de Big Data también facilita, entre otras cosas, lo relativo al seguimiento de la información en tiempo real, como las congestiones de tráfico, los ataques a sitios de internet o la inagotable fuente de interés que son las redes sociales. Ahí aparecen innumerables aplicaciones, desde los asistentes como Google Now hasta la publicidad dirigida”, profundiza Martínez Viademonte.
Tal es la variedad de la información disponible en el ciberespacio que, por ejemplo, se puede saber cuáles son las palabras que más se mencionaron en los últimos diez años en las secciones de economía de los diarios Página/12 y La Nación, y sacar diversas conclusiones. Según el análisis realizado por Godoy, entre los diez términos más mencionados en Página/12 se encuentran central y nacional, palabras que no forman parte del top ten del diario La Nación, en el que sí aparecen los términos inflación y pasado.
Actualmente, y en el marco de una beca del Consejo Interuniversitario Nacional de estímulo a las vocaciones científicas, el equipo del IDEI busca predecir la producción de un cultivo a partir de las condiciones del medio. Las máquinas cosechadoras tienen sensores que a su paso miden la humedad del suelo y el rendimiento de las semillas, entre otras variables. “Con esta información, la pregunta que tenemos que responder es qué semilla debemos plantar en determinado suelo para obtener el máximo rendimiento. Y esa es una conclusión que se puede sacar a partir del análisis de todos los datos”, explica Martínez Viademonte, codirector de la beca y coordinador de la Licenciatura en Sistemas de la UNGS.
¿Big Data modifica la forma en la que nos relacionamos con la información? “Sí, se puede hacer un análisis más personalizado de los usuarios, y esto permite recomendaciones específicas en función de sus patrones de comportamiento. Es muy probable que elegir un producto en lugar de otro, o un destino para viajar, muchas veces no sea una coincidencia, sino una influencia que se logra con el análisis de la información. Algo similar pasa con la música que escuchamos. Empresas como Spotify predicen los gustos musicales de los usuarios con Big Data, por lo que las recomendaciones no son casualidad”, responde Godoy. Y Martínez Viademonte profundiza: “Estamos generando muchísima información pero todavía no logramos resolver los temas asociados como privacidad, derecho o valor económico”.
Marcela Bello
HACKATÓN DE AGRO DATOS
El técnico superior en Informática egresado de la UNGS Carlos N. Jiménez, y actual estudiante de la Licenciatura en Sistemas, obtuvo, junto a un equipo conformado por profesores y estudiantes de distintas instituciones, el segundo puesto en Hackatón de Agro Datos, organizado por la Fundación Sadosky, a través de su programa “Ciencia de Datos”. El reconocimiento fue otorgado por el trabajo realizado sobre un sistema de recomendación de variedades para la siembra de trigo en función de la localidad, la fecha de siembra y las condiciones meteorológicas.