Imprimir Republish

TECNOLOGÍA INFORMÁTICA

Como aguja en un pajar

Un nuevo programa de eScience apunta a extraer nuevos conocimientos en gigantescos volúmenes de datos

eScience_cuboEduardo Cesar y Léo RamosLa FAPESP emitió un llamado a presentación de propuestas que inaugura su Programa de Investigaciones en eScience, una expresión que resume el desafío de investigación conjunta en computación y otras áreas del conocimiento, para organizar, clasificar y asegurar el acceso al gigantesco volumen de datos que se generan constantemente en todos los campos de investigación científica, en procura de extraer nuevos conocimientos y realizar análisis vastos y originales. El principal objetivo del programa consiste en la integración de los grupos involucrados en investigaciones sobre interfaces, algoritmos, modelos computacionales e infraestructura de datos con los científicos de las áreas donde las aplicaciones de eScience son especialmente necesarias en el país, que van desde las ciencias agrarias hasta las ciencias sociales. “La intención es que los investigadores de esos dos frentes trabajen en forma conjunta para generar nuevos conocimientos, tanto en ciencia de la computación como en aplicaciones en esas disciplinas”, dice Roberto Marcondes César Júnior, docente del Instituto de Matemática y Estadística de la Universidad de São Paulo y coordinador adjunto de Ciencias Exactas e Ingeniería de la FAPESP.

El primer llamado recibirá propuestas en las modalidades de Proyecto Temático o Ayuda Regular hasta el 28 de abril de 2014. La Fundación espera que las universidades ofrezcan contrapartidas en recursos humanos, contratando programadores y analistas de bancos de datos, entre otros profesionales. Habrá 4 millones de reales disponibles para el apoyo a proyectos que involucren modelos matemáticos, repositorios digitales y administración de datos, nuevos hardware, software, protocolos, herramientas y servicios, dedicados a atender la demanda de investigaciones en las áreas de ciencias agrarias; artes, humanidades y ciencias sociales; ingeniería y física, clima y ciencias de la Tierra, y a la práctica y capacitación en eScience.

Las ideas iniciales surgieron en dos workshop organizados por la FAPESP que contaron con la participación investigadores en computación y en otras áreas (desde ciencias exactas hasta humanidades). “Todo el debate condujo a la conclusión de que lo ideal sería una iniciativa en eScience”, dice Claudia Bauzer Medeiros, docente del Instituto de Computación de la Unicamp y miembro de la Coordinación del área de Ingeniería y Ciencia de la Computación de la FAPESP. “Los detalles fueron ganando en madurez y culminaron en una propuesta de programa redactada por la Coordinación de Computación de la FAPESP”.

El pliego presenta un aspecto pionero en el país, ya que exige de parte de los proponentes la remisión de un Data Management Plan, que describe cómo el proyecto pretende administrar, proteger, preservar y divulgar sus datos. “Muchos países, tales como Estados Unidos, Alemania, Reino Unido y Canadá, están discutiendo cómo garantizar tales planes en todo proyecto de investigación, en el consenso de que una de las partes más valiosas de cualquier investigación está constituida por los datos generados, que deben preservarse y divulgarse en forma adecuada”, señala Claudia Bauzer Medeiros.

“Para la FAPESP, resulta fundamental el avance en eScience, pues cuenta con programas que generan una cantidad inimaginable de datos de interés científico que requieren un tratamiento adecuado y deben compartirse”, dice Marcondes César, en referencia a programas tales como el Biota, de identificación de la biodiversidad paulista, el Bioen, de investigación en bioenergía, el Programa FAPESP de Investigación en Cambios Climáticos Globales o el Cinapce, de investigaciones sobre el cerebro. La experiencia de los 46 proyectos de investigación, 32 de ellos ya finalizados, del Instituto Microsoft Research-FAPESP de Investigaciones en Tecnología Informática, una iniciativa que busca aplicaciones con alcance social en tecnología de la información, indica que hay una comunidad de investigadores apta para participar en el nuevo programa.

Planillas
El advenimiento del eScience se relaciona con modificaciones en la forma de hacer ciencia. “Hasta hace pocos años, un doctorado en biología, por ejemplo, dependía de un conjunto de experimentos durante los dos o tres primeros años, luego compilados en una planilla cuyos datos se analizaban en el último año. Hoy en día es común que durante el primer año el alumno cuente con acceso a cientos de planillas sobre un determinado experimento disponibles en internet, y que su desafío consista en descubrir un nuevo conocimiento en medio de todo ese volumen de información”, explica el profesor. “El paradigma de la investigación se transformó. Se trata de extraer conocimiento de un gran volumen de información, la mayoría de las veces, con datos heterogéneos”.

Diversas iniciativas internacionales afrontan los desafíos de eScience, como es el caso del Institute for Data Sciences and Engineering, de la Universidad de Columbia, Estados Unidos. El mismo, organizado en temas interdisciplinarios, investiga formas de extraer información de los medios online, de monitorear y mejorar el uso de la infraestructura urbana o de perfeccionar el sistema de atención en salud utilizando datos de pacientes y registros de salud pública. Otro ejemplo es el eScience Institute, de la Universidad de Washington, EE.UU., que contempla investigaciones que abarcan desde astronomía hasta biología marina. También hay telescopios virtuales, como es el caso del SkyView, de la NASA, que permiten que millones de personas tengan acceso a datos astronómicos del universo. Incluso existe un proyecto mundial de observatorios astronómicos virtuales para procesar datos astronómicos globales, posibilitando el acceso al universo a millones de personas. Otro ejemplo es el LHC, el mayor acelerador de partículas del mundo, cuyos resultados se procesan mundialmente.

La expertise que buscan los científicos para extraer informaciones en medio de enormes volúmenes de datos, ya la ostenta el sector privado, sostiene Gilberto Câmara, investigador en geoinformática y modelado ambiental del Instituto Nacional de Investigaciones Espaciales (Inpe) y director de la institución entre 2005 y 2012. “Bancos y sitios web de comercio electrónico idearon una gigantesca estructura de administración de datos para obtener información acerca de los clientes y sus hábitos, así como para prestar servicios; pero la forma en que se encuentran organizados los archivos científicos ha variado muy poco”, sostiene, citando como ejemplo las 500 mil imágenes satelitales que ofrece el Inpe en forma gratuita. “Se puede bajar una por una, pero quien necesita administrar más de 200 fotografías personales conoce la dificultad que eso genera. Uno de los desafíos de eScience consiste en lograr que todo ese conjunto pueda analizarse sin que uno necesite bajarlas”, afirma.

Câmara cita un artículo en la revista Science, publicado el pasado mes de noviembre, con los resultados de la investigación de un grupo que mapeó las alteraciones en la cobertura selvática del mundo entre los años 2000 y 2010, con base en 650 mil imágenes suministradas por el satélite Landsat. “Google, que posee una poderosa infraestructura en sistemas de almacenamiento y es líder en ese campo, le habilitó el acceso a las imágenes al grupo de investigación. Hay una revolución en curso en cuanto al tratamiento de los datos científicos, que permitirá que se realice ciencia de un modo diferente: será posible conducir al investigador hasta los datos, en lugar de movilizar los datos hacia el investigador”.

Investigaciones sobre internet
El día 18 del pasado mes de diciembre, la FAPESP y los ministerios de Ciencia, Tecnología e Innovación (MCTI) y de Comunicaciones firmaron un convenio de cooperación por un valor de 98 millones  de reales, para apoyar investigaciones científicas y tecnológicas que contribuyan al desarrollo de internet en Brasil. Ese valor, corresponde a los recursos remanentes del período en que la FAPESP, por encargo del Comité Gestor de Internet en Brasil (CGI.br), administró las actividades de registro de dominio y asignación de protocolos IP en el país, entre 1998 y diciembre de 2005, cuando asumió esta tarea el Núcleo de Información y Coordinación del Punto BR (NIC.br). “En 1998, los dominios de internet en Brasil sumaban 27 mil. Hoy son más de 3 millones”, puntualizó el presidente de la FAPESP, Celso Lafer. “La FAPESP decidió colaborar con el CGI en un momento en que aún no existía el NIC.br, y tal apoyo resultó fundamental”, subrayó el ministro Marco Antonio Raupp, del MCTI. Los recursos se distribuirán entre proyectos presentados por investigadores de todo el país, de modo proporcional al número de registros de dominios solicitados por cada estado en aquel período. São Paulo contará con el 47% de los 98 millones de reales para apoyar proyectos en el marco del convenio que involucra a los dos ministerios y a la FAPESP.

Republicar