En Brasil se proyecta introducir avances significativos en la infraestructura de supercomputadoras, lo que supondrá un impacto en los recursos de computación de alto rendimiento (HPC, por sus siglas en inglés) disponibles para la investigación científica. Las principales iniciativas corresponden al Laboratorio Nacional de Computación Científica (LNCC), con sede en Petrópolis, en la región serrana de Río de Janeiro, al Instituto Nacional de Investigaciones Espaciales (Inpe), en Cachoeira Paulista, en el interior del estado de São Paulo, ambas instituciones vinculadas al Ministerio de Ciencia, Tecnología e Innovación (MCTI), y al Centro de Computación en Ingeniería y Ciencias de la Universidad de Campinas (CCES-Unicamp).
Una supercomputadora está compuesta por miles de ordenadores − como también suele llamárselas − pequeños llamados nodos. Cada nodo posee una memoria propia y varios procesadores. Operando en forma conjunta, son capaces de realizar cálculos extremadamente complejos a altísimas velocidades, del orden de trillones (1018) de operaciones por segundo. Estas supermáquinas constituyen una poderosa herramienta de investigación y también sirven de apoyo a sectores de la economía tales como la defensa, la energía y la sanidad. Los equipos más potentes, según explican los expertos, les permiten a los científicos resolver problemas complejos en menos tiempo.
Estos dispositivos pueden brindar soporte a estudios en diversas áreas, tales como las simulaciones de la formación del Universo para entender su evolución, el modelado molecular en la búsqueda de nuevos fármacos y los pronósticos meteorológicos que prevén la ocurrencia de fenómenos climáticos extremos. También se los utiliza para ampliar las fronteras en la prospección de petróleo y gas, en la investigación de nuevos materiales, el desarrollo de proyectos aeroespaciales y en los cálculos del potencial energético de las fuentes de energía renovables.
Léo Ramos Chaves / Revista Pesquisa FAPESPEl técnico Ruy Marvulle Bueno configura la supercomputadora Coaraci, de la Unicamp, para ponerla a disposición de los usuariosLéo Ramos Chaves / Revista Pesquisa FAPESP
“Con la incorporación de la inteligencia artificial en las actividades económicas y sociales, la necesidad de contar con supercomputadoras capaces de lidiar eficazmente con grandes volúmenes de datos y ofrecer respuestas rápidas a las demandas será cada vez mayor”, analiza el científico de la computación Paulo José da Silva e Silva, del Instituto de Matemática, Estadística y Computación Científica (Imecc) de la Unicamp.
El LNCC tiene previsto expandir este año el poder computacional de Santos Dumont, una máquina dedicada exclusivamente a la investigación académica, que, con esta ampliación, pasará a ser la más potente del país. Hoy en día, SDumont, como se la conoce, tiene una capacidad de cálculo de 5,1 petaflops. Con la actualización, alcanzará entre 22 y 25 petaflops (flops es un acrónimo en inglés que denomina a las operaciones de coma flotante o cálculos por segundo).
Cada petaflops equivale a la capacidad de procesar 1.000 billones (1015) de operaciones matemáticas por segundo. El SDumont procesa 5.100 billones de operaciones matemáticas por segundo. Para realizar la misma operación en computadoras personales modernas, se necesitarían 24.500 equipos trabajando en conjunto (véase la infografía).
En la actualidad, la supercomputadora más potente de América Latina es Pégaso, propiedad de Petrobras, adquirida en 2022 a la empresa francesa Atos por 300 millones de reales. Fue puesta en marcha en diciembre de ese año y es capaz de procesar 21 petaflops. Este equipo figura en el 45º puesto de la clasificación independiente Top500, divulgada en noviembre de 2023, con el listado de las máquinas más potentes del mundo.
La 62ª edición esta clasificación, publicada por primera vez en 1993, fue elaborada por investigadores de la Universidad de Tennessee, del Laboratorio Nacional Lawrence Berkeley y del National Energy Research Scientific Computer Center (NERSC), todos de Estados Unidos.
Brasil cuenta con nueve superordenadores en la lista ‒ su mejor desempeño desde 1993, cuando el Top500 comenzó a elaborarse ‒ y ocupa el 11º puesto entre las naciones con los mayores parques de supercomputadoras. Seis de estas máquinas son propiedad de Petrobras. Las otras tres pertenecen a la empresa de software MBZ ‒ los equipos NOBZ1 y A16A, ambos con arquitectura Lenovo ‒ y a la compañía de software e investigación SiDi, propietaria de Iara, una supercomputadora con tecnología Nvidia, destinada a las investigaciones en el área de la inteligencia artificial. Por razones técnicas, Santos Dumont no entra en la evaluación para ese listado. El ranking solo tiene en cuenta a los equipos con una arquitectura de computación homogénea, es decir, aquellos que están dotados de nodos computacionales con una misma configuración. No es este el caso de la máquina del LNCC, que posee cuatro arquitecturas diferentes operando en forma conjunta.
A la cabeza del escalafón se ubica Frontier, la primera supercomputadora que opera en el rango de los exaflops, con capacidad para procesar 1 trillón de operaciones por segundo, del Laboratorio Nacional de Oak Ridge, en Estados Unidos.
La inversión para la actualización de SDumont, cuyo presupuesto asciende a unos 100 millones de reales, correrá por cuenta de Petrobras. “Tenemos previsto que la instalación de las actualizaciones esté concluida entre julio y agosto”, dice el matemático Wagner Vieira Léo, coordinador de Tecnología Informática y Comunicaciones del LNCC.
Felipe Gaspar / PetrobrasPégaso, de Petrobras: en funcionamiento desde 2015, es la mayor supercomputadora de América Latina y la 45ª más rápida del mundoFelipe Gaspar / Petrobras
Un hito en la producción científica
El superordenador SDumont entró en funcionamiento en 2015 y fue la primera estructura de computación de Brasil capaz de operar en petaflops: 1,1 en aquel entonces. En 2019, con la ayuda del consorcio petrolero Libra, encabezado por Petrobras, fue reconfigurado a 5,1 petaflops. Funciona como nodo central (Tier-0) del Sistema Nacional de Procesamiento de Alto Desempeño (Sinapad), compuesto por nueve unidades de HPC vinculadas al MCTI.
Para diciembre de 2023, la SDumont ya se había utilizado en 430 proyectos de investigación, que dieron como resultado 1.044 artículos científicos, 43 libros o capítulos de libros, 398 tesinas de maestría o tesis doctorales y 11 patentes. Actualmente cuenta con más de 2.000 usuarios activos. “La supercomputadora Santos Dumont es un hito en la producción científica brasileña. Antes de ella, los investigadores locales tenían que buscar asociaciones en el exterior para poder realizar sus trabajos”, dice Léo.
Entre las últimas contribuciones que ha hecho este equipo se cuentan la secuenciación de 19 genomas del coronavirus, un trabajo realizado en 48 horas por investigadores del LNCC y de las universidades federales de Minas Gerais (UFMG) y de Río de Janeiro (UFRJ), en marzo de 2020, un mes después de confirmarse los primeros casos de covid-19 en Brasil.
También ayudó a científicos de la Universidad Federal de Pernambuco (UFPE) y de la Fundación Oswaldo Cruz de Pernambuco (Fiocruz Pernambuco) en el desarrollo de una candidata a vacuna contra el virus del Zika. Siguiendo en el área de la medicina, SDumont les permitió a equipos del Instituto del Corazón (InCor) del Hospital de Clínicas de la Facultad de Medicina de la Universidad de São Paulo (USP) y del Laboratorio de Modelado Hemodinámico (HeMoLab) del LNCC generar modelos computacionales que simularan el flujo sanguíneo en las arterias coronarias para diagnosticar el riesgo de infarto de miocardio.
“Hoy en día, la computación de alto rendimiento está presente en casi todas las áreas de la investigación científica. El análisis avanzado de datos está presente incluso en el campo de las humanidades donde se lo utiliza como apoyo para la definición de políticas públicas”, pone como ejemplo Da Silva e Silva, del Imecc-Unicamp, quien también es coordinador del Centro Nacional de Procesamiento de Alto Desempeño en São Paulo (Cenapad-SP), una de las estructuras HPC que forman parte del Sinapad.
El principal equipo en funcionamiento en el centro paulista es la supercomputadora Lovelace, adquirida en 2021 con fondos aportados por la Financiadora de Estudios y Proyectos (Finep) y actualizada en 2023 con apoyo de la FAPESP. La máquina, fabricada por la empresa Dell Technologies y bautizada así en honor a la matemática inglesa pionera de la computación, posee en su configuración actual una capacidad de procesamiento de 388 teraflops. Cada teraflops proporciona 1 billón de operaciones por segundo. El centro también está equipado con Tyr, que utiliza el sistema IBM Power 750, con una capacidad de 37 teraflops. En total, los equipos del centro ofrecen 425 teraflops de procesamiento.
Desde 1994, cuando se creó el Cenapad-SP, hasta finales de 2023, las investigaciones realizadas en el centro generaron alrededor de 4.400 publicaciones académicas, 294 tesis doctorales y 331 tesinas de maestría. Actualmente hay 221 proyectos en curso y 737 usuarios de todo el país. “La infraestructura está ocupada al 100 % e incluso hay una amplia demanda que aguarda en lista de espera”, informa el investigador de la Unicamp.
Léo, del LNCC, y Da Silva e Silva comparten la perspectiva que indica que, tras la actualización de SDumont, la prioridad principal de la computación de alto rendimiento en Brasil destinada a la investigación académica consiste en actualizar también la infraestructura del resto de las unidades del Sinapad, ya que todas tienen una demanda de uso mayor a su capacidad de procesamiento.
En enero de este año, un primer refuerzo se hizo realidad. Coaraci, en lengua tupí “madre del día”, la nueva supercomputadora del CCES-Unicamp, fue puesta a prueba en diciembre de 2023 y al mes siguiente quedó a disposición de la comunidad académica. Se trata de una máquina Dell de 801 teraflops, adquirida con la ayuda del Centro de Ingeniería y Ciencias Computacionales (CECC), uno de los Centros de Investigación, Innovación y Difusión (Cepid) financiados por la FAPESP.
“Es la computadora más potente disponible en una universidad brasileña y albergará investigaciones en las más diversas áreas de interés de la ciencia. Nuestro análisis preliminar es que Coaraci tendrá una ocupación intensa, funcionará las 24 horas del día, los siete días de la semana”, dice el ingeniero mecánico William Wolf, asesor técnico del CCES. El equipo fue instalado en el Centro de Computación John David Rogers, dentro del Instituto de Física Gleb Wataghin de la Unicamp.
Para Wolf, coordinador del Laboratorio de Ciencias Aeronáuticas de la Unicamp, Coaraci hará posible la realización de trabajos que eran difíciles de hacer con los equipos brasileños. Las investigaciones aeroespaciales que lleva a cabo la Unicamp, por ejemplo, tienen lugar en supercomputadoras de Estados Unidos y Francia, un proceso que demora seis meses, en promedio, debido a las extensas listas de espera y a la burocracia que implica la preparación y la revisión de los proyectos internacionales. Además, estos proyectos deben aguardar en una lista de espera mundial y, a menudo, deben compartirse con grupos extranjeros antes de ser procesados.
The Cosmic Dawn Project | Inpe | Fuerza Aérea BrasileñaLas supercomputadoras son fundamentales para las investigaciones que simulan la formación del Universo (arriba), para los pronósticos meteorológicos y climáticos y para el desarrollo de proyectos aeronáuticos (abajo)The Cosmic Dawn Project | Inpe | Fuerza Aérea Brasileña
“Estos datos son extremadamente difíciles de obtener, y nuestro interés principal es procesarlos. En otros casos, se trata de datos realmente sensibles porque conllevan innovación tecnológica”, explica Wolf. “Con Coaraci, podremos hacer las investigaciones aquí mismo, en forma rápida y segura, sin tener que compartir los datos, que en muchos casos pueden ser estratégicos para el desarrollo tecnológico en Brasil”.
El Inpe, institución que también es miembro del Sinapad, pondrá en marcha el proceso de licitación que culminará en la adquisición de una nueva supercomputadora capaz de mejorar los pronósticos climáticos en el país. La inversión prevista es de 200 millones de reales que serán aportados por el Fondo Nacional de Desarrollo Científico y Tecnológico (FNDCT). El importe se destinará a equipamientos y a infraestructura física en las instalaciones del instituto en Cachoeira Paulista (São Paulo) destinados a proporcionar un soporte adecuado a la máquina.
“La inversión se llevará a cabo en etapas que darán comienzo este año y su finalización está prevista para 2027”, explica el doctorando en ingeniería y tecnología espacial Ivan Márcio Barbosa, coordinador de Infraestructura de Datos y Supercomputación del Inpe.
La primera fase cuenta con un presupuesto previsto de 47,5 millones de reales que se destinarán a la adquisición de equipos que generarán una potencia de cálculo de aproximadamente 2 petaflops. Al final del proceso, en 2027, el sistema de alto rendimiento del Inpe alcanzará los 8 petaflops, una capacidad alrededor de 15 veces superior a la de la actual supercomputadora del instituto, Tupã, adquirida en 2010, que ofrece 550 teraflops (lea en Pesquisa FAPESP, edición nº 306).
Las supercomputadoras consumen mucha energía en suministro eléctrico y refrigeración. Según informa Barbosa, el costo anual de la electricidad que consume Tupã es de 4,8 millones de reales. Su refrigeración, como en la mayoría de los superordenadores, consta de un sistema mixto de aire acondicionado y agua: son 40.000 litros que circulan en un circuito cerrado. Para dar cabida al nuevo equipo, el Inpe instalará una subestación de energía eléctrica de 138 kilovatios pico (kWp) y renovará su infraestructura eléctrica, de aire acondicionado y de agua tratada. También instalará una central generadora de energía solar fotovoltaica con una capacidad inicial de 300 kWp.
La renovación del sistema de pronóstico del clima también incluirá un nuevo modelado numérico de previsión meteorológica y climática, denominado Monan (Modelo de Previsión Oceánica, de Superficies Terrestres y Atmosférico), que aún se encuentra en fase de desarrollo. Según la información preliminar divulgada por el Inpe, además de los métodos tradicionales basados en la resolución de ecuaciones físicas, el Monan utilizará inteligencia artificial y aprendizaje automático para predecir el inicio y el final de las precipitaciones y los fenómenos climáticos extremos con una antelación de tres días y el pronóstico de las tendencias climáticas con una anticipación de tres meses. “Hoy en día, nuestros pronósticos llegan hasta los 15 días, pero su precisión solo es alta ‒en torno a un 90 %‒ para las 48 horas posteriores. Al cabo de siete días, se ubican por debajo de un 50 %”, dice Barbosa.
Tupã no será desactivada. “Mientras haya piezas de recambio disponibles, la máquina será afectada a proyectos de investigaciones científicas en el área del tiempo y el clima”, dice el investigador. En el Inpe, esta tarea se realiza actualmente en un clúster de procesamiento de alto rendimiento, un conjunto de máquinas de menor potencia que alcanzan una determinada capacidad de procesamiento. El clúster del Inpe, denominado Egeon, tiene una potencia de cálculo de 200 teraflops.
La llegada de gaia
La infraestructura de alto rendimiento destinada a la investigación científica en Brasil también se vio reforzada en 2023 con la adquisición, por parte de Petrobras, de la supercomputadora Gaia, de 7,7 petaflops, ensamblada por la empresa Dell. Fue puesta en marcha en agosto del año pasado para el uso exclusivo del Centro de Investigaciones, Desarrollo e Innovación de Petrobras (Cenpes). Su objetivo es el desarrollo y el perfeccionamiento de las tecnologías vinculadas con la geofísica, entre ellas, las herramientas de procesamiento de las imágenes sísmicas, que utilizan las ondas sonoras reflejadas para generar una especie de tomografía computarizada del subsuelo terrestre.
A finales de 2022, Petrobras contaba con una capacidad de procesamiento de 63 petaflops y anunciaba la meta de llegar a los 80 petaflops, sin especificar la fecha en que prevé lograrlo. Además de Gaia, en 2023 también fue puesta en funcionamiento Gemini, cuya capacidad es de 3,9 petaflops. En el área de producción, las supercomputadoras de la petrolera se utilizan principalmente en las actividades de procesamiento sísmico y en la ingeniería de reservas. En el primer caso, el objetivo es determinar la presencia de petróleo y la mejor zona para la perforación de los pozos; en el segundo, la finalidad es estudiar el comportamiento del petróleo almacenado.
Cómo es una supercomputadora por dentro
Equipados con miles o incluso millones de núcleos de procesamiento de alto rendimiento, estos aparatos pueden llegar a pesar entre 20 y 40 toneladasLas dos características principales de las supercomputadoras son su alta velocidad de procesamiento y gran capacidad de memoria. Están compuestas por un conjunto de máquinas que operan en forma conjunta y, en promedio, pesan entre 20 y 40 toneladas. Los equipos se encuentran distribuidos en racks dispuestos en hilera y ocupan una sala refrigerada específicamente. Frontier, la supercomputadora más potente del mundo, está compuesta por 74 racks que ocupan una dependencia de 680 metros cuadrados.
La supercomputadora Santos Dumont, del Laboratorio Nacional de Computación Científica (LNCC), está situada en la ciudad serrana de Petrópolis (Río de Janeiro), cuyo clima es templado. No obstante, requiere tres generadores de 750 kilovoltio-amperios (kVA) cada uno, dos para su funcionamiento y uno de reemplazo, en caso de ser necesario. Se necesitan 1.500 kVA para mantener el sistema en operación y refrigerado constantemente.
La velocidad de procesamiento de un superordenador está determinada por la rapidez con la que procesa las operaciones (flops). Los equipos más potentes que existen actualmente procesan las operaciones en un rango de decenas o centenas de petaflops ‒ cada petaflops equivale a 1.000 billones (1015) de operaciones matemáticas por segundo ‒ y si hablamos de exaflops, 1 trillón (1018) de operaciones matemáticas por segundo.
Para realizar esta tarea, estas supermáquinas cuentan con miles o millones de núcleos de procesamiento de alto rendimiento, entre unidades centrales de procesamiento (CPU) y unidades de procesamiento gráfico (GPU). Con una capacidad de cálculo de 5,1 petaflops, Santos Dumont posee 36.472 núcleos de CPU y 1.134 nodos de cálculo.
La memoria volátil o RAM (las siglas en inglés de memoria de acceso aleatoria) de una computadora portátil común varía entre 2 y 32 gigabytes (GB). En una supercomputadora, la misma se mide en terabytes (un TB equivale a mil GB). El superordenador Pégaso, de Petrobras, con una capacidad de procesamiento de 21 petaflops, posee una memoria RAM de 678 TB.
São Paulo tendrá un nuevo centro de computación de alto rendimiento
El consorcio integrado por siete universidades contará con una supercomputadora de 5 petaflopsDentro de un año, Brasil dispondrá de una nueva supercomputadora con una capacidad de aproximadamente 5 petaflops. La máquina será instalada en el recientemente creado Centro de Supercomputación Científica del Estado de São Paulo (C3SP), una de las dos unidades que recibirán financiación a través de un llamado a concurso emitido en forma conjunta por la FAPESP y los ministerios de Ciencia, Tecnología e Innovación (MCTI) y de Comunicaciones (MCom) nacionales para apoyar centros de computación de alto rendimiento.
“Se trata de una antigua demanda de las instituciones de investigación del estado, que concentran alrededor de un 60 % del uso de la supercomputadora Santos Dumont, del LNCC”, dice el meteorólogo Pedro Leite da Silva Dias, director ejecutivo del C3SP. “Si pretendemos que las investigaciones realizadas aquí tengan un impacto mayor, necesitamos máquinas competitivas”.
El C3SP está formado por las tres universidades del estado de São Paulo (la Universidad de São Paulo, la Universidad de Campinas y la Universidade Estadual Paulista), las cuatro federales (la Universidad Federal del ABC, la Universidad Federal de São Carlos, la Universidad Federal de São Paulo y el Instituto Tecnológico de Aeronáutica) y las privadas, Centro Universitário FEI e Instituto Mauá de Tecnologia. “En breve se abrirá una licitación para la compra de equipamiento y la selección de un centro de procesamiento de datos empresariales para albergarlo. Hemos optado por un lugar neutro para que el concepto de consorcio no se desvirtúe”, explica Dias.
La segunda propuesta adjudicada fue el Centro de Computación de Alto Rendimiento del Sinapad, el Sistema Nacional de Procesamiento de Alto Desempeño. “Nuestro proyecto se inserta en un contexto estratégico para la supercomputación en el país, que es la revitalización del Sinapad”, dice Antônio Tadeu Gomes, coordinador ejecutivo de la propuesta e investigador del LNCC.
Los fondos, de alrededor de 50 millones de reales, el mismo monto destinado al C3SP, se destinarán a la actualización de cinco unidades del Sinapad: el Centro Nacional de Supercomputación, en la Universidad Federal de Rio Grande do Sul, el Núcleo de Computación de Alto Rendimiento, en la Universidad Federal de Río de Janeiro, el Instituto Metrópolis Digital, en la Universidad Federal de Rio Grande do Norte, y los Centros Nacionales de Procesamiento de Alto Rendimiento de Minas Gerais y Ceará.
La potencia de cálculo de los cinco centros en conjunto, en la actualidad es de aproximadamente 700 teraflops. Con la revitalización, esta cifra alcanzará entre 4 y 8 petaflops. “Estas unidades apoyarán la investigación científica en diferentes regiones del país”, subraya Gomes.
Republicar