SupercomputaciÃ³n a medio plazo

En los medios aparecen periÃ³dicamente noticias sobre una «nueva guerra frÃa»: disponer del superordenador mÃ¡s potente con el que aventajar a otros paÃses «rivales».

El comÃºn de los mortales estÃ¡ familiarizado con los frutos del paralelismo a pequeÃ±a escala: tanto mÃ³viles como portÃ¡tiles tienen hoy por hoy varios nÃºcleos.

Algunos tenemos la suerte de estar familiarizados con el siguiente escalÃ³n: HPC o «computaciÃ³n de alto rendimiento»

En el siguiente escalÃ³n las cifras son mareantes, y para sacarles algÃºn partido a esos recursos hay que contar con programas que estÃ©n realmente pensados para esa escala. Con lo cual, si bien muchos hacen cÃ¡lculos usando una fracciÃ³n de superordenadores como el Mare Nostrum de Barcelona, pocos son los que de verdad son capaces de sacarle el jugo a un superordenador en su totalidad.

Jack Dongarra (ahora en el KAUST de Arabia SaudÃ) tiene varias presentaciones sobre HPC. En El futuro de HPC: como plantearse la computaciÃ³n a escala peta y exa vemos cÃ³mo compara la potencia de cÃ¡lculo de los dispositivos que hemos ido mencionando: iPhone 4S, 1 GFLOPs; portÃ¡til, 70 GFLOPs; supercomputador «tÃpico», 50TFLOPs (1 TFLOP = 1000 GFLOPs)

Como en cualquier cosa susceptible de competencia, tambiÃ©n hay clasificaciones de superordenadores. La mÃ¡s conocida es el «Top 500«, basada en las pruebas Linpack. Consiste bÃ¡sicamente en resolver sistemas de ecuaciones lineales «densos». Desde que se comenzÃ³ a usar en 1993 las cosas han cambiado un poco, y otras pruebas alternativas cobran cada vez mÃ¡s importancia: Graph500 (varias tÃ©cnicas de anÃ¡lisis, o «kernels», aplicados a un Ãºnico grafo con pesos no dirigido), HPCG (diversas operaciones como multiplicaciÃ³n de una matriz dispersa por un vector), o Green500 (mayor eficiencia energÃ©tica, a partir de los resultados del Top 500).

Los supercomputadores mÃ¡s famosos han estado en el nÃºmero 1 del ranking del Top 500: TianHe2 (China), Kei (JapÃ³n), Bluegene (EEUU)… En la Ãºltima clÃ¡sificaciÃ³n (Junio 2015), el «top 10» lo copa Estados Unidos con Titan, Sequoia, Mira, Stampede y Vulcan (juntos, 54 PFLOPs y 34MW). Le siguen China (TianHe2, 34 PFLOPs / 17 MW), JapÃ³n (Kei, 10 PFLOPs / 13 MW), Suiza (Piz Daint, 6 PFLOPS / 2 MW), Arabia SaudÃ (Shaheen II, 5 PFLOPs / 3 MW) y Alemania (JUQUEEN II, 5 PFLOPs / 2MW).

La mayorÃa usan procesadores de PC, Intel o AMD. ARM se estÃ¡ constituyendo en una alternativa cada vez mÃ¡s interesante, sobre todo por su reducido consumo elÃ©ctrico y bajo precio. Ya existen prototipos en esta lÃnea, como el MontBlanc.

Un proyecto interesante es el Flagship 2020 (o «Post-Kei») que ha promovido el gobierno de JapÃ³n: disponer de un superordenador de 100 PFLOPs, en una sala de menos de 1000 metros cuadrados, con un consumo menor de 30 megawatios (MW). Todo ello por unos 700 millones de euros. El esfuerzo tambiÃ©n se dedicarÃ¡ a optimizar las aplicaciones para que aprovechen este «Exascale computing».

Los otros «top 10» ofrecen listas diferentes:

Graph 500: Kei (39000 GTEPs), Sequoia (24000), Mira (15000), JUQUEEN (6000), Fermi (3000), TianHe2 (2000), Turing, Dirac y Zumbrota.
HPCG: TianHe2 (600 GFLOPs), Kei (400 GFLOPs), Titan (300 GFLOPs), Mira (100), Piz Daint (100), Supermuc (100)
Green500: Shoubu (JapÃ³n, 7 GFLOPs/W), Suiren Blue y Suiren (7 GFLOPs/W), Tsubame KFS (4 GFLOPs/W), XStream (4 GFLOPs/W), Storm1 (4), Wilkes (4), Taurus (4), iDataPlex (4)

Otra comparativa interesante serÃa TFLOPs por euro. Un superordenador con potencia de 1 petaflop por segundo (PFLOP) que cueste 12 millones de euros ofrecerÃa unos 80 MFLOPs por euro. Un iPhone 4 ofrece 1 GFLOP por 500 euros, 2 MFLOPs por euro }:-)

O tambieÅ„, facilidad de uso por TFLOP. A pesar de tener la fama de ser el mÃ¡s potente, el TianHe2 tambiÃ©n tiene fama de ser terriblemente complejo de usar.

Y es que la potencia de cÃ¡lculo no lo es todo. Hace falta un entorno de desarrollo y pruebas amigable y eficaz, herramientas para optimizar el cÃ³digo en la arquitectura del superordenador, un sistema de almacenamiento capaz de soportar el torrente de datos con agilidad (por ejemplo, el NIH genera unos 20 petabytes al aÃ±o de informaciÃ³n mÃ©dica…). Un ejemplo serÃan OpenMP (API de programaciÃ³n paralela).

De hecho, los cuellos de botella actuales son precisamente el almacenamiento y acceso a los datos, y la memoria.

Durante un tiempo costÃ³ superar la barrera de los 10 PFLOPs, debido a que Infiniband no daba mÃ¡s de sÃ. De ahÃ que ahora los superordenadores recurran a interconexiones propietarias como Tofu.

Sobre interconexiones, el futuro ya estÃ¡ aquÃ: comunicaciÃ³n fotÃ³nica («sillicon photonics»), aplicable desde inter-nÃºcleo hasta larga distancia (WAN). AdemÃ¡s de permitir un mayor ancho de banda y menor latencia, reducen el consumo energÃ©tico.

En cuanto a memoria, ya hay arquitecturas de RAM 3D como Hybrid Memory Cube (HMC) que ofrecen anchos de banda de 480 GB/s. Una memoria DDR3 «tÃpica» ofrece 20 GB/s…

Otro tema que estÃ¡ de moda es la computaciÃ³n cuÃ¡ntica. Tal y como se presenta, se antoja la soluciÃ³n de todos los males. Pero la realidad apunta a que mÃ¡s bien desempeÃ±arÃ¡ un papel complementario (similar a por ejemplo las GPU)

Conferencias interesantes sobre estos temas son:

Dejar un comentario Cancelar la respuesta