Secciones
Referencias
Resumen
Servicios
Buscar
Fuente


Hitos del supercómputo: del Giga al Exascale
Supercomputing Milestones: from Giga to Exascale
Epistemus (Sonora), vol. 18, no. 35, pp. 61-67, 2023
Universidad de Sonora, División de Ingeniería

Desde la academia


Received: 06 March 2023

Revised document received: 29 November 2023

Published: 12 December 2023

DOI: https://doi.org/10.36790/epistemus.v18i35.300

Resumen: En junio de 2022 se presentó la supercomputadora más potente del mundo, FRONTIER del Laboratorio Nacional Oak Ridge, USA, capaz de realizar, por primera vez, más de un trillón de operaciones de punto flotante por segundo. Este gran acontecimiento nos motivó a realizar un análisis de la panorámica del supercómputo mundial, en cuatro momentos históricos; el primero corresponde al inicio del proyecto TOP500 que clasifica a las 500 supercomputadoras más poderosas del planeta, y los otros tres corresponden a las épocas en que se superaron los rendimientos de los TFlop/s, PFlop/s y EFlop/s; a través de cuatro indicadores que están vinculados al desarrollo científico, tecnológico y académico de una nación. El primero se refiere al número de equipos de supercómputo por país; el segundo al poder de cómputo por región; el tercero y cuarto, al número de supercomputadoras y el rendimiento ocupado por sector: industria, investigación, académico, gobierno y otro.

Palabras clave: Supercómputo, HPC, Exascale, Hitos del Supercómputo.

Abstract: In June 2022, the most powerful supercomputer in the world, FRONTIER from the Oak Ridge National Laboratory, USA, was presented, capable of performing, for the first time, more than a quintillion floating-point operations per second. This event motivated us to carry out an analysis of the worldwide overview of the supercomputing, in four historical moments. The first one is the appearance of the ranking of the 500 most powerful supercomputers on the planet, and the other three are the times when supercomputers exceeded the TFlop/s, PFlop/s, and EFlop/s, through four indicators closely associated with the scientific, technological, and academic development for a country. The first refers to the number of supercomputing equipment per country; the second the computing power per region; the third and fourth to the number of supercomputers and the performance occupied by sector.

Key words: Supercomputing, HPC, Exascale, Supercomputing Milestones.

Introducción

Las computadoras de última tecnología, diseñadas para resolver problemas científicos y de ingeniería de gran complejidad, que requieren una gran cantidad de recursos computacionales, son conocidas como supercomputadoras y, sin duda, han desempeñado un papel fundamental en beneficio de la humanidad, basta ver la rapidez y eficiencia con las que se han generado vacunas y fármacos para combatir la Covid-19 [1], gracias a la sinergia de los centros de supercómputo más importantes del mundo como el “High Performance Computing Consortium[2]. Las supercomputadoras se comenzaron a clasificar a principios de la década de 1990 a través del proyecto TOP500 [3] de acuerdo con sus características computacionales, específicamente, en la velocidad para realizar cálculos numéricos. Este proyecto elabora un ranking semestral de las 500 supercomputadoras más potentes del planeta de acuerdo con su desempeño real (Rmax), midiendo el número de operaciones de punto flotante por segundo (Flop/s, acrónimo en inglés de Floating Point Operations per Second) que pueden realizar los sistemas clasificados al ejecutar el benchmark LINPACK[4]. Es importante señalar que este parámetro es diferente del rendimiento teórico máximo(Rpeak), que está relacionado con las propiedades físicas (hardware) de las unidades de procesamiento y que varía de una computadora a otra, lo que imposibilita utilizarlo para poder realizar una clasificación adecuada; en general, Rmax< Rpeak . Esta iniciativa continúa hasta nuestros días proporcionando otros datos de gran utilidad, tales como, el número de equipos de supercómputo por país, región o continente, así como, los tipos de arquitecturas, Cluster o MPP (Massively Parallel Processing); tipo de interconexión, Ethernet (10G, 25G, 40G), Infiniband (EDR, FDR, HDR), etc. Asimismo, podemos encontrar datos interesantes, como, la identificación de los países que más utilizan el supercómputo, así como los sectores más destacados (industria, investigación, academia, gobierno, entre otros) que se benefician de esta tecnología. Dichos datos son muy valiosos en el momento de tomar decisiones en torno a la modernización o renovación de la infraestructura computacional. En este trabajo nos enfocaremos en analizar 4 indicadores de la lista TOP500, en 4 momentos que consideramos hitos relevantes del supercómputo:

  1. 1. 1993: inicio de la lista TOP500.
  2. 2. 1997: se supera el TFlop/s (1012 Flop/s) de rendimiento real.
  3. 3. 2008: se rompe la barrera del PFlop/s (1015 Flop/s).
  4. 4. 2022: comienza la era del EFlop/s (1018 Flop/s).

Hitos del supercómputo

Es indudable que el desarrollo tecnológico ha permitido la fabricación de computadoras cada vez más rápidas que pueden realizar una cantidad enorme de operaciones de punto flotante por segundo. A casi tres décadas del inicio del proyecto TOP500, hemos presenciado cuatro grandes sucesos relacionados con los desempeños. o performances (Rmax ), de los supercomputadores más potentes del mundo. Nuestro objetivo es presentar cómo han evolucionado los siguientes cuatro indicadores que consideramos de interés científico y tecnológico en general, en cada uno de estos momentos históricos: (1) el número de equipos de supercómputo que hay por país (NSC/país ); (2) el poder de cómputo o la cantidad de Flop/s efectivos disponibles por región (Rmax/país ) y finalmente, (3) y (4) el número de supercomputadoras utilizadas (NSC/sector ), y el poder de cómputo consumido (Rmax/sector ) por los diferentes sectores, como el científico, el académico, el tecnológico o el de la industria.

Génesis del proyecto TOP500: la época de los GFlop/s.

El proyecto TOP500 inició a mediados de 1993, y cuyo “objetivo principal es proporcionar una lista clasificada de sistemas que pueden resolver una serie de problemas científicos que son de uso común para aplicaciones de frontera”. Esta lista proporciona “estadísticas que reflejan la diversificación de las supercomputadoras, la enorme diferencia de rendimiento entre los modelos de gama baja y alta, la creciente disponibilidad de sistemas de procesamiento paralelo masivo (MPP) y el fuerte aumento en el poder de cómputo de los modelos de frontera.” En la figura 1 se presenta la línea de tiempo de las últimas tres décadas, del rendimiento o desempeño de las supercomputadoras a nivel mundial. El eje vertical representa el rendimiento efectivo (Rmax ) en unidades de Flop/s, mientras que el eje horizontal el año en el que se realizó la clasificación. Las supercomputadoras con el mayor rendimiento de la época (#1) están representadas por triángulos amarillos, mientras que las que ocupan el puesto 500 en la lista están representadas por cuadros azules, en tanto que, y el poder de cómputo total está representado por cuadros verdes. Como se puede apreciar, los comportamientos de los tres conjuntos de datos son aproximadamente lineales, lo que nos puede permitir elaborar un modelo sencillo que nos relacione de forma directa el rendimiento con el año de la publicación de la lista para cada grupo y de esta manera poder pronosticar el rendimiento de los nuevos sistemas que se crearán en el futuro. También podemos apreciar que las rectas son aproximadamente paralelas, que el intervalo de tiempo (de 6 a 8 años) entre las líneas amarilla (#1) y azul (#500) aumenta ligeramente con el tiempo, es decir, los avances tecnológicos son rápidamente asimilados, en escalas de tiempo menores a 10 años.


Figura 1
Rendimiento de las 500 supercomputadoras más potentes del mundo; las #500 se representan en cuadros azules, las #1 en triángulos amarillos y el desempeño total o la #suma en cuadros verdes. El eje vertical muestra el desempeño medido en Flop/s y el eje horizontal el año de la publicación de la lista (Imagen tomada del portal TOP500 the List https://top500.org).

El primer ranking de este proyecto fue publicado en junio de 1993, cuando el poder de cómputo total en el mundo era de 1.1 TFlop/s, de manera que en solo 4 años (1997) este rendimiento se igualó por solo una supercomputadora, la ASCI Red, del Sandia National Laboratories, de los Estados Unidos, debido al acelerado crecimiento tecnológico. En la publicación de la primera lista se presenta al sistema CM-5/1024 de Thinking Machines Corporation, ubicado en Los Alamos National Laboratory de Nuevo México, USA, como la supercomputadora #1, con un rendimiento máximo (Rmax ) de 59.7 GFlop/s, mientras que la #500 tenía un desempeño de 0.4 GFlop/s, es decir, 150 veces menor que la #1. De los 23 países que aparecen en la lista de ese año solo dos pertenecen a Latinoamérica; Brasil en las posiciones 72 y 404 respectivamente, con 2 supercomputadoras; un sistema NEC SX-3/12R con un Rmax de 2.90 GFlop/s asociado al INPE (National Institute for Space Research) y un sistema Cray Y-MP2E/232 de la Universidad Federal do Rio Grande do Sul, con un desempeño de 0.6 GFlop/s; y México en el lugar 249, con un sistema Cray Y-MP4/432 con un Rmax de 1.16 GFlop/s, mismo desempeño que la supercomputadora número 224 de la lista. Este equipo fue adquirido por la Universidad Nacional Autónoma de México (UNAM) en noviembre de 1991 y se le considera la primera supercomputadora de Latinoamérica.

Top 5 del supercómputo a nivel mundial.

Como se ha mencionado previamente, en 1993 se publicó una lista que clasifica a las 500 supercomputadoras más poderosas del mundo. Al analizar los datos publicados a lo largo de tres décadas, encontramos que dos indicadores utilizados en nuestro estudio, los países con el mayor número de supercomputadoras y los países que tienen mayor poder de cómputo, presentan una similitud. Los primeros cinco lugares de la lista están ocupados prácticamente por los mismos países. Esta analogía también se presenta en las épocas que consideramos históricas: el inicio del proyecto TOP500 (1993) y los momentos en los que se han superado rendimientos reales emblemáticos en la historia de la supercomputación: Rmax > 1 TFlop/s; Rmax > 1 PFlop/s y Rmax > 1 EFlop/s.

La muestra de estudio se seleccionó de acuerdo con los siguientes criterios:

  1. 1. Solo consideramos los años: 1993, 1997, 2008 y 2022, los cuales consideramos como hitos del supercómputo.
  2. 2. Solo usaremos los 5 primeros lugares de la lista TOP500, ya que representan el 85% del número de equipos de supercómputo y casi el 90% del rendimiento real, del total de la lista.

Comenzamos nuestro estudio analizando los datos de los índices NSC/país y Rmax/país, correspondientes a cada una de las cuatro épocas de estudio (ver tablas 1 y 2). Como se puede apreciar, los dos indicadores están dominados por cinco naciones; Alemania (GER), Estados Unidos (USA), Francia (FRA), Japón (JPN) y Reino Unido (GBR).

Tabla 1
Supercomputadoras por país (NSC/país).

Tabla 2
Performance por país (Rmax/país).

La hegemonía de los Estados Unidos es inobjetable, en ambos índices, excepto en el año 2022, donde China (CHN) aparece encabezando el indicador NSC/país . A primera vista parece una situación atípica, no lo es, puesto que su posición en la lista TOP500 ha sido relevante, liderando dicha clasificación durante un período de 10 semestres, desde noviembre de 2010 hasta noviembre de 2017.

Por otro lado, al comparar la lista de países que aparecen en las tablas 1 y 2 con los 5 países que tienen el mayor “Producto Interno Bruto” nominal (PIB) en las mismas épocas (1993 [5], 1997 [6], 2008 [7], 2022 [8]), encontramos que son prácticamente los mismos. Esto nos permite inferir, que dichos países tienen grandes desafíos científicos y tecnológicos que enfrentar, tales como el cambio climático, los desastres naturales, la creación de vacunas y fármacos, entre otros. Para resolverlos invierten más del 1% de su PIB, en Investigación y Desarrollo (I+D). Parte de esta inversión se va en la adquisición de estas supercomputadoras que son una herramienta fundamental para dar soluciones a dichos problemas.

Las figuras 2 y 3 presentan los gráficos de barras de los índices NSC/país y Rmax/país, respectivamente, para cada uno de los años considerados (1993-barras azules; 1997-barras verdes; 2008-barras rojas y 2022-barras amarillas). Podemos observar que solo 4 países repiten en el top 5, USA, JPN, FRA y GER, en tanto que GBR solo en 3 ocasiones y CHN una sola vez. Como se mencionó anteriormente, la hegemonía de USA es evidente en ambos índices, excepto en 2022 donde el índice NSC/país está encabezado por CHN, sin embargo, el rendimiento real (Rmax/país) sigue estando dominado por los estadounidenses. Por consiguiente, el hecho de que un país ocupe el primer puesto en este indicador (NSC/país ), no significa necesariamente que tenga la mayor capacidad de cómputo de la lista TOP500. Recordemos que el rendimiento máximo real(Rmax) de una supercomputadora depende del número máximo teórico de operaciones de punto flotante por segundo (Flop/s) que pueden ejecutar sus unidades de procesamiento (Rpeak) . Por ejemplo, en 2022 CHN tiene 45 sistemas más que USA (tabla 1), pero su rendimiento máximo real es 4 veces menor que el de USA (tabla 2). Esto se debe, principalmente, a la cantidad máxima de Flop/s teóricos disponibles por país (Rpeak/país) , que es de 3.15 EFlop/s para USA y 1.15 EFlop/s para CHN, un factor de 2.7 de diferencia (para más detalle ver sección List Statistics del portal TOP500 the List[9]). Esta tendencia se observa claramente en las figuras 2 y 3, a medida que disminuye el número de equipos de supercómputo por país, el rendimiento máximo real aumenta de manera significativa. En resumen, tomemos como ejemplo a los Estados Unidos, que de acuerdo con las figuras 2 y 3, tuvo su máximo en 1997 con 265 supercomputadoras, y luego alcanzó un mínimo de 128 en 2022, una tendencia a la baja que indica una disminución de un factor de 2. Por el contrario, el rendimiento máximo real se incrementó de 699 GFlop/s en 1993 a 2.09 EFlop/s en 2022, lo que representa un incremento de 6 órdenes de magnitud en un lapso de 29 años. De igual manera, debemos examinar cómo se encuentra la situación de Latinoamérica en relación con los índices presentados. En el índice NSC/país del año 1993, solo se encuentran tres supercomputadoras en la región, dos de Brasil y una de México, con un rendimiento máximo realRmax/país de 3.5 GFlop/s y 1.6 GFlop/s, respectivamente. En 1997, aparecen solo tres supercomputadoras en la lista, repitiéndose el mismo patrón que en 1993, dos de ellas de Brasil y una de México, pero ahora presentan un mejor rendimiento máximo realRmax/país de 28 GFlop/s y 10.42 GFlop/s, respectivamente. En las siguientes dos épocas de estudio, solo aparece Brasil con un crecimiento extraordinario, particularmente en el año 2022, con un índice NSC/país de 8 equipos y un índice de Rmax/país de 46.73 PFlop/s, estando entre los 10 países con mejor rendimiento máximo real del mundo. Esto podría indicarnos el interés de Brasil por invertir en tecnología de frontera para solucionar problemas de gran envergadura en el ámbito petrolero, científico, por mencionar algunos. En el caso de México, el hecho de que solo aparezca en dos épocas de estudio de este trabajo no significa que no se haya invertido en cómputo de alto rendimiento. Por supuesto que se ha asignado presupuesto para la adquisición de supercomputadoras, pero no ha sido suficiente. Podría invertirse más porque existen diversos problemas que resolver que requieren de esta tecnología.


Figura 2
Número de supercomputadoras por país en las 4 etapas de estudio.


Figura 3
Performance o desempeño por país en las 4 etapas de estudio.

Demanda de supercómputo por sector.

Como se mencionó anteriormente, las supercomputadoras están diseñadas para resolver problemas que requieren una gran cantidad de recursos computacionales. Estos problemas se pueden agrupar o clasificar en seis grandes categorías o sectores afines, tales como, los relacionados con la investigación, la academia, la industria, el gobierno, el proveedor o vendedor y otros. Los índices, número de supercomputadoras por sector (NSC/sector) y rendimiento máximo real por sector (Rmax/sector), nos ayudarán a identificar los principales grupos que requieren de supercómputo. Como puede observarse en la figura 4, la mayor parte de los equipos de supercómputo son empleados principalmente por los sectores de la industria, la investigación y la academia, superando ampliamente a los sectores de gobierno, vendedor y otros. También se aprecia en la figura 4 que en 2008 se registra un incremento notable en la cantidad de supercomputadoras utilizadas por el sector de la industria, con el 57.4% de los 500 sistemas de la lista TOP500 de ese año, superando con creces a los sectores de la academia y la investigación. Creemos que posiblemente la respuesta de este repunte este en el artículo de Addison Snell [10] el cual aborda el problema de la oferta y la demanda del mercado HPC en el año 2008. En ese trabajo se examinan diferentes aspectos tecnológicos innovadores de la época, a los que se deberán enfrentar los diversos sectores. Por ejemplo, cómo programar en paralelo a escala de procesador multi-core, así como la gestión y la programación a diferentes niveles, tales como, multi-nodo, multi-procesador y multi-core, y la utilización de aceleradores tipo FPGA (Field Programable Gate Array), GPGPU (General-Purpose Graphics Processing Unit), por mencionar algunos. Mejorando el factor precio/rendimiento, volviéndose atractivo para áreas de aplicaciones no convencionales, como la industria financiera, donde no solo se emplea para hacer análisis financieros o de riesgo, sino que comienza a utilizarse para soluciones comerciales en tiempo real, surgiendo como un nuevo subconjunto de aplicaciones con un gran potencial HPC que posteriormente se adaptará a toda la industria. Por otro lado, en la figura 5 observamos que el poder de cómputo (Rmax/sector) utilizado por la investigación supera el de la industria en las cuatro etapas de estudio lo que muestra la importancia del supercómputo en la academia e investigación. Finalmente, de las figuras 4 y 5 encontramos un fenómeno similar al descrito en la sección anterior, referente a la no-relación entre el NSC y el Rmax , es decir, que un sector emplee un gran cantidad de equipos de supercómputo, no garantiza que el rendimiento máximo real de dichos equipos sea el mayor en comparación con los que utilizan otros sectores.


Figura 4
Número de equipos de supercómputo por sector.


Figura 5
Performance o desempeño por sector.

Conclusiones

A través del análisis de cuatro indicadores obtenidos del proyecto Top500, en cuatro épocas específicas, que definimos como hitos del supercómputo (1993, 1997, 2008 y 2022), nos permite mostrar una perspectiva general del supercómputo a nivel mundial. Encontramos que los cinco primeros lugares de la lista en diferentes épocas están ocupados por seis países que representan más del 80% de los equipos de supercómputo y aproximadamente el 90% del rendimiento máximo real del planeta: Estados Unidos, Japón, Alemania, Francia, Gran Bretaña y China. Existiendo una buena correlación con los países que se encuentran con el PIB nominal más alto del mundo, indicando una estrecha relación entre el supercómputo y el desarrollo económico de una nación. En lo que respecta a Latinoamérica, encontramos que solo México y Brasil se encuentran en los índices NSC/país y Rmax/país de la lista TOP500, siendo importante señalar que Brasil presenta un crecimiento exponencial en ambos índices a lo largo del tiempo, posicionandose actualmente entre los 10 primeros lugares de la lista TOP500. Finalmente, analizamos los datos vinculados a los índices NSC/sector y Rmax/sector, encontrando que el sector industria cuenta con el mayor número de equipos de supercómputo. No obstante, el sector investigación y académico domina el indicador de rendimiento máximo real, que está fuertemente vinculado con el poder de cómputo requerido para desarrollar proyectos de gran envergadura.

Reconocimientos

Agradecemos inmensamente al Dr. José Franco del Instituto de Astronomía de la UNAM y al personal del Departamento de Supercómputo de la UNAM, por sus valiosos comentarios y sugerencias.

Referencias

[1] L. H. Cervantes y A. J. Santillán, "La importancia de las Tecnologías de Información y Comunicación en tiempos de COVID-19," TIES, Revista de Tecnología e Innovación en Educación Superior, n.o. 3, abril, 2021. [En línea]. Disponible en: Disponible en: https://ties.unam.mx/ [Consultado en enero 20 día, 2023].

[2] “The COVID-19 High Performance Computing Consortium”, (May. 1, 2022). [Online]. Available: https://covid19-hpc-consortium.org/

[3] “Introduction and Objectives”, (Jun. 1, 2022). Top500 The List. [En Línea]. Disponible en Disponible en https://www.top500.org/lists/top500/2022/06 [Consultado en enero 20, 2022].

[4] “The LINPACK Benchmark”, (Nov. 14, 2022). Top500 The List. Fecha de consulta: enero 20, 2023. Disponible en Disponible en https://www.top500.org/project/linpack/

[5] “Anexo:Países por PIB (nominal) en 1993”. (2013, 25 de mayo). Wikipedia, La enciclopedia libre. Fecha de consulta: enero 20, 2023. Disponible en Disponible en https://es.wikipedia.org/w/index.php?title=Anexo:Pa%C3%ADses_por_PIB_(nominal)_en_1993&oldid=67149984

[6] “Anexo:Países por PIB (nominal) en 1997”. (2013, 25 de mayo). Wikipedia, La enciclopedia libre. Fecha de consulta: enero 20, 2023. Disponible en Disponible en https://es.wikipedia.org/w/index.php?title=Anexo:Pa%C3%ADses_por_PIB_(nominal)_en_1997&oldid=67149989

[7] “Anexo:Países por PIB (nominal) en 2008”. (2011, 17 de diciembre). Wikipedia, La enciclopedia libre. Fecha de consulta: enero 20, 2023. Disponible en Disponible en https://es.wikipedia.org/w/index.php?title=Anexo:Pa%C3%ADses_por_PIB_(nominal)_en_2008&oldid=52268650

[8] “Anexo: Países por PIB (nominal)”. (2022, 27 de mayo). Wikipedia, La enciclopedia libre. Fecha de consulta: enero 20, 2023. Disponible en Disponible en https://es.wikipedia.org/w/index.php?title=Anexo:Pa%C3%ADses_por_PIB_(nominal)&oldid=143807298

[9] “List Statistics”, (Jun. 14, 2022). Top500 The List. Fecha de consulta: enero 20, 2023. Disponible en Disponible en https://www.top500.org/statistics/list/

[10] A. Snell (2008, January 4), “HPC in 2008: Where the Growth Really Is”, HPC Wire, [Online]. Available: https://www.hpcwire.com/2008/01/04/hpc_in_2008_where_the_growth_really_is-1/

Notes

Cómo citar este artículo:

Santillán González, A., & Hernández-Cervantes, L. (2023). Hitos del supercómputo: del Giga al Exascale. EPISTEMUS, 18(35). https://doi.org/10.36790/epistemus.v18i35.300

Author notes

*Autor de Correspondencia: Alfredo J. Santillán, alfredo@astro.unam.mx



Buscar:
Ir a la Página
IR
Scientific article viewer generated from XML JATS by