Superrechner Juwels aus dem Forschungszentrum Jülich

Der Jülicher Superrechner Juwels ist der schnellste Computer in Europa und Platz 7 der Welt. Forschungszentrum Jülich

Der Jülicher Supercomputer Juwels wurde in den letzten Monaten fertig ausgebaut. Aufgrund eines neuen Booster-Moduls sind nun 85 Petaflops möglich, was 85 Billiarden Rechenoperationen pro Sekunde oder der Rechenleistung von mehr als 300 000 modernen PCs entspricht. JUWELS weitet damit die Grenzen von Simulationen massiv aus und bietet zudem die stärkste Plattform Europas für den Einsatz künstlicher Intelligenz (KI). Der Rechner, den das Forschungszentrum Jülich, das französisch-deutsche Unternehmen Atos und der Münchner Supercomputing-Spezialist ParTec gemeinsam mit dem US-Hersteller Nvidia entwickelt haben, ist aktuell das schnellste System in Europa.

Der Jülicher Superrechner, der durch das nationale Gauss Centre for Supercomputing finanziert wird, erreichte den 7. Platz auf Top500-Liste der schnellsten Computer der Welt. Auf der aktuellen Green500-Liste rangiert Juwels auf Platz 3 und ist das energieeffizienteste System in der höchsten Leistungsklasse.

„Wir verstehen Supercomputing nicht nur als Gegenstand unserer Forschung, sondern vor allem auch als mächtiges Werkzeug, mit dem wir gemeinsam mit unseren Partnern aus Wissenschaft und Industrie komplexe Forschungsfragestellungen beantworten können“, sagt Prof. Wolfgang Marquardt, Vorstandsvorsitzender des Forschungszentrums Jülich.

„Mit dem vollständig ausgebauten Juwels-System ermöglicht das Forschungszentrum Jülich Wissenschaftlerinnen und Wissenschaftlern unterschiedlichster Institutionen und wissenschaftlicher Disziplinen den Zugriff auf Höchstleistungsrechenkapazitäten auf allerhöchstem Niveau. Gleichzeitig demonstrieren wir mit dem System aber auch den verantwortungsvollen Umgang mit dem immer weiter zunehmenden Energiebedarf für die Bereitstellung von Rechenleistung.“

Im Video: Supercomputer Juwels – schneller als 300 000 moderne PCs

Intelligente Aufgabenteilung – höchste Energieeffizienz

Juwels beruht auf einer hochflexiblen modularen Architektur, die das Forschungszentrum Jülich gemeinsam mit europäischen und internationalen Partnern entwickelt hat. „Das neue Booster-Modul ist mit seinen leistungsstarken, hocheffizienten Grafikprozessoren speziell für ausgesprochen rechenintensive Anwendungen ausgelegt, die sich gut parallel auf einer großen Zahl von Rechenkernen bearbeiten lassen“, erläutert Dr. Dorian Krause, der in Jülich für den Aufbau und Betrieb des außerordentlich komplexen Systems verantwortlich ist.

Der Jülicher Supercomputer ist als einer der ersten mit Nvidia A100 Tensor Core GPUs ausgestattet, die auf der Nvidia Ampere-Architektur basieren. Etwa 12 Millionen sogenannte CUDA-Kerne (FP64) vereint der Booster auf seinen über 3.700 Grafikprozessoren, die über ein Nvidia Mellanox HDR Infiniband Höchstleistungsnetz mit 200 Gb/s miteinander verbunden sind. Der Booster allein erreicht eine Spitzenleistung von 73 Petaflops. Speziell für KI-Anwendungen, die andere Anforderungen an die Hardware stellen, sind sogar bis zu 2,5 Exaflops möglich: das entspricht 2,5 Trillionen Rechenoperationen pro Sekunde. Das Modul ist damit die stärkste Plattform Europas für den Einsatz künstlicher Intelligenz (KI).

Bildergalerie:„Das sind die Top 10 der Superrechner weltweit”
Neu in der Spitze der Top500Liste ist Dammam-7 auf Platz 10. Es ist bei Saudi Aramco in Saudi-Arabien installiert und ist der erste kommerzielle Supercomputer unter den aktuellen Top 10. Die HPE Cray CS-Storm-Systeme verwenden Intel Gold Xeon-CPUs und NVIDIA Tesla V100-GPUs. Es erreichte 22,4 Petaflops auf dem HPL-Benchmark.
Frontera, ein Dell C6420-System, das im vergangenen Jahr am Texas Advanced Computing Center der Universität von Texas installiert wurde, liegt jetzt auf Platz neun. Es erreicht mit 448.448 seiner Intel Platinum Xeon-Kerne 23,5 Petaflops.
HPC5, ein Dell PowerEdge-System, installiert von der italienischen Firma Eni, belegt Platz 8. Es erreicht mit Intel Xeon Gold-CPUs und Nvidia Tesla V100-GPUs eine Leistung von 35,5 Petaflops. Es ist das leistungsstärkste System in der Liste, das für kommerzielle Zwecke bei einem Kunden eingesetzt wird und damit das zweite in dieser Liste.
Ein neuer Supercomputer, bekannt als das Juwels Booster-Modul, debütiert auf Platz sieben der Liste. Die von Atos gebaute BullSequana-Maschine wurde kürzlich im Forschungszentrum Jülich (FZJ) in Deutschland installiert. Sie ist Teil einer modularen Systemarchitektur, und ein zweites Xeon-basiertes JUWELS-Modul ist auf der TOP500 auf Platz 44 separat aufgeführt. Diese Module werden mit Hilfe der ParTec Modulo Cluster Software Suite integriert. Das Booster-Modul verwendet AMD EPYC-Prozessoren mit Nvidia A100-GPUs zur Beschleunigung. Im Alleingang konnte das Juwels Booster-Modul 44,1 HPL-Petaflops erreichen, was es zum leistungsstärksten System in Europa macht.
Tianhe-2A (Milky Way-2A), ein von Chinas Nationaler Universität für Verteidigungstechnologie (NUDT) entwickeltes und am Nationalen Supercomputerzentrum in Guangzho eingesetztes System, erreicht Platz 6. Es wird von Intel Xeon-CPUs und den Matrix-2000-DSP-Beschleunigern von NUDT betrieben und erreicht 61,4 Petaflops auf HPL.
Auf Platz fünf befindet sich Selene, ein Nvidia DGX A100 SuperPOD, der intern bei der NVIDIA Corp. Er wurde im Juni als Nummer sieben gelistet, hat sich aber in seiner Größe verdoppelt, so dass er in der Liste um zwei Positionen vorgerückt ist. Das System basiert auf AMD EPYC-Prozessoren mit den neuen A100-GPUs von Nvidia zur Beschleunigung. Selene erreichte als Ergebnis des Upgrades 63,4 Petaflops auf HPL.
Sunway TaihuLight, ein vom chinesischen National Research Center of Parallel Computer Engineering & Technology (NRCPC) entwickeltes und am National Supercomputing Center in Wuxi installiertes System, belegt Platz vier. Es wird ausschließlich mit Sunway SW26010-Prozessoren betrieben und erreicht 93 Petaflops auf HPL.
Sierra, ein System am Lawrence Livermore National Laboratory in Kalifornien, liegt mit einem HPL-Wert von 94,6 Petaflops auf dem dritten Platz. Jeder seiner 4.320 Knoten ist mit zwei Power9-CPUs und vier NVIDIA Tesla V100-GPUs ausgestattet.
Summit, ein von IBM im Oak Ridge National Laboratory (ORNL) in Tennessee gebautes System, bleibt mit einer Leistung von 148,8 Petaflops das schnellste System in den USA. Summit hat 4.356 Knoten, von denen jeder zwei 22-Kern-Power9-CPUs und sechs NVIDIA Tesla V100-GPUs beherbergt.
Fugaku bleibt an der Spitze und steigert seine Arm A64FX-Kapazität von 7.299.072 Kernen auf 7.630.848 Kerne. Die zusätzliche Hardware ermöglichte seinen neuen Weltrekord von 442 Petaflops auf HPL. Damit liegt es dreimal vor dem System Nummer zwei in der Liste. Fugaku wurde von Fujitsu konstruiert und ist am Riken Center for Computational Science (R-CCS) in Kobe, Japan, installiert.

„Der Clou bei Juwels ist, dass beide Module, das bisherige ‚Cluster-Modul‘, das mit schnellen Prozessoren (CPUs) arbeitet, und das Booster-Modul mit seinen GPUs, ganz eng verschaltet sind“, sagt Bernhard Frohwitter, CEO des Münchner Supercomputing Spezialisten ParTec. Die Zusammenarbeit der Module steuert dabei ParTecs modulares Software-System ParaStation Modulo, eine weltweit führende Entwicklung aus Deutschland. „Mit ParaStation Modulo kann Juwels innerhalb eines Codes dynamisch beliebig auf CPUs und GPUs zugreifen und die Rechnung so optimieren.“

„Beide Module stammen von Atos und basieren auf unserer BullSequana X Infrastruktur, deren hocheffiziente, wassergekühlte, patentierte DLC-Lösung (Direct Liquid Cooling) wesentlich zum niedrigen Energieverbrauch des Systems beiträgt“, erklärt Agnès Boudot, Senior Vice President, Head of HPC & Quantum bei Atos. „Das Design von Atos stellt sicher, dass die Rechenleistung der CPU- und GPU-Blades in vollem Umfang von Anwendungen genutzt werden kann.“