Die Mehrzahl der schnellsten Supercomputer der Welt verwenden heutzutage Grafikprozessoren (GPUs) als Beschleuniger. Die ursprünglich für Videospiele entwickelten GPUs rechnen schneller und effizienter als zentrale Recheneinheiten (CPUs), die traditionellen „Zugpferde“ des Höchstleistungsrechnens (HPC). Der Haken ist jedoch, dass Codes, die für CPUs geschrieben wurden, in der Regel nicht auf GPU-basierten Systemen laufen.
Die vorherigen Generationen von Supercomputern am HLRS – darunter Hazel Hen und Hawk – basierten hauptsächlich auf CPUs. Nach der Ankündigung von Hunter begannen die langjährigen Nutzer:innen der Systeme des HLRS jedoch im Jahr 2024 ernsthaft mit dem Übergang zu GPUs. Obwohl das neue System bei maximaler Leistung fast doppelt so schnell ist wie Hawk, werden Nutzer:innen nur dann wirklich von der Geschwindigkeit profitieren, wenn sie ihre Codes erfolgreich für GPUs umschreiben.
14. Mai 2025
Home Top News
Anwender-Forschung
Informationen für System-User
Systeme & Infrastruktur
Physik
Code-Optimierung
User Support
Alle Nachrichten
Ein Forschungsteam unter der Leitung von Dr. Kathrin Schulte am Institut für Thermodynamik der Luft- und Raumfahrt (ITLR) der Universität Stuttgart gehört zu den Nutzergruppen, die sich mit dieser Umstellung befassen. Seit mehr als 25 Jahren nutzen Forschende des ITLR die Supercomputer des HLRS, um einen Code namens FS3D (Free Surface 3D) auszuführen. FS3D ist ein umfangreicher, modularer Code mit zahlreichen Anwendungen, der direkte numerische Simulationen von grundlegenden physikalischen Prozessen in Tröpfchen durchführt. Solche Simulationen sind vielseitig anwendbar, von der Wettervorhersage über die Konstruktion von Kraftstoffeinspritzdüsen in Motoren bis hin zum Sprühen von Farbe bei der Herstellung.
Mitte 2024 veranstaltete das HLRS einen Workshop zur praktischen Code-Portierung für seine Community. Während des Workshops traf sich das ITLR-Team mit dem User Support Team des HLRS sowie mit Hardware-Expert:innen von Hewlett Packard Enterprise (HPE, Hunters Hersteller) und AMD, um die einfachsten und effektivsten Strategien für die Auslagerung von Teilen von FS3D auf GPUs zu ermitteln.
FS3D war in seinem Entwicklungsstadium für eine Vektorrechnerarchitektur optimiert. Daher hatten die Entwickler:innen bereits Erfahrung mit dem Programmiermodell OpenMP für parallele Berechnungen mit gemeinsamem Speicher. Dies kam dem Team bei der Vorbereitung auf Hunter zugute, da das array-basierte Vektor-Computing dem Konzept von GPU-Prozessoren technisch ähnelt. Nachdem das Team die Vor- und Nachteile der verschiedenen Programmiermodelle mit HPC-Expert:innen am HLRS diskutiert hatte, entschied es sich, OpenMP für die GPU-Implementierung von FS3D zu verwenden.
„Wir hätten auch eines der anderen Modelle verwenden können, aber wir hätten nach einer unklugen Entscheidung noch mehr Code umschreiben müssen“, erklärte Schulte. „Da wir keine Erfahrung mit GPUs hatten, hätten wir uns nicht vertraut, eine qualifizierte Entscheidung zu treffen. Das HLRS unterstützte uns bei der Wahl eines sinnvollen Ansatzes.“
In seiner jüngsten Forschung hat das Schulte-Labor FS3D für hochauflösende Simulationen des Verhaltens von Tröpfchen beim Aufprall auf eine strukturierte Oberfläche verwendet. Bild: ITLR, Universität Stuttgart
Trotz der Erfahrung mit Vektorberechnungen und OpenMP war noch viel Arbeit nötig, um FS3D auf Hunter vorzubereiten. Das Team traf sich während des gesamten Jahres 2024 regelmäßig und beriet sich häufig mit dem User Support des HLRS und technischen Expert:innen von HPE. Wenn die Forschenden auf Fehler stießen oder Funktionen in FS3D identifizierten, die in der neuen Programmierumgebung nicht unterstützt wurden, konnten sie dank des schnellen Zugangs zu Systemexpert:innen Probleme gut lösen und Umgehungsstrategien entwickeln. „Wenn zum Beispiel ein Problem mit einem Compiler auftrat, steckten wir nicht wochenlang fest. Sie halfen uns, schnell Lösungen zu finden. Wir schätzten die ständige Unterstützung von allen Seiten – HLRS, HPE und AMD“, so Schulte.
Bevor Hunter vollständig installiert wurde, stellte HPE ein kleines Cluster am HLRS mit der gleichen Architektur zur Verfügung. Auf diesem System konnten Nutzer:innen des HLRS wie das ITLR-Team die portierten Versionen ihrer Codes testen. Mit diesen Ressourcen war FS3D für GPUs bereit, als Hunter im Februar 2025 offiziell in Betrieb ging.
Um die Leistung von FS3D zu verbessern, sind noch weitere Optimierungen erforderlich. Daher arbeitet das ITLR-Team weiterhin mit den Mitarbeitenden des HLRS, von HPE und AMD an der Weiterentwicklung des Systems. Dadurch wird das ITLR-Team das nächstleistungsfähigere, kommende System des HLRS, Herder, nutzen können, sobald es im Jahr 2027 verfügbar ist. Dies wird Schulte und ihrem Labor dabei helfen, schneller Ergebnisse zu erzielen und neuartige Phänomene der Tröpfchendynamik zu untersuchen.
— Christopher Williams