Leistungssteigerung der HPC-Systeme durch erweiterten Support

Keyvisual image main
Die Teilnehmer eines HLRS-Optimierungsworkshops erhalten Unterstützung zur Verbesserung ihrer Codes.

Die Bereitstellung personalisierter Anleitungen für HPC-Benutzer führt zu schnelleren Codes und einer effizienteren Nutzung von Rechenressourcen.

Seit 2007 hat das Gauss Center for Supercomputing (GCS) – das Netzwerk von Deutschlands nationalen Supercomputing-Zentren – die Installation und den Betrieb von Weltklasse-Systemen für Höchstleistungsrechner koordiniert. 2018 expandierte es in eine wichtige neue Richtung, der Implementierung weiterer Supportdienstleistungen, die es ermöglichen, die Nutzung der Systeme effizienter zu gestalten.

„Jedes Mal, wenn man einzelnen Benutzern hilft, die Maschine effizienter zu nutzen, verbessert man die Ressourcen des Computers als Ganzes“, sagt Thomas Bönisch, Leiter des HLRS User Management Teams. „Durch die Optimierung von Anwendungen für die Computerhardware, auf denen sie laufen, können wir mehr Ergebnisse aus den gleichen Rechnerressourcen herausholen.“

Der erweiterte Support umfasst mehr als nur die Unterstützung für das Upload von Codes auf HPC-Systeme oder den Transfer von Daten. Stattdessen erhalten Wissenschaftler praktische und persönliche Beratung zur Verbesserung der Leistung ihrer Codes auf HPC-Ressourcen. Dies geschieht auf verschiedenen Ebenen: Auswahl und Optimierung des besten Algorithmus für ein bestimmtes Problem und einem bestimmten Höchstleistungsrechner, Verbesserung der Skalierung parallelen Rechnens, Strukturierung des Prozesses zur Ausnutzung der einzigartigen Eigenschaften der spezifischen Prozessoren und die Beseitigung von Engpässen beim Transfer von großen Datenmengen.

Während einige Forscher ihre eigenen Tools zur Analyse von wissenschaftlichen Problemen entwickeln, verlassen sich andere auf die herkömmlichen Codes oder Open-Source-Software. In beiden Fällen können sie von der Hilfe von HPC-Experten bei der Auswahl der besten Werkzeuge profitieren und ihre Leistung optimieren. Dies ermöglicht neue, rechenintensive wissenschaftliche Fragen zuzulassen.

Seit 2016 veranstaltet das HLRS einen halbjährlichen Optimierungsworkshop, bei dem Benutzer der Hazel Hen sich mit Supportmitarbeitern austauschen können, um die Leistung ihrer Codes zu verbessern. Dieser Austausch ist sehr produktiv und führt zu Verbesserungen der Laufzeit und der Datenübertragungsgeschwindigkeit; in einigen Fällen können Codes sogar doppelt so schnell oder noch schneller laufen.

Mit Zuschüssen vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg, hat das HLRS 2018 neue Mitarbeiter eingestellt, um sich intensiv der Unterstützung bestimmter Nutzergruppen zu widmen. So kann sich eine engere Beziehung zwischen den Forschern und Experten für Höchstleistungsrechner entwickeln, um gemeinsam die Leistung kontinuierlich zu steigern. Diese verbesserte Supportinitiative hat es auch ermöglicht, die Koordination der Support- Aktivitäten zwischen dem HLRS und seinen GCS Partnern, dem Jülich Supercomputing Centre und dem Leibniz Supercomputing Centre, zu optimieren. Vertreter der drei Zentren treffen sich regelmäßig, um sich über die Optimierungsmöglichkeiten bezüglich der Rechnerleistungen auszutauschen. So verspricht sich die Initiative, die Performanz von Nutzercodes in der gesamten nationalen Supercomputing-Infrastruktur zu erhöhen.

— Christopher Williams