Das Extended-User-Support-Programm des HLRS geht weit über unsere grundlegenden Unterstützungs- und Mentorenangebote hinaus und ermöglicht eine enge Zusammenarbeit zwischen unseren wissenschaftlichen Nutzer:innen und dem User Support Team.
Während Systemnutzer:innen ein tiefes Verständnis der von ihnen untersuchten wissenschaftlichen Fragestellungen und der zu deren Erforschung benötigten Codes mitbringen, weiß der HLRS User Support genau, wie unsere HPC-Systeme aufgebaut und konfiguriert sind. Wir bringen beide Seiten zusammen und stellen sicher, dass die Software unserer Nutzer:innen so geschrieben wird, dass die parallelen Architekturen der Systeme effizienter genutzt werden.
Dieser multidisziplinäre, kollaborative Ansatz verbessert die Produktivität unserer wissenschaftlichen Nutzer:innen und ermöglicht gleichermaßen einen effektiveren und nachhaltigeren Einsatz der HLRS-Rechenressourcen. Das Extended-User-Support-Programm des HLRS wird hauptsächlich vom SiVeGCS Projekt betrieben und konzentriert sich auf folgende Schlüsselaktivitäten:
HLRS-Mitarbeiter:innen überprüfen die rechenintensivsten Codeabschnitte von Systemnutzer:innen mithilfe von Profiling-Methoden, die die wichtigsten Leistungsmerkmale bewerten. Dies beinhaltet unter anderem die POP-Metriken für die parallele Effizienz sowie die Eingabe-/Ausgabeleistung (E/A) und die Leistung auf Knotenebene.
Zweimal im Jahr veranstaltet das HLRS Workshops zur Leistungsoptimierung und Skalierung. Bei diesen Treffen arbeiten Nutzer:innen eine Woche lang Seite an Seite mit den Optimierungsspezialist:innen des HLRS an der Entwicklung und Umsetzung von Codeänderungen, die zu Leistungsverbesserungen führen. Für einige Nutzer:innen dienen diese Performance-Workshops als Übergang in den weiterführenden Level 2- und Level 3-Support.
Beim Level-2-Support arbeitet der HLRS User Support Staff für einen Zeitraum zwischen ein paar Wochen bis zu einigen Monaten mit den Systemnutzer:Innen zusammen, um bestehende Codes mit bewährten Methoden zu verbessern. Hierbei liegt der Schwerpunkt auf der Verbesserung der Codeleistung und somit der Effizienz, während der Algorithmus im Wesentlichen gleichbleibt.
Beim Level-3-Support arbeiten HLRS-Expert:innen über mehrere Monate mit den Systemnutzer:Innen zusammen, um gänzlich neue Methoden zu entwickeln. Dies kann Änderungen des Algorithmus beinhalten, die eine effizientere Nutzung von Rechenressourcen ermöglichen und die Skalierbarkeit auf hochparallelen Plattformen verbessern.
Im Level-4-Support arbeiten die Mitarbeiter:innen des HLRS eng mit den Nutzern an speziellen, längerfristigen Projekten zusammen, die sich mit neuartigen wissenschaftlichen und technologischen Herausforderungen befassen. Dies kann zum Beispiel die Entwicklung neuer Berechnungswerkzeuge (einschließlich ganzer Anwendungscodes), Programmiermodelle, Arbeitsabläufe oder Datenbanken zur Unterstützung bestimmter Nutzergruppen umfassen. Auf diese Weise ermöglichen wir Fortschritte in den jeweiligen Anwendungsbereichen unserer Nutzer:innen und gehen auf ihre sich entwickelnden Interessen und Anforderungen ein.
In einigen Fällen kann die Zusammenarbeit im Rahmen unseres Extended User Supports zu wissenschaftlichen Veröffentlichungen führen, die von Systemnutzer:innen zusammen mit Mitarbeiter:innen des HLRS User Supports verfasst werden. Diese Veröffentlichungen können sich etwa mit der Entwicklung neuer Methoden oder dem Einsatz bewährter Methoden zur Verbesserung der Effizienz befassen, einschließlich einer Bewertung ihrer jeweiligen Vor- und Nachteile.
Sind Sie ein aktueller Benutzer unserer Systemen? Klicken Sie hier, um eine Störung zu melden, den Betriebsstatus von Hawk zu überprüfen oder technische Unterlagen und andere Informationen zu Ihrem Projekt zu finden.
Das Extended User Support Programm des HLRS ist ein wesentlicher Bestandteil unserer Bemühungen, sicherzustellen, dass unsere Supercomputing-Infrastruktur den größtmöglichen Nutzen für Wissenschaft und Gesellschaft erbringt. In Anbetracht des Energie- und Ressourcenbedarfs, der mit dem Bau und Betrieb eines erstklassigen Tier 0/1-Systems verbunden ist, ist die Optimierung der Leistung von rechenintensiven Nutzer-Codes ebenfalls notwendig, um zu garantieren, dass das HLRS diese Ressourcen verantwortungsvoll nutzt. Dadurch kann es auch in Zukunft HPC-Funktionen auf dem neuesten Stand der Technik gewährleisten. Die Leistungsoptimierung, die aus unserem Extended User Support Programm resultiert, hat insbesondere die folgenden Vorteile:
Durch die Optimierung der Algorithmen und Codes auf eine Weise, die das Geschwindigkeitspotential unserer Rechensysteme vollends ausschöpft, können die Forschungsprojekte unserer Nutzer schneller fortschreiten. Dies kann in sich schnell entwickelnden wissenschaftlichen oder technologischen Bereichen zu Wettbewerbsvorteilen führen.
Indem Wissenschaftler ihre Algorithmen so anpassen und skalieren, dass sie auf neuen und immer größeren Rechnersystemen effizient laufen, können sie komplexe Fragestellungen auf eine Art und Weise untersuchen, die früher rechnerisch nicht anwendbar gewesen wäre.
Indem das HLRS sicherstellt, dass einzelne Nutzeraufträge so wenig Rechenzeit und Ressourcen wie möglich beanspruchen, kann es der wachsenden Nachfrage nach Höchstleistungsrechnern besser gerecht werden und seine begrenzten Ressourcen für die größtmögliche Anzahl an Nutzerforschungsprojekten zur Verfügung stellen.
Wenn Nutzer-Codes parallele Rechenarchitekturen effizienter nutzen, benötigen sie weniger Rechenhardware und verbrauchen weniger Energie. Dementsprechend kann die Gesamtmenge an Energie und Ressourcen, die für die gleiche wissenschaftliche Produktivität benötigt wird, verringert werden, wenn alle Nutzer von HPC-Systemen vergleichbar mit denen des HLRS die Leistung ihrer Codes optimieren. Aus diesem Grund ist das Extended User Support Programm des HLRS ein wesentlicher Bestandteil der Nachhaltigkeitsstrategie des Zentrums.
10. Sep 2024
08. Mai 2024
19. Dez 2023
11. Okt 2023