Supercomputing Akademie: Datenanalyse mit HPC

Themen der Künstlichen Intelligenz (KI) waren lange Zeit nur ein leeres Schlagwort. Heutzutage hat KI bereits die Entwicklungslabore verlassen und hat Einzug in den Alltag erhalten. Algorithmen und Systeme der Künstlichen Intelligenz sind allgegenwärtig. Sei es die Empfehlung von Produkten bei Amazon, über Serienempfehlungen in Netflix oder die Interaktion mit Sprachassistenten wie Alexa oder Cortana. Dieses Modul soll einen ersten Einblick in die „Blackbox Datenanalyse“ geben. Hierzu gehört nicht nur die Definition relevanter Kernbegriffe, sondern auch deren Abgrenzung. Sie bekommen in diesem Modul einen ersten Einblick in den typischen Ablauf einer Datenanalyse („Workflow“) anhand konkreter Beispiele. Die Beispiele werden vervollständigt durch eine Reihe von Praxisbeispielen. Dieser Kurs bietet darüber hinaus die Möglichkeit zum intensiven Austausch mit den Dozenten sowie den anderen Kursteilnehmern.

Location

Online course
Organizer: HLRS, University of Stuttgart, Germany

Start date

Nov 04, 2024

End date

Dec 13, 2024

Language

German

Entry level

Basic

Course subject areas

Data in HPC / Deep Learning / Machine Learning

Supercomputing Academy

Topics

Machine Learning

Back to list

Inhalt

Themenbereiche

  • Datenanalyse, Künstliche Intelligenz: Eine Einführung
  • Konvergenz von HPC und Künstlicher Intelligenz
  • Exkurs: Container-Technologien
  • Explorative Datenanalyse
  • Exkurs: Nicht-Relationale Datenbanken
  • Maschinelles Lernen: Konzepte, Algorithmen und Evaluierung
  • Einführung in Neuronale Netzwerke
  • Big Data Architekturen und Frameworks
  • Trends und neuartige Technologien im Bereich HPC und AI

Übungen auf dem Trainingscluster der Supercomputing Akademie

  • Übung zu Container-Technologien
  • Übung zur explorativen Datenanalyse mit Tableau und Python
  • Übung zu Neuronalen Netzen mit TensorFlow
  • Übung zur Datenanalyse am Beispiel Stuttgarter S-Bahn Fahrzeiten

Die Übungen werden auf dem Trainingscluster des HLRS der Supercomputing Akadmie durchgeführt. Teilnehmer:innen erhalten dafür einen 24/7-Zugang zum Cluster über die gesamte Dauer des Kurses. Die Übung zu Container-Technologien wird udocker (Basistool für User zur Ausführung von Docker Containern) vorgstellt und verwendet.  50% der Übungen werden mit einem Jupyter Notebook auf dem Trainingscluster durchgeführt. Die Übung zur explorativen Datenanalyse sowie die Übung zu Neuronalen Netzen werden zudem über einen Container bearbeitet, sodass die Teilnehmer:innen sich Ihren Containern exportieren, die Übungen komfortabel mitnehmen und auf einem anderen Hostsystem (welches eine Software zur Container-Visualisierung installiert hat) problemlos ausführen können. Für die Übung zur Datenanalyse am Beispiel Stuttgarter S-Bahn Fahrzeiten wird Apache Spark (ein Framework für Cluster Computing) verwendet.

Dozenten

Dennis Hoppe (HLRS) Oleksandr Shcherbakov (HLRS)
Dr.-Ing. Lorenzo Zanon (HLRS)  

 

Preise

52,50€ Student:innen ohne Masterabschluss (oder äquivalentem Abschluss)

127,50€ Mitarbeiter:in oder Doktorand:in an einer deutschen Universität oder einem deutschen öffentlichen Forschungsinstitut

255,00€ Mitarbeiter:in oder Doktorand:in an einer Universität oder einem öffentlichen Forschungsinstitut in einem anderen EU-, EU-assoziierten oder PRACE-Land als Deutschland

510,00€ Mitarbeiter:in oder Doktorand:in an einer Universität oder einem öffentlichen Forschungsinstitut außerhalb eines EU-, EU-assoziierten oder PRACE-Landes

1410,00€ Andere Teilnehmer:innen, z. B. aus der Industrie, von anderen öffentlichen Einrichtungen oder private Teilnahme

Link zu den EU und EU-assoziierten (Horizon Europe), und PRACE Ländern.

Zielgruppen

  • Entwicklungsingenieure
  • CAE-, Berechnungs- und Simulationsingenieure
  • System-Designer
  • Simulationsinteressierte

Vorkenntnisse

Linux

Da die vorgesehenen Übungen auf dem HLRS-Trainingscluster bereitgestellt werden, benötigen die Kursteilnehmer erweiterte Grundkenntnisse des freien Betriebssystems Linux. Die wichtigsten Konzepte und Werkzeuge von Linux wie

  • Shell und Shell-Befehle (→ sicherer Umgang mit der Kommandozeile),

  • Secure Shell (SSH-Verbindung zum Cluster herstellen),

  • den Umgang mit Dateien und Skripten (kopieren, verschieben, umbenennen),

  • die Struktur des Systems (Verzeichnisse wechseln),

  • die Benutzer- und Rechteverwaltung (wem eine Datei gehört und wer diese lesen, ändern und ausführen darf) und

  • das Erstellen/Modifizieren von einfachen (ggf. vorhandenen) Batch-Skripten mit einem Editor wie nano, vi oder emacs

sollten bekannt sein. Eine Anleitung zur Arbeit auf dem Trainingscluster wird zur Verfügung gestellt. Falls Sie bei sich in dieser Hinsicht noch Defizite feststellen, verweisen wir an dieser Stelle auf https://www.tuxcademy.org/product/lxes/.

Programmierkenntnisse

Vorkenntnisse in Python sind erforderlich. Von den Teilnehmer:innen wird vorausgesetzt,dass Sie zur Verfügung gestellten Beispielcodes lesen und modifizieren zu können. Alternativ verfügen die Teilnehmer über solide Programmierkenntnisse in einer anderen Programmiersprache (z.B. C/C++, Fortran oder Java) und sind dadurch in der Lage sich leicht in die Programmiersprache Python einzuarbeiten. Da Python verwendet wird, kann dieses Tutorial zum Erlernen der Syntax verwendet werden. Für die Übungen werden die Programmbibliotheken

für die Programmiersprache Python verwendet. Es wird empfohlen sich bereits vorab mit diesen Bibliotheken und deren Methoden vertraut zu machen. Erste Erfahrungen im Umgang mit Jupyter Notebooks sind ebenfalls erforderlich. Da Jupyter Notebooks verwendet werden, kann dieses Tutorial genutzt werden, um sich damit vertraut zu machen.

Umgang mit herkömmlichen Office Programmen

Um sich Datensätze anzuschauen, wird der Umgang mit einem Tabellenkalkulationsprogramm (z.B. Microsoft Excel, LibreOffice Calc) vorausgesetzt.

Technische Voraussetzungen

  • Rechner mit ssh-Zugang zum Trainingscluster (mit ssh-Key).

    • Ggf. muss Software installiert werden. Dafür notwendige Rechte müssen vorhanden sein.

    • Netzverbindungen nach außen zu fremden Clustern müssen aufgebaut werden können.

  • Software: Mozilla Firefox/ Google Chrome Browser

  • Eine stabile Internetverbindung für das Bearbeiten der Lerninhalte und Übungen wird empfohlen.

  • Zugang zu Videokonferenz-Tool mit Kamera und Mikrofon (ein Headset wird aus Qualitätsgründen empfohlen).

Zeitaufwand

Der Zeitaufwand pro Modul beträgt insgesamt 50 Stunden bei wochenweise freier Zeiteinteilung sowie feste Termine für virtuelle Seminare (abends) und Prüfung (tagsüber). Die Dauer erstreckt sich über 5 Wochen mit einem ungefähren wöchentlichen Aufwand von 10 Stunden.

Flexibles Lernen

Sie lernen in komfortabler und effektiver Onlinelehre und erwerben so HPC-Fähigkeiten auf höchstem Niveau. Ergänzt werden die Online-Phasen durch regelmäßige Online-Meetings im virtuellen Klassenraum. Bei freier Zeiteinteilung wenden die Teilnehmerinnen und Teilnehmer das Gelernte in Übungen auf dem Trainingscluster an. Die Fachexperten des HLRS, welche die Lerneinheiten entwickelt haben, stehen in wöchentlichen virtuellen Seminaren für Fragen zur Verfügung. Ein Forum ermöglicht den fachlichen Austausch der Teilnehmerinnen und Teilnehmer untereinander.

Qualifizierte Teilnahmebestätigung

Für die Teilnahme an dem Modul erhalten Sie vom Höchstleistungsrechenzentrum Stuttgart eine Teilnahmebestätigung. Wenn Sie zudem sämtlich Lerninhalte des Moduls bearbeitet, regelmäßig an den virtuellen Seminaren teilgenommen und die Lernaufgaben fachgerecht beantwortet haben, erhalten Sie eine qualifizierte Teilnahmebestätigung.

Zertifikat

Sie erhalten ein Zertifikat, wenn Sie die Voraussetzungen für die qualifizierte Teilnahmebestätigung erfüllen und die Abschlussprüfung des Moduls bestehen. Mit der erfolgreichen Prüfung weisen Sie nach, dass Sie Kompetenzen erworben haben, das erlernte Wissen selbständig anzuwenden.

Weitere Informationen

Für weitere Informationen zur Supercomputing Akademie besuchen Sie unsere Website: https://www.supercomputing-akademie.de/

Weitere Kursangebote finden Sie auf Training Overview und Supercomputing Akademy Overview.

Related training

All training

April 22 - 25, 2024

Online


June 25 - 26, 2024

Online


July 02 - 05, 2024

Stuttgart, Germany