Utilizing Machine Learning in Data Management
Degree Master
- Readers
- Dr. Eberhard Hechler (ehem. IBM)
- Dates
- Fri, 10:15-11:45, A302, Sand 1 (from 18.10.2024)
- Links
- ILIAS
Zielsetzung
Zielsetzung der Vorlesung “Utilizing Machine Learning in Data Management” ist die Erlangung eines umfassenden Verständnisses der Nutzung relevanter Machine Learning Methoden zur Optimierung des Datenmanagements. Hierbei werden spannende Themen behandelt, wie z.B. die Anwendung von Deep Learning und Word Embeddings für semantisches SQL, Machine Learning Methoden zur Verbesserung der SQL Performance, Machine Learning Algorithmen zur Optimierung von Blocking bei Entity Resolution und das Erkennen und Messen von Data Drift u.a. zur Bias-Vorhersage von Machine Learning Modellen.
⚠️ Die Vorlesung ist eine Überarbeitung und Weiterführung der im WS 23/24 gehaltenen Vorlesung Machine Learning in Datenbanksystemen und Datenmanagement , wobei insbesondere die Themen semantisches SQL, Entity Resolution und Data Drift hinsichtlich theoretischer Grundlagen und Anwendungen im WS 24/25 intensiver behandelt und durch zahlreiche Beispiele und Übungen ergänzt werden. Die diesjährige Vorlesung ist auch für Teilnehmer aus dem vergangenen Jahr empfehlenswert.
Zu Beginn der Vorlesung werden die wichtigsten Machine Learning Konzepte, Algorithmen und Methoden besprochen, sodass als Voaussetzung zum Verständniss der Vorlesung grundlegende ML-Kenntnisse hinreichend sein sollten. Der Besuch der Vorlesung DB1 ist jedoch empfehlenswert. Die Vorlesung wird sowohl von IBM Produkt-Beispielen als auch von Aufgaben und Übungen zur Vertiefung der Lehrinhalte begleitet.
Vorlesungen
Dies ist eine Gastvorlesung rund um künstliche Intelligenz in und um Datenbanksystemen; gehalten wird sie von Dr. Eberhard Hechler, einem ehemaligen IBMer aus dem Forschungs- und Entwicklungslabor in Böblingen. Die Vorlesung ist in die folgenden Blöcke unterteilt:
- Introduction – outline, books, references…
- Key concepts of relational database management systems (DBMS)
- Review of key Machine Learning (ML) concepts – part I
- Review of key Machine Learning (ML) concepts – part II
- Review of key Deep Learning (DL) concepts
- Introduction and Db2 SQL Data Insights
- Skip-gram with negative sampling (SGNS)
- Continuous bag of words (CBOW)
- Introduction into entity resolution (ER)
- Blocking methods - locality-sensitive hashing (LSH)
- ML in Db2 performance and DBMS system assessment
- ML for data profiling and quality
- Detecting and managing data drift
- Data drift with IBM Watson OpenScale
- Data drift research areas
Die Materialien zur Vorlesung werden passwort-geschützt auf ILIAS1 geteilt. Das Passwort wird in der Vorlesung bekannt gegeben.