JavaScript ist deaktiviert
Die JavaScript-Funktionalität Ihres Browsers ist deaktiviert. Um diese ConfTool-Funktion nutzen zu können, müssen Sie JavaScript aktivieren.
Hier finden Sie Informationen zur Aktivierung von JavaScript.
Bei Fragen oder Problemen wenden Sie sich bitte an das Organisationsteam unter fhdggv2026-conftool@fu-confirm.de.

Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

Nur Sitzungen an einem bestimmten Tag / zu einer bestimmten Zeit

Sitzungsübersicht

Sitzung

In Ihren lokalen Kalender importieren

S4 Maschinelles Lernen in der Grundwasserforschung

Zeit:

Mittwoch, 11.03.2026:

10:45 - 12:30

Chair der Sitzung: Stefan Broda, BGR
Chair der Sitzung: Tanja Liesch
Chair der Sitzung: Pia Ebeling, Helmholtz-Zentrum für Umweltforschung GmbH - UFZ

Ort: Weißer Saal, Kongresshalle am Zoo

Präsentationen

10:45 - 11:00
ID: 197 / Session 4: 1

Automatisierte Datenvorverarbeitung für die Zeitreihenmodellierung: Das Python-Paket hygtise

Bastian Habbel¹, Tanja Liesch¹, Marc Ohmer¹, Maria Wetzel², Patrick Clos², Stefan Broda²

¹Karlsruher Institut für Technologie (KIT); ²Bundesanstalt für Geowissenschaften und Rohstoffe (BGR)

Machine-Learning-Modelle bieten ein großes Potenzial für die Vorhersage von Grundwasserständen und ermöglichen die effiziente Modellierung einer Vielzahl von Messstationen. Ein entscheidender Faktor für die Modellgüte ist jedoch die Qualität der Eingangsdaten. Bei der Erfassung und Haltung von Messdaten können fehlerhafte oder unplausible Werte entstehen, welche die natürliche Grundwasserdynamik nur unzureichend repräsentieren. Unbereinigte Rohdaten enthalten oft Ausreißer, Plateaus und Datenlücken, verursacht durch Messfehler, Loggerartefakte oder Sensorausfälle. Unregelmäßige Messintervalle und Fehlwerte erschweren es den Algorithmen, die Zusammenhänge zwischen Klimadaten und Grundwasserstand zu erlernen. Während der Einfluss der Modellstruktur häufig im Fokus steht, wird der Preprocessing-Schritt von Rohdaten zu „Machine Learning Ready“-Datensätzen in der Literatur meist nur am Rande behandelt. Die Datenaufbereitung erfolgt dabei oft visuell und manuell, was sie zu einem zeitintensiven, subjektiven und schwer reproduzierbaren Prozess macht.

Mit hygtise, einem neu entwickelten Python-Paket für hydrogeological time series, wird dieser Schritt erstmals vollständig automatisiert und reproduzierbar umgesetzt. Das Tool erlaubt die schnelle, regelbasierte Vorverarbeitung umfangreicher Grundwasserzeitreihendatensätze. Für definierte Intervalle (täglich, wöchentlich, monatlich) identifiziert und entfernt es Plateaus, unplausible Ausreißer und Bruchpunkte mit sprunghafter Niveauänderung. Optional erfolgt eine stufenweise Qualitätsfilterung der Zeitreihen nach definierbaren Grenzwerten, um den Untersuchungsbereich mit möglichst vollständigen Zeitreihen zu repräsentieren. Abschließend werden fehlende Werte imputiert, sodass ein konsistenter, bereinigter Datensatz für die anschließende Modellierung entsteht. Die Methode wurde bereits erfolgreich an einem deutschlandweiten Langzeitdatensatz mit knapp 15.000 Messstellen angewendet.

Hygtise reduziert den manuellen Aufwand erheblich und schafft eine transparente Grundlage für datengetriebene Ansätze in der Grundwasseranalyse. Damit bildet es eine skalierbare und reproduzierbare Schnittstelle zwischen Rohdaten und Machine-Learning-Modellen in der Hydrogeologie.

11:00 - 11:15
ID: 241 / Session 4: 2

Datengetriebene Modellierung von Grundwasserganglinien: Herausforderungen unterschiedlicher Reaktionsdynamik

Maria Wetzel¹, Stefan Kunz¹, Fabienne Doll², Bastian Habbel², Tanja Liesch², Stefan Broda¹

¹Bundesanstalt für Geowissenschaften und Rohstoffe (BGR); ²Karlsruher Institut für Technologie (KIT)

Die Reaktionsdynamik von Grundwasserständen unterscheidet sich deutlich in Abhängigkeit von Standort- und Systemeigenschaften: Während flachgründige Systeme häufig kurzfristig auf meteorologische Antriebe reagieren, zeigen tiefer liegende Aquifere eine gedämpfte Dynamik. Insbesondere Messstellen mit großem Flurabstand und verzögerten Reaktionen auf externe Steuerungsgrößen sind bislang nur schwer zuverlässig modellierbar. Gerade diese Systeme sind jedoch hydrogeologisch besonders relevant, da sie aufgrund ihrer hohen Speicherfähigkeit und Persistenz gegenüber Dürre- und Feuchtephasen maßgeblich zur langfristigen Wasserverfügbarkeit und zur Pufferung klimatischer Extreme beitragen.

Zur Untersuchung des Verbesserungspotenzials datengetriebener Modelle, insbesondere im Hinblick auf unterschiedlich ausgeprägte Dynamiken, wurden Ganglinien von rund 400 Messstellen aus Brandenburg ausgewählt. Die Messstellen verfügen über kontinuierliche Zeitreihen seit 1980, liegen in allen drei Grundwasserleiterkomplexen und repräsentieren somit eine breite Spanne unterschiedlicher Reaktionsmuster. Zur Modellierung wurden rekurrente neuronale Netze (Gated Recurrent Units, GRU) trainiert, welche den Grundwasserstand basierend auf meteorologischen Parametern (Niederschlag und Lufttemperatur) vorhersagen. Untersucht wurden zwei zentrale Aspekte: (1) die Länge der Eingangssequenz und (2) die optionale Integration aggregierter meteorologischer Parameter. Damit sollte überprüft werden, ob erweiterte Rückblickzeiträume oder standortspezifisch geglättete Klimasignale die Abbildung träger Systemreaktionen verbessern können.

Die Ergebnisse zeigen, dass Sequenzlängen von zwei bis drei Jahren insbesondere bei trägen Grundwassersystemen zu einer erhöhten Modellgüte führen, während kürzere Zeithorizonte für dynamischere Systeme ausreichend sind. Die Verwendung standortspezifisch aggregierter meteorologischer Eingangsgrößen verbesserte die Abbildung der jeweiligen Reaktionszeiten und führte zu einer signifikanten Steigerung der Vorhersagegüte in trägen Grundwassersystemen. Obwohl einige Messstellen aufgrund ihrer starken Dämpfung selbst mit optimierten Modellen nur schwer vorhersagbar blieben, zeigen die Ergebnisse insgesamt ein deutliches Potenzial, träges Systemverhalten besser abzubilden und damit die Vorhersagequalität zu erhöhen.

11:15 - 11:30
ID: 362 / Session 4: 3

Verbesserung der Vorhersage von Grundwasserständen durch abgeleitete meteorologische Eingangsvariablen in Deep-Learning-Modellen

Fabienne Doll¹, Tanja Liesch¹, Bastian Habbel¹, Andreas Paxian², Clementine Dalelane², Juliane Voigt², Maria Wetzel³, Stefan Kunz³, Stefan Broda³

¹Karlsruher Institut für Technologie (KIT); ²Deutscher Wetterdienst (DWD); ³Bundesanstalt für Geowissenschaften und Rohstoffe (BGR)

Die Vorhersage von Grundwasserständen mithilfe von Modellen des maschinellen Lernens hat in den letzten Jahrzehnten stark an Bedeutung gewonnen. Solche Modelle ermöglichen es, zukünftige Grundwasserstände allein auf Basis von Input-Output-Beziehungen vorherzusagen, ohne dass zusätzliche physikalische Randbedingungen wie Grundwasserneubildung oder geologische Verhältnisse explizit berücksichtigt werden müssen.

Als Input werden dabei häufig meteorologische Parameter wie Niederschlag, Temperatur und relative Luftfeuchtigkeit verwendet. Mit diesen Input-Daten lassen sich Grundwasserstände oberflächennaher Messstellen, die typischerweise eine schnelle Reaktion auf meteorologische Einflüsse zeigen und eine ausgeprägte Saisonalität aufweisen, oft bereits zufriedenstellend prognostizieren. Für eine weitere Verbesserung solcher Vorhersagen könnten jedoch zusätzliche Inputs wie Bodenfeuchte oder potenzielle Evapotranspiration herangezogen werden.

Grundwassermessstellen mit weniger ausgeprägter Saisonalität, längeren Reaktionszeiten oder einem ausgeprägten Langzeittrend lassen sich anhand meteorologischer Bedingungen der jüngeren Vergangenheit schwerer vorhersagen. Dies liegt daran, dass sie weniger direkt auf kurzfristige meteorologische Schwankungen reagieren und stärker durch längerfristige Klimaeinflüsse geprägt sind. Die Einbindung von Telekonnektionsmustern oder Blocking-Indizes als Inputs kann hier helfen, Informationen über großskalige Klimaschwankungen zu berücksichtigen und dadurch die Prognosegenauigkeit für trägere Grundwasserstände zu verbessern.

Um das Verbesserungspotenzial bei der Vorhersage von Grundwasserständen durch zusätzliche Inputs zu untersuchen, vergleichen wir die Vorhersagegüte eines eindimensionalen Convolutional Neural Networks (1D-CNN), das ausschließlich die Inputs Niederschlag, mittlere, maximale und minimale Lufttemperatur sowie relative Luftfeuchtigkeit verwendet, mit der Vorhersagegüte desselben Modells, wenn jeweils ein weiterer zusätzlicher Input ergänzt wird.

Als zusätzliche Inputs wurden Bodenfeuchte, potenzielle Evapotranspiration, Blocking-Indizes (BBI, IBBI) sowie Telekonnektionsindizes verwendet. Es wurden die Telekonnektionsindizes AMO & ENSO als auch drei neu entwickelte Indizes getestet, die jeweils auf Niederschlag, Temperatur bzw. deutschlandweite Grundwasserstände im Zeitraum 1991–2012 ausgerichtet wurden. Die Ergebnisse zeigen, dass die Einbindung dieser zusätzlichen Parameter an der Mehrzahl der Messstellen zu einer Verbesserung der Vorhersagegüte führte.

11:30 - 11:45
ID: 298 / Session 4: 4

Untersuchung des Potenzials und der Grenzen für die Vorhersage der Grundwasserneubildung mittels Maschinellen Lernens

Florian Lam¹, Simon Damm², Asja Fischer², Thomas Heinze¹

¹Ruhr-Universität Bochum, Fakultät für Geographie und Geowissenschaften, Institut für Geowissenschaften, Hydrogeologie und Umweltgeologie, Deutschland; ²Ruhr-Universität Bochum, Fakultät für Informatik, Maschinelles Lernen

Die Quantifizierung der Grundwasserneubildung bleibt eine zentrale Herausforderung in der Hydrogeologie, insbesondere im Zusammenhang mit Klimaschwankungen und Ressourcenmanagement. Lysimeter-Messungen liefern direkte Schätzungen der Neubildung, sind jedoch räumlich spärlich verteilt und aufwendig in der Wartung. Diese Studie untersucht das Potenzial von Modellen des Maschinellen Lernens (ML) als datengesteuerte Ersatzgrößen für die Schätzung der Grundwasserneubildung anhand von Zeitreihen meteorologischer Variablen. Wir trainieren und evaluieren Long Short-Term Memory (LSTM)-Netzwerke anhand hochauflösender Lysimeterdaten aus mehreren Jahrzehnten, um Sickerflussraten auf der Grundlage von Niederschlag, Temperatur und damit verbundenen meteorologischen Merkmalen vorherzusagen. LSTM eignet sich gut, um die verzögerte und nichtlineare Natur von Neubildungsprozessen zu erfassen, bei denen Niederschläge Wochen oder Monate später messbare Sickerflüsse beeinflussen können. Wir bewerten den Einfluss von Hyperparametern wie Fensterlänge und Modellkomplexität auf die Vorhersagekraft des Algorithmus. Zudem vergleichen wir die Ergebnisse des LSTM mit weiteren Ansätzen des maschinellen Lernens. Die Auswahl der meteorologischen Merkmale orientiert sich an etablierten empirischen Beziehungen. Diese Arbeit untersucht, ob datengesteuerte Ansätze etablierte Schätzverfahren für die Grundwasserneubildung übertreffen können. Unsere Ergebnisse zeigen wichtige Einschränkungen auf, insbesondere die Notwendigkeit ausreichend großer Datensätze und die Verschlechterung der Modellleistung bei Datenlücken. Dennoch ist maschinelles Lernen vielversprechend für die Extrapolation der Dynamik der Grundwasserneubildung, wenn es entsprechend trainiert wird. Diese Arbeit leistet einen Beitrag zur wachsenden Debatte über die Integration physikalischer Erkenntnisse mit datengestützten Methoden zur Unterstützung der quantitativen Bewertungen von Grundwasserresourcen.

11:45 - 12:00
ID: 360 / Session 4: 5

Integration von Grundwasserentnahmedaten in ML-Modelle: Potenziale für verbesserte Grundwasserprognosen und die Bildung von Nutzungsszenarien

Stefan Kunz¹, Maria Wetzel¹, Eva González², Jörg Elbracht², Alexander Schulz³, Teodor Chiaburu³, Max Nölscher¹, Felix Biessmann³, Stefan Broda¹

¹Bundesanstalt für Geowissenschaften und Ressourcen, Deutschland; ²Landesamt für Bergbau, Energie und Geologie; ³Berliner Hochschule für Technik

Für die Vorhersage von Grundwasserständen hat sich der Einsatz von Methoden des maschinellen Lernens (ML) etabliert. Mittlerweile erlauben diese Ansätze Vorhersagen über große räumliche Regionen. So konnten wir in einer Studie zur 12-wöchigen Vorhersage von Grundwasserständen an über 5000 Messstellen in Deutschland mit dem sogenannten N-HiTS-Modell, einer modernen ML-Architektur basierend auf neuronalen Netzwerken, bereits eine für die Größe und hydrogeologische Diversität des Untersuchungsgebiets zufriedenstellende Modellgüte (NSE = 0,5) erzielen. Als Eingangsgrößen dienten historische Grundwasserstände, meteorologische Daten (z. B. Niederschlag, Temperatur), sowie hydrogeologische und räumliche Variablen (z. B. Grundwasserneubildung, Entfernung zum nächsten Fließgewässer). Weiterhin ermöglicht der Einsatz von ML-Ansätzen die Bildung von Szenarien, um beispielsweise langfristige Entwicklungen abzuschätzen. Dabei werden Modelle ohne historische Grundwasserstände trainiert, sodass Vorhersagen auf Basis langfristiger Klimaprojektionen unter verschiedenen Klimaszenarien getroffen werden können.

Um beide Modellierungsansätze zu verbessern, sind jedoch Daten zu anthropogenen Faktoren wie Grundwasserentnahmen in hoher zeitlicher und räumlicher Auflösung notwendig. Diese sind einerseits für Vorhersagen wichtig, da die anthropogenen Signale meist nicht in den Input-Output-Beziehungen solcher Modelle enthalten sind. Andererseits sind sie relevant für die Entwicklung von Nutzungsszenarien, welche in Kombination mit Klimaszenarien für langfristige wasserwirtschaftliche Planungen unerlässlich sind. Solche Daten liegen jedoch häufig nicht vor, was eine zentrale Herausforderung für beide Modellierungsansätze darstellt.

Im Rahmen des KIMoDIs-Projekts konnten wir dank der Zusammenarbeit mit assoziierten Wasserwerken Daten zu Grundwasserentnahmen verwenden und für beide Modellierungsansätze näher untersuchen. In einem ersten Schritt wurde der Grundwasserstand einer Messstelle eines Wasserwerks mit der Gesamtentnahme als zusätzliche Eingangsvariable vorhergesagt. Hier konnten wir zeigen, dass die Berücksichtigung der Gesamtentnahme die Vorhersagegüte des Modells deutlich verbessert (NSE von -0,1 auf 0.87).

Zur Abschätzung zukünftiger Entnahmen im Rahmen der Bildung von Nutzungsszenarien, wurde ein rekurrentes neuronales Netzwerk (Gated Recurrent Unit, GRU) trainiert, um Entnahmemengen aus Klima- und Bevölkerungsdaten zu prognostizieren. Dabei ergaben sich zwei zentrale Erkenntnisse:

Das Entnahmesignal ist zu hochfrequent, um direkt vorhergesagt zu werden. Eine Dekomposition, z. B. mittels Saison-Trend-Zerlegung mittels LOESS (STL), kann hier hilfreich sein, um Trend- und Saisonalitätskomponenten getrennt zu modellieren.
Extrapolation wird problematisch, wenn Eingangsgrößen außerhalb des Wertebereichs der Trainingsdaten liegen, da neuronale Netzwerke primär innerhalb dieses Bereichs zuverlässig interpolieren. Ein möglicher Lösungsansatz besteht darin, Änderungsraten als Eingangsvariablen zu verwenden.

Unsere Ergebnisse liefern wertvolle Hinweise, wie Grundwasserentnahmedaten effektiver in die Vorhersage von Grundwasserständen integriert und zur Bildung von Nutzungsszenarien genutzt werden können. Daneben weisen die Ergebnisse darauf hin, dass moderne Vorhersagemodelle für Grundwasserstände auch hilfreich sein könnten bei der Detektion und Modellierung von unbekannten antropogenen Faktoren.

12:00 - 12:15
ID: 216 / Session 4: 6

Entwicklung eines Regionalisierungsverfahrens zu den Nitratkonzentrationen im Grundwasser Deutschlands mit Random Forest

Lena Schümann, Stephan Hannappel

HYDOR Consult GmbH, Deutschland

Bei der Anwendung von Regionalisierungsverfahren mittels künstlicher Intelligenz in Deutschland liegt neben der mangelnden Modelltransparenz eine große Herausforderung darin, Anforderungen der Vorhersagegüte zu erfüllen. Nach bisherigem Kenntnisstand stehen zusätzlicher Aufwand, Unsicherheiten und mangelnde Interpretierbarkeit derzeit in einem noch nicht klaren Verhältnis zum möglichen, aber noch nicht gesicherten Gewinn an Vorhersagegüte.

Machine-Learning-Methoden bieten erweiterte Möglichkeiten. Sie erlauben die flexible Modellierung nichtlinearer Beziehungen, die Integration zahlreicher Einflussgrößen und die Berücksichtigung komplexer Interaktionen zwischen Prädiktoren. Der Random Forest-Algorithmus stellt dabei einen besonders robusten Ansatz dar: Durch die Kombination vieler Entscheidungsbäume werden Ausreißer und Rauschen in den Daten abgefangen, und die Modellvorhersagen werden stabilisiert. Gleichzeitig können Unsicherheiten abgeschätzt und die relative Bedeutung einzelner Prädiktoren analysiert werden, was die Interpretierbarkeit der Ergebnisse unterstützt

Bei dem von uns verwendeten Datensatz handelt sich um Nitratwerte inkl. hydrochemischer Begleitwerte von etwa 10.000 Messstellen der WRRL-Messnetze der Bundesländer in Deutschland, der sich aus einem insgesamt etwa 13.000 Messstellen umfassenden Datensatz nach Anwendung hydrogeologischer Selektionskriterien (z. B. zur Tiefe des Filterausbaus in Meter unter Grundwasseroberfläche) ergeben hat. Der Datensatz umfasst Messwerte aus dem Zeitraum von 2016 bis 2020 und bildet damit annähernd den aktuell gültigen Bezugszeitraum der AVV GeA (2022) ab, der sich von 2018 bis 2021 erstreckt. Der Datensatz bietet ausreichend Potential, um mit Trainingsdaten die Algorithmen zu verbessern.

Die von uns verwendeten räumlichen Prädiktoren mussten in eine optimale Merkmalskombination, z. B. hydrogeologischen Einheiten, Stickstoffüberschüsse und Landnutzungsdaten gebracht werden. Zusätzlich wurden redoxsensitive hydrochemische Parameterwerte (Sauerstoff, Eisen und Sulfat) verwendet. Ziel war es, eine räumlich hochaufgelöste Regionalisierung der Nitratwerte im Grundwasser des oberen Grundwasserleiters zu erreichen werden.

Die Entwicklung der Regionalisierungsmethode erfolgte in mehreren aufeinander aufbauenden Schritten: Zunächst wurden die Punktdaten aufbereitet und mit den flächenbasierten Prädiktoren verknüpft, um eine konsistente Trainingsgrundlage zu schaffen. Anschließend wurde eine systematische Feature-Selektion durchgeführt, um redundante und irrelevante Variablen zu identifizieren und die Modellkomplexität zu reduzieren.

Auf Basis der so ausgewählten Prädiktoren wurde das Modelltraining mit dem Random-Forest-Algorithmus durchgeführt. Das resultierende Modell wurde abschließend auf Rasterdaten angewendet, um flächenhafte Vorhersagen der NO₃-Konzentrationen im Grundwasser zu generieren. Im Ergebnis steht ein bundesweites Raster der modellierten Nitratwerte im Grundwasser, das eine hohe Punktgenauigkeit der berechneten zu den gemessenen Werten aufweist.

12:15 - 12:30
ID: 339 / Session 4: 7

Vorhersage von Trübungsereignissen einer Quellgruppe mithilfe eines Convolutional-Neural-Network-Modells zur Steuerung der Trinkwassergewinnung in Kassel

Julian Xanke¹, Martin Wagner¹, Han-Fang Hsueh¹, Nico Siebert-Grüneberg², Philipp Otter³, Tobias Morck³

¹TZW: DVGW-Technologiezentrum Wasser, Deutschland; ²Städtische Werke Netz + Service GmbH, Kassel; ³Universität Kassel, Fachgebiet Siedlungswasserwirtschaft, Kassel

Die Stadt Kassel ist in den letzten Jahren insbesondere während der Sommermonate zunehmenden Schwankungen im Wasserbedarf ausgesetzt, was zu einer verstärkten Nutzung von Grundwasser aus Tiefbrunnen führt. Gleichzeitig beeinträchtigen Starkniederschläge und der damit verbundene Eintrag von Humin- und Trübstoffen die Qualität des Quellwassers und führen regelmäßig zu Überschreitungen der Trübungsgrenze von 1 NTU. Im Rahmen des Projekts Flexilienz wird ein datengetriebenes Vorhersagesystem für Trübungsereignisse in einer Quellsammelfassung entwickelt, in der Wasser aus mehreren Quellsträngen zusammengeführt wird. Diese Sammelstruktur führt zu überlagerten Signalen von Trübung, die eine bisherige präzise Vorhersage erschweren.

Auf Basis langjähriger Sensordaten zur Trübung sowie ergänzender Wetter- und Klimadaten wird ein Convolutional Neural Network (CNN) implementiert, das die kurzfristige Prognose von Trübungsereignissen ermöglicht. Geplant ist die Integration einer Echtzeitabfrage von Wetterdaten und Wetterprognosen sowie der Trübungsdaten des Wasserversorgers. Die Kopplung dieser Datenströme soll es dem Wasserversorger ermöglichen, die Vorhersagen direkt in seine tägliche Steuerung der Wassergewinnungsanlagen zu integrieren. Ziel ist eine mehrtägige Prognose, sodass adaptive Filtrationsanlagen flexibel zugeschaltet werden können, um Abschläge von Quellwasser zu vermeiden und die Grundwasserförderung effizient zu steuern.

Erste Ergebnisse zeigen, dass das CNN die Signalüberlagerung zuverlässig auflösen und die zeitliche Verzögerung zwischen Niederschlagsimpuls und Trübungsanstieg präzise abbilden kann. Das Modell soll dazu beitragen, die Flexibilität und Resilienz der Wassergewinnung in Kassel signifikant zu erhöhen. Zudem bietet das entwickelte System eine Grundlage für die Übertragbarkeit auf andere Quellgebiete und Wasserwerke.

30. FH-DGGV-Tagung

Grundwasser und
Wassersicherheit im Wandel

Leipzig 10.–13. März 2026

Veranstaltungsprogramm