Conference Agenda

Overview and details of the sessions of this conference. Please select a date or location to show only sessions at that day or location. Please select a single session for detailed view (with abstracts and downloads if available).

 
 
Session Overview
Session
22: Künstliche Intelligenz und Machine Learning in der Grundwasserforschung
Time:
Saturday, 23/Mar/2024:
10:30am - 12:00pm

Session Chair: Tanja Liesch, Karlsruher Institut für Technologie KIT
Session Chair: Stefan Broda, Bundesanstalt für Geowissenschaften und Rohstoffe
Location: Konferenzraum 1

Session Topics:
22. Künstliche Intelligenz und Machine Learning in der Grundwasserforschung

Presentations
10:30am - 10:45am
ID: 142 / Thema 22: 1
Oral presentation
Topics: 22. Künstliche Intelligenz und Machine Learning in der Grundwasserforschung

Globale Entity-Aware Deep Learning Modelle für die Grundwasserstandsvorhersage

Benedikt Heudorfer1, Tanja Liesch1, Stefan Broda2

1Karlsruher Institut für Technologie (KIT), Institut für angewandte Geowissenschaften, Kaiserstr. 12, 76131 Karlsruhe; 2Bundesanstalt für Geowissenschaften und Rohstoffe (BGR), Wilhelmstr. 25–30, 13593 Berlin

Die Anwendung von maschinellem Lernen (ML), insbesondere von Deep Learning Modellen, in der Hydrogeologie zur Modellierung und Vorhersage von Grundwasserständen hat in den letzten Jahren an Bedeutung gewonnen. Die vorherrschende Modellklasse sind im Moment sogenannte Single-Well-Modelle, bei denen ein Modell für jede Messstelle separat angepasst wird. Aktuelle Ergebnisse in benachbarten Disziplinen (z.B. Hydrologie) haben jedoch die Vorteile globaler Modelle aufgezeigt, welche Daten aus mehreren Bohrungen einbeziehen können. Diese Modelle werden oft als „Entity Aware“ Modelle bezeichnet, da sie statische Input-Features verwenden, um die einzelnen Messstellen (d.h. die „Entitäten“) zu unterscheiden.

In dieser Studie haben wir zwei Arten von statischen Input-Features getestet, um die Grundwassermessstellen in einem globalen, Entity Aware Deep Learning Modell zu charakterisieren: Umweltcharakteristika (Environmental Features) wie z.B. Informationen über Grundwasserleiter, Boden, Landnutzung usw., welche räumlich kontinuierlich verfügbar sind und somit theoretisch eine räumliche Generalisierung (d.h. Regionalisierung) ermöglichen, und Zeitreihencharakeristika (Timeseries Features), welche aus der Zeitreihe der Messstelle abgeleitet werden. Des Weiteren verwenden wir in einem Vergleichsmodell Zufallszahlen (Random Features) anstelle der oben genannten physiographisch bzw. informationstheoretisch sinnvollen Charakteristika. Wir testen die Vorhersagegüte dieser unterschiedlichen Modelle anhand eines publizierten Datensatz von 108 Grundwassermessstellen in Deutschland und bewerten die Performance im Hinblick auf die Nash-Sutcliffe-Efficiency (NSE), jeweils in einem In-Sample bzw. einem Out-of-Sample Setup, mit dem Ziel, die räumliche bzw. zeitliche Generalisierbarkeit zu untersuchen.

Unsere Ergebnisse zeigen, dass globale Entity Aware Modelle mit einem durchschnittlichen NSE > 0,8 im In-Sample Setup gut funktionieren und mit Single-Well-Modellen vergleichbar sind, bzw. deren Performance sogar leicht übertreffen. Allerdings zeigt die relativ niedrige Performance im Out-of-Sample Setup (mittlerer NSE < 0,7, d. h. niedriger als ein globales Modell ohne Entitätsinformationen) dass das Modell räumlich nicht gut generalisieren kann. Der Grund dafür liegt möglicherweise in einer zu geringen Datenmenge. Gleichzeitig liegt die Performance der Zufallszahl-Modelle sowohl In-Sample als auch Out-of-Sample gleichauf mit den Environmental bzw. Timeseries Features Modellen. Daraus kann der Schluss gezogen werden, dass keine echte Entity Awareness vorliegt, sondern die Charakteristika lediglich als eindeutige Identifikatoren fungieren. Es bedarf also noch weiterer Forschung, um aussagekräftigere statische Input-Features zu finden, mit denen Entity Awareness erreicht werden kann.

 


10:45am - 11:00am
ID: 318 / Thema 22: 2
Oral presentation
Topics: 22. Künstliche Intelligenz und Machine Learning in der Grundwasserforschung

Entwicklung eines globalen Modells für kurzfristige Grundwasserstandsvorhersagen unter Anwendung des Temporal Fusion Transformers

Alexander Schulz2, Stefan Kunz1, Maximilian Nölscher1, Maria Wetzel1, Stefan Broda1, Felix Biessmann2

1Bundesanstalt für Geowissenschaften und Rohstoffe, Deutschland; 2Berliner Hochschule für Technik (BHT)

Für die Vorhersage von Grundwasserständen werden zunehmend Ansätze des maschinellen Lernens eingesetzt. Dabei ist die Entwicklung eines Modells für eine einzelne Messstelle derzeit Stand der Technik (lokales Modell). Eine hohe Prognosegüte kann mit lokalen Modellen erreicht werden, jedoch ist die Übertragung auf eine Vielzahl von Messstellen mit diesem Ansatz nicht möglich. Globale Modelle erlauben hingegen das Training und die Vorhersage an mehreren Messstellen gleichzeitig. Mit dieser Modellklasse können dynamische (z.B. meteorologische Eingangsgrößen) und statische (z.B. hydro(geo)logische Standorteigenschaften) Variablen für die Grundwasserstandsvorhersage berücksichtig werden. So können globale Modellansätze, insbesondere bei großen Trainingsdatensätzen, verlässliche Vorhersagen an Messstellen liefern, die ähnliche Standorteigenschaften aufweisen wie die im Training verwendeten Messstellen (Generalisierung). Zusätzlich bieten sie rechentechnische Skalierungsvorteile, da nur ein Modell trainiert und für ein größeres Gebiet angewendet werden muss.

In diesem Beitrag wird ein globales Modell für die kurzfristige Vorhersage (bis zu 12 Wochen) von Grundwasserständen vorgestellt. Dazu wurde der Temporal Fusion Transformer (TFT) verwendet, bei dem rekurrente neuronale Netze mit einem sogenannten Attention-Mechanismus kombiniert werden. Modellansätze, die auf dem TFT basieren, bieten zusätzlich die Möglichkeit, die Bedeutung einzelner Eingangsgrößen für die Modellvorhersage zu erfassen.

Der von uns verwendete Datensatz umfasst ca. 9900 Messstellen aus ganz Deutschland mit Grundwasserständen von 1990 bis 2016 (ca. 8 Millionen Messwerte). Neben den Grundwasserständen wurden für jede Messstelle Variablen abgeleitet, die einen relevanten Einfluss auf den Grundwasserstand haben. Als Modelleingangsgrößen dienten meteorologische (z.B. Niederschlag, Temperatur), hydrogeologische (z.B. Grundwasserneubildung), bodenkundliche (z.B. Bodentextur) und räumliche Variablen (z.B. Entfernung zum nächsten Fließgewässer). Mit Hilfe der aus den TFT-Modellen berechneten Variablengewichte und dem Eliminieren verschiedener Eingangsgrößen wurde zusätzlich überprüft, welche Eingangsvariablen für die Vorhersage von Grundwasserständen geeignet sind und welche zu keiner Verbesserung der Vorhersagen führen.

Über alle 2500 Testmessstellen hinweg konnte mit dem TFT ein Median NSE von 0.56 für die 12-Wochen-Vorhersage erreicht werden, wobei etwa 30 % der Testmessstellen einen NSE von über 0.7 für die 12-Wochen Vorhersage aufwiesen. Die Analysen haben weiterhin ergeben, dass wichtige Eingangsgrößen für die Prognosegüte des globalen Modells neben den historischen Grundwasserständen und dem Niederschlag auch die Standardabweichung der Grundwasserstände der jeweiligen Messstellen sowie der hydrogeologische Großraum sind.

 


11:00am - 11:15am
ID: 238 / Thema 22: 3
Oral presentation
Topics: 22. Künstliche Intelligenz und Machine Learning in der Grundwasserforschung
Keywords: 20

ML-basierte Ersatzmodelle in der Kalibrierung und Unsicherheitsberechnung aufwändiger Modelle der gesättigt-ungesättigten Untergrundströmung

Olaf Cirpka1, Jonas Allgeier2

1Universität Tübingen, Deutschland; 2BoSS Consult GmbH, Stuttgart, Deutschland

Physikalisch basierte Modelle der variable gesättigten Untergrundströmung, beruhend auf der Richards-Gleichung, sind rechnerische sehr aufwändig und erfordern viele Parameter. Dies schränkt die Anwendung traditioneller Ensemble-basierter Methoden für die Konditionierung der Parameter durch Messungen (stochastische Kalibrierung) ein. Wir überwinden die damit verbundenen Probleme durch den Einsatz von Ersatzmodellen, die Methoden des maschinellen Lernens verwenden. Hierbei kommen gegenwärtig Gaußsche Regressionsmodelle (GPR) und eine logistische Parametertransformation zum Einsatz. Mit einer Anfangsprobe von 120 physikalisch-basierten Modellläufen starten wir ein Ersatzmodell-unterstütztes Kalibrierungsverfahren. In jedem Zyklus untergehen das/die Ersatzmodell(e) einer neuen Kalibrierung, werden 10000 Perturbationen existierender Parametersätze des vollständigen Modells vorgeschlagen und hiervon 39 Punkte im Parameterraum mittels des/r Ersatzmodells/e ausgewählt, die mit 11 weiteren Punkten aus einer Halton-Sequenz ergänzt werden, sodass schließlich 50 neue Parameterkombinationen für physikalisch-basierte Modellläufe bestehen, die auf einem Computercluster parallel durchgerechnet werden.

Beim Vorschlag der Perturbationen werden Plausibilitätskriterien (z.B. die Richtung der Grundwasserströmung an Festpotenzialrändern) verwendet, für die ebenfalls GPR-basierte Ersatzmodelle aufgestellt werden. Neue Punkte im Parameterraum werden generiert, in dem die bestehenden Läufe des vollständigen Modells bezüglich Ihrer Fähigkeit, die Messdaten zu reproduzieren, gereiht werden. Je besser die Performance, umso wahrscheinlicher wird dieser Parametersatz als Startpunkt für eine Perturbation ausgewählt. Die Perturbation beinhaltet eine zufällige Schrittweite und eine zufällige Richtung im Parameterraum, wobei die Richtung des stärksten Abfalls der Zielwertfunktion berücksichtigt wird. Die vorgeschlagenen Punkte werden dann bezüglich eines kombinierten Kriteriums sortiert, das die vom Ersatzmodell prognostizierte Verbesserung der Zielwertfunktion und den Abstand zu bestehenden Punkten im Parameterraum berücksichtigt.

Diese Ersatzmodell-unterstützte globale Methode der Parameterschätzung führt zu einem Ensemble von vollständigen Modellläufen, die den gesamten plausiblen Parameterraum erfüllt und in der Nähe der identifizierten Optima eine höhere Dichte aufweist. Dies ist eine gute Grundlage die Abschätzung der konditionierten Parameterverteilung mittels Markov-Chain Monte-Carlo (MCMC) Simulationen unter Verwendung des/r Ersatzmodells/e.

Wir haben verschiedene Varianten dieses Verfahrens (z.B. ein Ersatzmodell je Messung versus ein Ersatzmodell für die Zielwertfunktion der Kalibrierung) anhand eines 3D variable-gesättigten Modells der stationären Untergrundströmung (24 Parameter, 51 Beobachtungen der Grundwasserstände, 5 Plausibilitätskriterien) in einem Untersuchungsgebiet in der Nähe von Tübingen getestet. Das Verfahren wurde auch mit dem Neural Posterior Estimation (NPE) Schema verglichen, in dem Modelläufe mit Parameterrealisationen aus der a-priori Verteilung verwendet werden, um ein neuronales Netzwerk zu trainieren, das die Modellparameter in Bezug zu Koeffizienten der a-posteriori Verteilung setzt. Während die geschätzten konditionierten Parameterverteilungen ähnliche Muster aufwiesen, reproduzierten Proben aus der NPE-basierten Verteilung die Messdaten schlechter als unser GPR-basierter MCMC-Ansatz.


Cirpka-ML-basierte Ersatzmodelle in der Kalibrierung und Unsicherheitsberechnung aufwändiger Modelle der .jpg


11:15am - 11:30am
ID: 162 / Thema 22: 4
Oral presentation
Topics: 22. Künstliche Intelligenz und Machine Learning in der Grundwasserforschung

Prognose von Grabenstrukturen mittels Random Forest

Jost Wessels, Mithra-Christin Hajati, Jörg Elbracht

Landesamt für Bergbau, Energie und Geologie (LBEG) Niedersachsen, Stilleweg 2, 30655 Hannover

Die künstliche Entwässerung in Niedersachsen, insbesondere von landwirtschaftlich genutzten Flächen, stellt einen wichtigen Einflussfaktor für den Boden- und Landschaftswasserhaushalt dar (Ertl et al. 2019, Gehrt et al. 2019). Neben den positiven Auswirkungen wie beispielsweise einer besseren Befahrbarkeit im Frühjahr und einer verbesserten Ertragsfähigkeit ansonsten vernässter Böden können Drainagesysteme auch zu veränderten Spitzenabflüssen bzw. Hochwassergefahren führen (Agroscope 2018). Des Weiteren wird die Grundwasserneubildung durch künstliche Entwässerung reduziert. Durch die Anlage von Drainageleitungen und/oder Entwässerungsgräben wird Sickerwasser zum Teil bereits vor dem Erreichen des Grundwassers in die Vorflut abgeführt und steht somit nicht mehr für die Bildung von neuem Grundwasser zur Verfügung (Gehrt et al. 2019). Zudem kann auch bereits vorhandenes Grundwasser durch künstliche Entwässerungsmaßnahmen drainiert werden. Dies ist in Niedersachsen vor allem in Niederungsbereichen der Fall, wenn die Grundwasseroberfläche in den Bereich der Drainageleitungen bzw. Gräben ansteigt. In der Bilanz kann somit teilweise nicht nur im Sommer, sondern ganzjährig eine negative Grundwasserneubildung, d.h. Grundwasserzehrung stattfinden (Ertl et al. 2019).

Im Teilprojekt „KliBoG1“, welches am Landesamt für Bergbau, Energie und Geologie (LBEG) angesiedelt ist und durch das Niedersächsische Kompetenzzentrum Klimawandel (NIKO) gefördert wird, soll unter anderem die Datenbasis zu künstlich entwässerten Flächen für die Modellierung der Grundwasserneubildung verbessert werden. In einem ersten Schritt werden vorhandene Entwässerungsgräben, welche bislang nicht systematisch erfasst bzw. kartiert wurden, aus dem Digitalen Geländemodell (DGM1) halbautomatisiert abgeleitet. Als Prognosemodell kommt hierbei ein binäres Klassifikationsverfahren auf Basis des Random-Forest-Algorithmus zum Einsatz, welches für die einzelnen Rasterzellen eines betrachteten Gebietes mögliche Grabenstrukturen ausweist.

Im Vorfeld der Modellierung werden zunächst für kleinere Trainings- und Testgebiete die vorhandenen Grabenstrukturen anhand von vorliegenden Gewässernetzen sowie von Luftbildern und dem DGM1 möglichst exakt digitalisiert und an das Raster des DGM1 angepasst (Abb. 1a). Anschließend werden verschiedene Terrain-Indices, z.B. zur Ermittlung lokaler Vertiefungen (difference from mean elevation, DME, Abb. 1b) oder der kleinräumigen „Offenheit“ des Geländes (Openness, OPN, Abb. 1c) berechnet. Anhand der digitalisierten Gräben und der ermittelten Terrainindices werden Trainingsdatensätze für das Prognosemodell erstellt. Bei der Anwendung des Modells auf ein Testgebiet wird zunächst die Wahrscheinlichkeit der Zugehörigkeit zu einer Grabenstruktur für jede Rasterzelle ausgewiesen (Abb. 1d). Anschließend werden die Ergebnisse mittels verschiedener Auswahlkriterien und Filter nachprozessiert bzw. bereinigt (Abb. 1e), so dass eine möglichst gute Prognose der tatsächlich vorhandenen Grabenstrukturen im Testgebiet entsteht (Abb. 1f).

Durch die Methodik können bereits bekannte Gräben in ihrer Lage überprüft und Informationen über bislang nicht kartierte Entwässerungsstrukturen gewonnen werden.


Wessels-Prognose von Grabenstrukturen mittels Random Forest-162.png


11:30am - 11:45am
ID: 189 / Thema 22: 5
Oral presentation
Topics: 22. Künstliche Intelligenz und Machine Learning in der Grundwasserforschung

Die Eignung von Modellen des maschinellen Lernens für die gekoppelte Vorhersage von Grundwasserständen und Grundwasserversalzung

Fabienne Doll1, Stefan Broda2, Benedikt Heudorfer1, Stefan Kunz2, Martin Thullner2, Maria Wetzel2, Tanja Liesch1

1Karlsruher Institut für Technologie, Deutschland; 2Bundesanstalt für Geowissenschaften und Rohstoffe

Besonders in Gebieten die von geogener Grundwasserversalzung betroffen sind, ist die zukünftige Entwicklung der Grundwasserstände von großer Bedeutung, da ein Absinken der Grundwasserstände zur Verschärfung der Versalzungsproblematik führen kann. Zunehmender Wasserbedarf und verminderte Grundwasserneubildung können in Gebieten mit salinarem Tiefenwasseraufstieg, zur Anhebung der Süß-/Salzwassergrenze führen. In Küstennähe sorgen steigende Meeresspiegel für eine Verschärfung der Versalzungsproblematik durch Meerwasserintrusion. Ein angepasstes Grundwassermanagement wird angesichts des Klimawandels immer bedeutender werden. Um die nachhaltige Nutzung der Grundwasserressourcen zu gewährleisten, werden Werkzeuge benötigt, welche die entsprechenden Entscheidungsgrundlagen liefern. Eine Möglichkeit hierzu könnten Modelle des maschinellen Lernens sein, welche die zukünftige Entwicklung von Grundwasserständen und Versalzung vorhersagen.

Der Einsatz von maschinellen Lernmodellen für die single-target Vorhersage von Grundwasserständen ist seit einigen Jahren Gegenstand in der Wissenschaft. Nach Kenntnis der Autoren wurden bisher jedoch noch keine maschinellen Lernmodelle für die gekoppelte Vorhersage von Grundwasserständen und Versalzung entwickelt. Unser neuentwickelter konzeptioneller Ansatz für die gekoppelte Grundwasserstands- und Versalzungsvorhersage basiert darauf, dass die Versalzungsproblematik maßgeblich durch die Entwicklung der Grundwasserstände beeinflusst wird.

Mithilfe unserer Modelle wird in Schritt 1 zunächst der Grundwasserstand vorhergesagt. In Schritt 2 dient der vorhergesagte Grundwasserstand als Input zur Vorhersage der elektrischen Leitfähigkeit (als Proxy/Indikator für die Versalzung). Weitere Inputs für die Vorhersagen (in beiden Schritten) sind beispielsweise meteorologische Größen (Niederschlag, Temperatur) oder auch Meeresspiegel und Förderdaten aus nahe gelegenen Förderbrunnen.

Das Ziel unserer Untersuchungen ist es, die Eignung der Modelle für die Vorhersage von Grundwasserständen und Versalzung zu analysieren. Außerdem sollen die Untersuchungen eine Einschätzung zulassen, inwiefern sich die vorhandenen Grundwassermonitoringdaten zur Modellierung mit Methoden des maschinellen Lernens verwenden lassen. Zusätzlich wollen wir überprüfen, ob die Modelle auch für die gekoppelte Vorhersage von anderen hydro(geo)logischen Parametern eingesetzt werden können. Ein weiterer Einsatzbereich wäre beispielsweise die simultane Vorhersage von Flusspegeln und flussnahen Grundwasserständen.

 


11:45am - 12:00pm
ID: 148 / Thema 22: 6
Oral presentation
Topics: 22. Künstliche Intelligenz und Machine Learning in der Grundwasserforschung

Bestimmung der Anhydrit- und Gipslöslichkeit durch neuronale Netze für die Modellierung gekoppelter Prozesse beim Quellen von Ton-Sulfat-Gestein

Reza Taherdangkoo, Christoph Butscher

TU Bergakademie Freiberg (TUBAF), Ingenieurgeologie und Umweltgeotechnik, Deutschland

Das Quellen von Ton-Sulfat-Gesteinen ist ein gefürchtetes Phänomen, das den Erfolg geotechnischer Projekte im Tunnel-, Straßen- und Brückenbau sowie bei Geothermiebohrungen gefährden kann. Die Ursachen für das Quellen sind das physikalische Quellen des Tons in Kombination mit dem chemischen Quellen durch die Umwandlung von Anhydrit (CaSO4) in Gips (CaSO4•2H2O). Letzteres geschieht durch die Auflösung von Anhydrit und die anschließende Ausfällung von Gips, wobei eine Volumenzunahme von rund 60 % stattfindet. In unserer Arbeit verwenden wir Feed-Forward Neural Networks (FFNN) und Cascade-Forward Neural Networks (CFNN), die mit Levenberg-Marquardt (LM) und Bayesian Regularization (BR) Algorithmen trainiert wurden, um die Löslichkeit von Anhydrit und Gips in der wässrigen Phase zu bestimmen. Die Modelle basieren auf experimentellen Daten zur Sulfatlöslichkeit aus der Literatur. Der kompilierte Datensatz enthält die Löslichkeiten von Calciumsulfat aus 25 Publikationen und enthält insgesamt 1.912 experimentelle Datenpunkte. Er deckt einen großen Bereich von Temperatur- und Druckbedingungen sowie verschiedene pH-Werte und Ionenkonzentrationen im Formationswasser ab. Eine zufällige Stichprobe von 1.532 Datenpunkten (80 %) wurde für die Trainingsphase verwendet, die restlichen Daten wurden für die Analyse der Zuverlässigkeit und Robustheit der Netzwerkmodelle verwendet. Unsere Ergebnisse zeigen, dass das FFNN-BR-Modell das genaueste Modell für die Regressionsaufgabe ist (R2 = 0,97 %). Ein Vergleich mit dem Pitzer-Ionen-Interaktionsmodell und anderen publizierten datenbasierten Modellen zeigt, dass das FFNN-BR Modell die Löslichkeit der Sulfate auch in sauren und salzhaltigen Lösungen sehr genau bestimmt und als alternatives Werkzeug zur Bestimmung der Löslichkeit von Anhydrit und Gips verwendet werden kann. In einem nächsten Schritt soll das datenbasierte Modell in eine numerische Modellierung gekoppelter Prozesse integriert werden, um die enormen Rechenzeiten einer komplexen thermo-hydro-mechanisch-chemischen (THMC) Modellierung von Quellprozessen in Ton-Sulfat-Gesteinen für geotechnische Projekte effektiv zu verkürzen.

Abbildung: Experimentell bestimmte versus mit dem FFNN-BR Modell vorhergesagte Sulfatlöslichkeit. Das Bestimmtheitsmaß der Regression (R²) ist 0,97 %.


Taherdangkoo-Bestimmung der Anhydrit- und Gipslöslichkeit durch neuronale Netze für die Modellierung g.jpg