Veranstaltungsprogramm
Sitzung | ||
S11: GenKI in Physikunterricht und -lehrerbildung
| ||
Präsentationen | ||
GenKI in Physikunterricht und -lehrerbildung Zusammenfassung Die rasante Entwicklung und zunehmende Verfügbarkeit generativer Künstlicher Intelligenz (KI), insbesondere großer Sprachmodelle (LLMs), stellt das Bildungswesen vor transformative Chancen und tiefgreifende Herausforderungen. Durch neue multimodale Sprachmodelle (MLLMs) wie GPT-4o werden nun multimediale Dateiformate interpretier- und generierbar. Diese KI-Systeme unterstützen Lernende individuell beim Verstehen komplexer Daten, bei der Visualisierung und bei wissenschaftlichen Argumentationen. Modalitätsübergreifendes Arbeiten kann dabei die kognitive Belastung moderieren. Der Diskutant fasst die Kernerkenntnisse der Vorträgen dieses Symposiums – (1) "LLM-basierte Anwendungen in der Lehrkräftebildung", (2) "Virtuelles und experimentelles forschendes Lernen mit generativer KI" und (3) "AI Alignment im Bildungskontext: Analyse von Preprompting-Strategien von Lehrkräften beim Einsatz großer Sprachmodelle am Beispiel adaptiven Feedbacks" – zusammen und führt eine leitfragengestützte Diskussion über zentrale Hürden und Gelingensbedingungen für eine verantwortungsvolle und effektive Integration dieser Technologien in Bildungskontexte. Folgende Aspekte werden basierend auf Impulsen der Vorträge kritisch beleuchtet: 1. Ethische Aspekte: Die Diskussion greift die Notwendigkeit einer klaren Verantwortungszuschreibung auf, wie sie auch im AI Act der Europäischen Union adressiert wird, und erweitert diese zur Idee einer "Multiactor Responsibility". Dies betrifft Entwickler, Bildungsinstitutionen, Lehrende und Lernende gleichermaßen. Wie Beitrag 1 durch die Rückmeldungen von Lehrkräften zu Datenschutzbedenken andeutet und Beitrag 3 durch die Analyse von Preprompting-Strategien zur Steuerung von KI-Verhalten illustriert, ist die Sensibilisierung und Kompetenzentwicklung aller Akteure entscheidend. Eng damit verbunden ist der Umgang mit ungewolltem KI-Verhalten, wie falschen Ausgaben oder der Reproduktion von Biases. 2. AI Alignment – Anpassung an menschliche Werte: Angelehnt an den dritten Vortrag wird die Bedeutung des AI Alignments, also der Anpassung von KI-Systemen an menschliche Werte und pädagogische Zielsetzungen, aufgegriffen und übergreifende diskutiert. Die dort untersuchten Strategien von Lehrkräften sind ein praktischer Ansatz, um dieses Alignment im Bildungskontext zu operationalisieren, beispielsweise um adaptives Feedback didaktisch sinnvoll zu gestalten. Die Diskussion wird der Frage nachgehen, wie solche Alignment-Prozesse systematisiert und skaliert werden können, insbesondere angesichts der Heterogenität von Lernenden und der Gefahr adversarieller Nutzungsstrategien. 3. Optimierung von Learning Analytics: Personalisierung wann, für wen, was? Generative KI bietet neue Potenziale für die Personalisierung von Lernprozessen, wie durch individualisiertes Feedback (Beitrag 3) oder die Bereitstellung schneller Antworten (Beitrag 1). Die Diskussion wird kritisch hinterfragen, unter welchen Bedingungen Personalisierung durch KI lernförderlich ist, welche Daten dafür genutzt werden dürfen und sollen, und wie sichergestellt werden kann, dass Personalisierung nicht zu neuen Formen der Ungleichheit führt oder die Entwicklung überfachlicher Kompetenzen vernachlässigt. 4. Reduktion kognitiver Aktivität: Die Gefahr, dass der einfache Zugang zu KI-generierten Inhalten zu einer Reduktion der kognitiven Aktivierung und Anstrengung und des kritischen Denkens bei Lernenden führt, wird thematisiert. Es wird diskutiert, wie pädagogische Konzepte und Aufgabenstellungen aussehen müssen, um KI als Werkzeug zur Vertiefung des Verständnisses und zur Förderung höherer Denkfähigkeiten einzusetzen, anstatt als bloßen Antwortgenerator. Dies knüpft an die Notwendigkeit an, KI-Kompetenz bei Lernenden zu fördern (Beitrag 1) und den Einsatz von KI im Sinne eines anspruchsvollen, forschenden Lernens (Beitrag 2) zu gestalten. 5. Herausforderungen und Kompetenzen von Lernenden (und Lehrenden): Alle drei Vorträge berühren direkt oder indirekt die Notwendigkeit neuer Kompetenzen – einer AI Literacy, welche auch auf europäischer Ebene konzeptualisiert wurde und hier diskutiert wird. Beitrag 1 betont explizit den Bedarf an Fortbildungen für Lehrkräfte zur Nutzung von LLMs, aber auch die Notwendigkeit der Förderung von KI-Kompetenz bei Lernenden. Beitrag 3 zeigt, dass Lehrkräfte spezifische Kompetenzen im Preprompting benötigen, um KI-Systeme effektiv zu steuern. Die Diskussion wird die Frage aufwerfen, welche spezifischen Kompetenzen (z.B. kritisches Bewerten von KI-Outputs, ethische Reflexionsfähigkeit, Prompt Engineering) für Lernende und Lehrende im Zeitalter generativer KI zentral sind und wie diese curricular verankert und gefördert werden können, insbesondere im Hinblick auf komplexe Anwendungen wie das virtuelle und experimentelle forschende Lernen (Beitrag 2). Literaturverzeichnis Dempere, J., Modugu, K., Hesham, A., & Ramasamy, L. K. (2023). The impact of ChatGPT on higher education. Frontiers in Education, 8. https://doi.org/10.3389/feduc.2023.1206936 Deng, J., & Lin, Y. (2023). The Benefits and Challenges of ChatGPT: An Overview. Frontiers in Computing and Intelligent Systems, 2(2), 81–83. https://doi.org/10.54097/fcis.v2i2.4465 Kabudi, T., Pappas, I., & Olsen, D. H. (2021). AI-enabled adaptive learning systems: A systematic mapping of the literature. Computers and Education: Artificial Intelligence, 2, 100017. https://doi.org/10.1016/j.caeai.2021.100017 Kasneci, E., Sessler, K., Küchemann, S., Bannert, M., Dementieva, D., Fischer, F., Gasser, U., Groh, G., Günnemann, S., Hüllermeier, E., Krusche, S., Kutyniok, G., Michaeli, T., Nerdel, C., Pfeffer, J., Poquet, O., Sailer, M., Schmidt, A., Seidel, T., … Kasneci, G. (2023). ChatGPT for good? On opportunities and challenges of large language models for education. Learning and Individual Differences, 103, 102274. https://doi.org/10.1016/j.lindif.2023.102274 Küchemann, S., Steinert, S., Revenga, N., Schweinberger, M., Dinc, Y., Avila, K. E., & Kuhn, J. (2023). Can ChatGPT support prospective teachers in physics task development? Physical Review Physics Education Research, 19(2). https://doi.org/10.1103/physrevphyseducres.19.020128 Milano, S., McGrane, J. A., & Leonelli, S. (2023). Large language models challenge the future of higher education. Nature Machine Intelligence, 5(4), 333–334. https://doi.org/10.1038/s42256-023-00644-2 Namoun, A., & Alshanqiti, A. (2021). Predicting Student Performance Using Data Mining and Learning Analytics Techniques: A Systematic Literature Review. Applied Sciences, 11(1), Article 1. https://doi.org/10.3390/app11010237 Ng, D. T. K., Su, J., Leung, J. K. L., & Chu, S. K. W. (2023). Artificial intelligence (AI) literacy education in secondary schools: a review. Interactive Learning Environments, 1–21. https://doi.org/10.1080/10494820.2023.2255228 Sanusi, I. T., Oyelere, S. S., Vartiainen, H., Suhonen, J., & Tukiainen, M. (2022). A systematic review of teaching and learning machine learning in K-12 education. Education and Information Technologies, 28(5), 5967–5997. https://doi.org/10.1007/s10639-022-11416-7 Steinert, S., Avila, K. E., Ruzika, S., Kuhn, J., & Küchemann, S. (2023). Harnessing Large Language Models to Enhance Self-Regulated Learning via Formative Feedback. ArXiv. https://arxiv.org/pdf/2311.13984 Küchemann, S., Avila, K.E., Dinc, Y. et al. On opportunities and challenges of large multimodal foundation models in education. npj Sci. Learn. 10, 11 (2025). https://doi.org/10.1038/s41539-025-00301-w Kasneci, E., Sessler, K., Küchemann, S., Bannert, M., Dementieva, D., Fischer, F., … Kasneci, G. (2023). ChatGPT for good? On opportunities and challenges of large language models for education. Learning and Individual Differences, 103, 102274. doi:10.1016/j.lindif.2023.102274 Vogt, P., Sander, P., Küchemann, S., & Kuhn, J. (05 2025). iPhysicsLabs meets AI@TPT: Analysis of the acceleration of a car using ChatGPT. The Physics Teacher, 63, 390–391. doi:10.1119/5.0268097 Kuhn J, Vogt P 2013 Smartphones as experimental tools: different methods to determine the gravitational acceleration in classroom physics by using everyday devices Eur. J. Phys. Edu. 4 16–27 Yossi Ben-Zion, Roi Einhorn Zarzecki, Joshua Glazer, & Noah D. Finkelstein. (2024). Leveraging AI for Rapid Generation of Physics Simulations in Education: Building Your Own Virtual Lab. Bauer, E., Greiff, S., Graesser, A. C., Scheiter, K., & Sailer, M. (2025). Looking Beyond the Hype: Understanding the Effects of AI on Learning. Educational Psychology Review, 37(2), 45. Chin, H., & Yi, M. Y. (2019, May). Should an agent be ignoring it? A study of verbal abuse types and conversational agents' response styles. In Extended Abstracts of the 2019 CHI Conference on Human Factors in Computing Systems (pp. 1-6). Gabriel, I. (2020). Artificial intelligence, values, and alignment. Minds and machines, 30(3), 411-437. Ji, J., Qiu, T., Chen, B., Zhang, B., Lou, H., Wang, K., ... & Gao, W. (2023). Ai alignment: A comprehensive survey. arXiv preprint arXiv:2310.19852. Küchemann, S., Avila, K. E., Dinc, Y., Hortmann, C., Revenga, N., Ruf, V., ... & Kuhn, J. (2025). On opportunities and challenges of large multimodal foundation models in education. npj Science of Learning, 10(1), 11. Odden, T. O. B., Tyseng, H., Mjaaland, J. T., Kreutzer, M. F., Malthe-Sørenssen, A. (2024). Using text embeddings for deductive qualitative research at scale in physics education. Physical Review Physics Education Research. 20, 020151. Steinert, S., Avila, K. E., Ruzika, S., Kuhn, J., & Küchemann, S. (2023). Harnessing large language models to enhance self-regulated learning via formative feedback. arXiv preprint arXiv:2311.13984. Wang, J., & Fan, W. (2025). The effect of ChatGPT on students’ learning performance, learning perception, and higher-order thinking: insights from a meta-analysis. Humanities and Social Sciences Communications, 12(1), 1-21. Zhang, H., Guo, Z., Zhu, H., Cao, B., Lin, L., Jia, J., ... & Wu, D. (2023). On the safety of open-sourced large language models: Does alignment really prevent them from being misused?. arXiv preprint arXiv:2310.01581. Beiträge des Symposiums LLM-basierte Anwendungen in der Lehrkräftebildung Digitale Technologien, wie beispielsweise künstliche Intelligenz (KI), spielen in der Bildung eine immer größer werdende Rolle (Namoun & Alshanqiti, 2021). Allerdings werden sie in Lehrerfortbildungen häufig noch nicht ausreichend berücksichtigt (Sanusi et al., 2023). KI-Anwendungen, beispielsweise basierend auf großen Sprachmodellen (Large Language Models; LLMs) wie ChatGPT (Deng & Lin, 2022), zählen ebenfalls zu digitalen Technologien. KI-basierte Anwendungen und Lernsysteme werden aktuell stark weiterentwickelt und durch ihre große Reichweite und vielseitige Anwendungsmöglichkeiten relevanter für Bildungseinrichtungen (Kabudi et al., 2021). Besonders ChatGPT kann hier einen großen Einfluss haben (Dempere et al., 2023). Für eine erfolgreiche Einbindung von Sprachmodelle in die Bildung gibt es viele Herausforderungen (Milano et al., 2023), aber auch viele Vorteile (Kasneci et al., 2023): LLMs können nicht nur für Lernende ¬ unter Einbeziehung ihrer KI-Kompetenz (Ng et al., 2023) hilfreich sein, beispielsweise durch die Bereitstellung schneller Antworten, sondern sie können auch Lehrkräfte unterstützen, zum Beispiel bei der Erstellung von Aufgaben (Küchemann et al., 2023). Daher ist das Auseinandersetzen mit KI-basierten Technologien und den Möglichkeiten, Grenzen und Risiken ihrer Anwendung für Lehrkräfte wichtig. Dieser Beitrag stellt eine Fortbildung zur Nutzung von LLMs für Lehrkräfte vor, wobei sowohl KI-Anwendungen zur Förderung von Lernenden als auch KI-Anwendungen zur Unterstützung von Lehrkräften berücksichtigt werden. Hierbei werden die Herausforderungen sowohl für Lernende als auch für Lehrkräfte diskutiert. Die Fortbildung startet mit einer Einführung in die Grundlagen von KI; anschließend werden KI-Anwendungen für Lernende und ihr sinnvoller Einsatz im Unterricht besprochen. Die nächste Phase behandelt den Einsatz von KI-Anwendungen zur Unterstützung in der Lehre, beispielsweise bei der Erstellung von Aufgaben. Für beide Anwendungsmöglichkeiten gibt es Arbeitsphasen, in denen die Teilnehemer:innen die besprochenen Inhalte ausprobieren können. Während erster Pilotierungen der Fortbildung im Rahmen von drei Nachmittagsseminaren wurden Rückmeldungen von 52 Lehrkräften mittels eines anonymen Fragebogens gesammelt. Ein Großteil der Teilnehmer:innen hält den Einsatz von KI-Anwendung in ihrem Unterricht für nützlich, wobei die Bereiche Datenschutz der Anwendungen und Bereitstellung der Technik – beispielsweise bei Geräten und Internet noch verbessert werden könnten. Die Vorstellung vorhandener KI-Anwendungen, bestenfalls kostenlos, und die Diskussion konkreter Einsatzmöglichkeiten im Unterricht wurde von den Teilnehemer:innen während der Fortbildung als besonders wichtig eingeschätzt. Diese Ergebnisse zeigen, dass Lehrkräfte Weiterbildungsmöglichkeiten im Bereich KI sehr schätzen. Im Hinblick auf die wachsende Anzahl von KI-basierten Lernsystemen (Namoun & Alshanqiti, 2021; Kabudi et al., 2021) und dem zunehmenden Einfluss von Sprachmodellen auf die Bildung (Dempere et al., 2023) ist ein Ausbau der Fortbildungsmöglichkeiten für Lehrkräfte daher besonders wichtig. Hierbei sollten die Nutzung von KI-Anwendungen, Möglichkeiten für deren Einbindung in den Unterricht, sowie deren Grenzen und Risiken berücksichtigt werden – jeweils aus den Perspektiven von Lernenden und Lehrenden Virtuelles und reales Experimentieren mit Generativer Künstlicher Intelligenz Mit dem Aufkommen leistungsstarker, multimodaler Large Language Models (LLMs), wie ChatGPT, ergeben sich in der Lehre neue Möglichkeiten, experimentelle Daten aufzubereiten und auszuwerten (Küchemann et al., 2024; Kasneci et al., 2023). Der Einsatz realer oder simulierter Messdaten im Physikunterricht eröffnet so ganz neue Zugänge zum Verständnis grundlegender Konzepte. Im ersten Teil stellen wir ein Mini-Labor vor, in dem Schülerinnen und Schüler mit dem Beschleunigungssensor ihres Smartphones alltagsnahe Kinematik-Experimente durchführen – zum Beispiel in einem Fahrstuhl. Die gewonnenen Daten werden automatisch ausgelesen und KI-gestützt in Zeit-Ort- und Zeit-Geschwindigkeit-Diagrammen dargestellt. Dabei identifizieren KI-gestützte Analysewerkzeuge Ausreißer, markieren Bewegungsabschnitte und machen physikalische Zusammenhänge unmittelbar sichtbar. Lernende können somit ohne große mathematische Kenntnisse quantitative Bestimmungen von Alltagsphänomenen durchführen. Dieser Ansatz verbindet die Vorteile von Smartphone-Experimenten (Kuhn & Vogt, 2013) mit modernen LLMs, wodurch eine umfangreiche Messwertanalyse und Dateninterpretation für SchülerInnen der Sekundarstufe zungänglich gemacht wird (Vogt et al., 2025). Im zweiten Teil führen wir ein systematisiertes Prompting-Template ein, mit dem Lehrpersonen und Forschende vollfunktionale, browserbasierte HTML-Simulationen vollständig per Sprachbefehl generieren lassen können, wie Yossi Ben-Zion et al. (2024) bereits gezeigt haben. Diese werden direkt im Browser geöffnet und liefern eine funktionsfähige Simulation, die sich ohne technische Hürden und spezielle Software nutzen lässt. Lehrkräfte erhalten damit eine niedrigschwellige Möglichkeit, KI-generierte Simulationen in ihren Unterricht zu integrieren – ganz ohne Programmierkenntnisse. Die Systematisierung des Prompts gliedert sich in fünf Bausteine: didaktischer Kontext, physikalische Modellierung, visuelle Gestaltung, Nutzerinteraktion und Datenexport. Anhand zweier Beispiele - radioaktiver Zerfall und vertikaler Wurf - demonstrieren wir, wie ein strukturierter Prompt in wenigen Schritten eine interaktive Simulation erzeugt, welche sich in digitale Lehr-Lern-Szenarien integriert und deren Simulationsdaten für weiterführende Analysen exportiert werden können. Durch geeignete Visualisierungstools schafft die Kombination aus realen und virtuellen Messdaten neue Möglichkeiten für forschend-entdeckendes Lernen. Schülerinnen und Schüler profitieren von der Authentizität eigener Experimente und von flexiblen, digital erzeugten Modellen, die physikalische Fragestellungen vielfältig beleuchten. Zusätzlich kann die KI als Lernassistenz dienen, indem sie Fragen beantwortet, bei Diagramminterpretationen unterstützt und bei der Erstellung eigener Experimente oder Simulationen hilft. Gleichzeitig eröffnet es die Möglichkeit, den reflektierten und bewussten Umgang mit KI im Unterricht zu thematisieren. AI Alignment im Bildungskontext: Analyse von Preprompting-Strategien von Lehrkräften beim Einsatz großer Sprachmodelle am Beispiel adaptiven Feedbacks Der Einsatz großer Sprachmodelle (LLMs) bietet neue Chancen zur Unterstützung von Lehr-Lernprozessen (Küchemann et al., 2025; Wang & Fang, 2025;), sofern ein didaktisch fundierter und legitimierter Einsatz erfolgt (Bauer et al., 2025) wie z.B. zur Bereitstellung von individualisiertem, formativem Feedback. Eine der Voraussetzungen für den erfolgreichen Einsatz solcher Systeme ist jedoch ein wirksames AI Alignment, die Anpassung des Systemverhaltens an menschliche Werte, Zielsetzungen und Kontexte (Qiu et al., 2023; Gabriel, 2020). Während derzeit für Sprachmodelle genutzte Alignment-Methoden wie Finetuning und Reinforcement Learning from Human Feedback (RLHF) ein generalisiertes Alignment erzeugen können, zeigen sich in Bildungskontexten spezifische Herausforderungen: die große Heterogenität der Lernenden (z.B. hinsichtlich Wissens, Motivation, kulturellem Hintergrund), die Möglichkeit feindlicher Nutzungsstrategien (z.B. Jailbreaks), sowie unvorhergesehene Effekte beim Einsatz in großem Maßstab. Eine Strategie, diesen Herausforderungen zu begegnen, ist der gezielte Einsatz von systematischem Preprompting durch Lehrkräfte, die den Sprachagenten durch selbstformulierte Instruktionen vor der Interaktion mit den Lernenden gesteuert. In diesem Beitrag untersuchen wir empirisch, wie Lehrkräfte dieses Preprompting in der Praxis gestalten. Hierzu analysieren wir Daten aus Fortbildungen, in denen über 150 Lehrkräfte eine Plattform zum formativen Feedback im naturwissenschaftlichen Unterricht (Steinert et al., 2023) erprobten. Die Plattform erlaubt es den Lehrkräften, eigene Preprompts zu schreiben, um die Interaktion des Chatbots mit Lernenden gemäß den eigenen didaktischen Zielsetzungen zu steuern. Dabei kam GPT-4turbo als generalisiert-aligntes Basismodell zum Einsatz. Die Lehrkräfte wurden instruiert, den Chatbot so zu konfigurieren, dass dieser – aus ihrer Sicht – möglichst hilfreiches Feedback an Lernende gibt. Zur Analyse der Preprompts nutzen wir eine neue Technik zur automatisierten deduktiven qualitativen Inhaltsanalyse (Odden et al., 2024), die für thematische Analysen konzipiert wurde. Wir extrahieren verhaltensbezogene Elemente der Preprompts, die in hochdimensionale Text-Embeddings transformiert und anhand ihrer Distanz zu durch zwei erfahrene Lehrkräfte manuell kodierten Referenzclustern verglichen werden. Die Ergebnisse zeigen unter anderem, dass einzelne Lehrkräfte ohne entsprechende Aufforderung spontan adversariale Prompting-Strategien einsetzten, um etwa bewusst unfreundliches oder herablassendes Feedback zu provozieren. Solche Verhaltensweisen stellen spezifische Herausforderungen (z.B. Chin & Yi, 2019) für das Alignment unter Praxisbedingungen dar. Ergänzend vergleichen wir die Preprompting-Strategien der Lehrkräfte in den kontrollierten Fortbildungsumgebungen (n ≈ 150) mit einer zweiten Kohorte von ca. 800 Lehrkräften, die das System produktiv im Unterricht einsetzten. Die Ergebnisse geben Aufschluss über das tatsächliche Steuerungsverhalten von Lehrkräften im Umgang mit KI-basierten Lernsystemen und beleuchten die praktischen Grenzen und Anforderungen von AI Alignment in schulischen Lehr-Lernprozessen. Abschließend diskutieren wir Implikationen für die Gestaltung von Lernplattformen, Fortbildungskonzepten und zukünftigen Alignment-Strategien für Sprachmodelle im Bildungsbereich. |