Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
 
Sitzungsübersicht
Sitzung
E02: Schreiben mit KI und digitalen Tools
Zeit:
Montag, 29.09.2025:
11:15 - 12:45

Chair der Sitzung: Christiane Kallenbach
Ort: S16

Seminarraum 1. Obergeschoss

Zeige Hilfe zu 'Vergrößern oder verkleinern Sie den Text der Zusammenfassung' an
Präsentationen

Quo vadis, Schreibdidaktik? Potentiale, Grenzen und Risiken von Künstlicher Intelligenz beim Schreiben argumentativer Texte im Englischunterricht

Andreas von Reppert

Freie Universität Berlin, Didaktik des Englischen, Abteilung Prof. Sambanis

Zusammenfassung

Der geplante Beitrag beleuchtet einerseits theoretische Überlegungen zur Rolle von KI in der

Schreibdidaktik des Englischen und gibt andererseits erste Einblicke in eine Studie, die den

Einsatz von KI-Systemen beim Schreiben argumentativer Texte von Englischlernenden in der

Sekundarstufe analysiert und aufzeigt, welche didaktischen Implikationen daraus hervorgehen.

Im Zentrum des Beitrags stehen zwei miteinander verknüpfte Fragestellungen:

1) Welche didaktischen Anforderungen ergeben sich durch den Einsatz von KI beim Schreiben

englischer Texte?

2) Welche schreibdidaktischen und technologischen Strategien sind erforderlich, um einen

potentiell lernförderlichen Einsatz von KI in Schreibprozessen zu ermöglichen?

Die rasante Entwicklung generativer KI-Systeme wie ChatGPT, DeepL Write oder Grammarly

stellt die Fremdsprachendidaktik vor neue Herausforderungen und eröffnet zugleich innovative

Wege des Lehrens und Lernens. Der Beitrag gewährt Einblicke in ein laufendes

Dissertationsprojekt, in dem untersucht wird, wie der gezielte Einsatz von KI-basierter

Textplanung, -produktion und -überarbeitung die Schreibprozesse von Lernenden verändert.

Ziel ist es, zu ermitteln, welche didaktischen Strategien Lehrende und Lernende benötigen, um

Potentiale sinnvoll zu erschließen, welche Grenzen heutige KI-Systeme aufweisen und welche

Risiken mit ihrer Nutzung einhergehen.

Der Vortrag soll ein Impuls sein, neue Wege in der Schreibdidaktik in Erwägung zu ziehen –

jenseits von Alarmismus oder Technikeuphorie. Ziel ist es, KI nicht als Ersatz, sondern als

Erweiterung didaktischen Handelns zu begreifen, die Schreibprozesse verändert und daher in

klar strukturierte, didaktische Konzepte integriert werden muss.

Literaturverzeichnis

Carolus, A., Koch, M.J., Straka, S., Latoschik, M.E., Wienrich, C., 2023. MAILS - Meta AI literacy scale: Development and testing of an AI literacy questionnaire based on well-founded competency models and psychological change- and meta-competencies. Computers in Human Behavior: Artificial Humans 1, 100014. https://doi.org/10.1016/j.chbah.2023.100014 Frenzke–Shim, A., Kohl–Dietrich, D., Standl, B., Langner, M., Maedche, A., Kerber, U., 2024. The Evolving Role of Generative AI in Text Literacies: Exploring the Potential of Cognition-Adaptive Assistance, in: 2024 IEEE Global Engineering Education Conference (EDUCON). Presented at the 2024 IEEE Global Engineering Education Conference (EDUCON), IEEE, Kos Island, Greece, pp. 01–03. https://doi.org/10.1109/EDUCON60312.2024.10578629 Gerlich, M., 2025. AI Tools in Society: Impacts on Cognitive Offloading and the Future of Critical Thinking. Societies 15, 6. https://doi.org/10.3390/soc15010006 Lee, H.-P. (Hank), Sarkar, A., Tankelevitch, L., Drosos, I., Rintel, S., Banks, R., Wilson, N., 2025. The Impact of Generative AI on Critical Thinking: Self-Reported Reductions in Cognitive Effort and Confidence Effects From a Survey of Knowledge Workers, in: Proceedings of the 2025 CHI Conference on Human Factors in Computing Systems. Presented at the CHI 2025: CHI Conference on Human Factors in Computing Systems, ACM, Yokohama Japan, pp. 1–22. https://doi.org/10.1145/3706598.3713778 Selim, A.S.M., 2024. The Transformative Impact of AI-Powered Tools on Academic Writing: Perspectives of EFL University Students. IJEL 14, 14. https://doi.org/10.5539/ijel.v14n1p14 Song, C., Song, Y., 2023. Enhancing academic writing skills and motivation: assessing the efficacy of ChatGPT in AI-assisted language learning for EFL students. Front. Psychol. 14, 1260843. https://doi.org/10.3389/fpsyg.2023.1260843


LLM-generiertes, formatives Feedback für Schreibaufgaben in der Sekundarstufe

Uwe Maier, Taha Kuzu

PH Schwäbisch Gmünd, Deutschland

Zusammenfassung

Theoretischer Hintergrund: Feedback ist ein zentraler Bestandteil erfolgreichen Lernens (Fong et al., 2019; Shute, 2008). Besonders wirksam ist Feedback, wenn es zeitnah, spezifisch und sowohl evaluativ als auch instruktiv ist (Panadero & Lipnevich, 2022; Wisniewski et al., 2020). Ein elaboriertes, formatives Feedback besteht idealerweise aus drei Komponenten (Hattie et al., 2021): Lernzielreformulierung (feed up), Analyse des Artefakts (feed back) sowie Überarbeitungshinweise (feed forward). Im Schreibunterricht spielt formatives Feedback eine zentrale Rolle, insbesondere bei Überarbeitungsprozessen (Graham et al., 2015).

Im Bereich der Schreibförderung und der Bewertung von Texten wurden bisher spezialisierte NLP-Modelle für spezifische Aufgaben entwickelt, z. B. zur automatisierten Bewertung (Scoring) von Essays. Die Entwicklung dieser Modelle war sehr aufwändig und sie konnten nicht auf die Vielfalt von Schreibanlässen im Unterricht übertragen werden (Gao et al., 2024; Tate et al., 2024). Mit der Verfügbarkeit großer Sprachmodelle (LLMs) wie GPT-3.5 und GPT-4 eröffnen sich neue Möglichkeiten für personalisiertes Feedback bei offenen Schreibaufgaben (Kasneci et al., 2023). Bisherige Studien stammen vorrangig aus dem Hochschulbereich oder dem MINT-Kontext, z. B. Programmierunterricht (Nguyen et al., 2023; Qinjin Jia et al., 2024). Es gibt nur sehr wenige Studien zu LLM-generiertem Feedback für Schreibaufgaben in der Sekundarstufe (z.B. Seßler et al., 2025; Meyer et al., 2024). Diese Studien zeigen die Stärke von LLMs bei der Generierung von Überarbeitungshinweisen (feed forward), aber weniger treffsicher bei der kontextsensitiven Fehlererklärung (feed back). Ein valides und für die Überarbeitung eines Textes motivierendes Feedback hängt vor allem von den gewählten LLM-Modellen und den Prompting-Strategien ab.

Zielsetzung: In einem aktuell laufenden Projektseminar an der Pädagogischen Hochschule Schwäbisch Gmünd knüpfen wir an diese Forschungsarbeiten an. Lehramtsstudierende entwickeln und evaluieren Prompting-Strategien für LLM-generiertes Feedback im Kontext einer Schreibaufgabe (Bildbeschreibung) im Deutschunterricht der Sekundarstufe 1. Diese werden mittels einer Lern-App an Schulen erprobt und mit den beteiligten Lehrkräften diskutiert. Perspektivisch sollen die Ergebnisse in ein Fortbildungsmodul für Lehrkräfte einmünden. Basierend auf den bisherigen Studien in diesem Bereich sollen zwei Fragen beantwortet werden:

1. Welche LLM-Versionen generieren die qualitativ besten Feedbacks? Verglichen werden ältere, kostengünstige mit aktuellen Modellen. Aktuelle LLMs wie GPT-4 und Gemini 1.5 verarbeiten deutlich längere Kontexte (bis zu 1 Million Tokens) und sind dadurch in der Lage, komplexere Aufgaben konsistenter zu bearbeiten. Sie zeigen außerdem eine höhere Genauigkeit und geringere Halluzinationsrate, was ihre Verlässlichkeit verbessert. Wir nehmen an, dass diese Modelle damit ein deutlich besseres, formatives Feedback generieren als ältere Modelle.

2. Welche Prompting-Strategien sind am effektivsten? Verglichen werden zwei Varianten. Few-Shot-Prompting mit Schülertext, einer Musterbildbeschreibung sowie einer Feedback-Anweisung (Rolle). Chain-of-Thought-Promting mit Aufgabenstellung, Rollenzuweisung, Schülertext, Mustertext, Scoring-Kriterien und Musterfeedbackbeispielen.

Die methodische Vorgehensweise orientiert sich an den bisherigen Studien im Forschungsfeld (Dai et al., 2023; Jacobsen et al., 2025; Seßler et al., 2025). Zunächst wird im Seminar für die Schreibaufgabe ein Kriterienraster für die Feedback-Bewertung erstellt. Anhand von Beispieltexten werden verschiedene Varianten für formatives Schreibfeedback unterschiedlicher Qualitätsausprägung erzeugt. Diese dienen als Ankerbeispiele für das Kriterienraster. Für jeden Schülertext werden anschließend vier LLM-generierte Feedback-Texte produziert. Die Studierenden erhalten jeweils ein Teilsample aus diesem Feedback-Korpus und bewerten die Feedback-Texte entlang des Kriterienrasters. Für die Beantwortung der Forschungsfrage werden zwei Maße herangezogen: Der Gesamtscore pro Feedback-Text sowie die Teilscores für die einzelnen Feedback-Bewertungskriterien.

Ergebnisse: Im Vortrag werden erste Ergebnisse aus diesem Forschungsprojektseminar berichtet. Aktuell werden im Forschungsprojektseminar von den Studierenden die Feedbacktexte von unterschiedlichsten LLMs mit dem gleichen Feedback-Prompt und Text-Input verglichen. Es zeigte sich bisher, dass die Feedbackqualität sowohl von den Prompts als auch den gewählten LLMs abhängt.

Literaturverzeichnis

Dai, W., Lin, J., Jin, F., Li, T., Tsai, Y.-S., Gasevic, D., & Chen, G. (2023). Can Large Language Models Provide Feedback to Students? A Case Study on ChatGPT. EdArXiv. https://doi.org/10.35542/osf.io/hcgzj

Fong, C. J., Patall, E. A., Vasquez, A. C., & Stautberg, S. (2019). A Meta-Analysis of Negative Feedback on Intrinsic Motivation. Educational Psychology Review, 31(1), 121–162. https://doi.org/10.1007/s10648-018-9446-6

Gao, R., Merzdorf, H. E., Anwar, S., Hipwell, M. C., & Srinivasa, A. R. (2024). Automatic assessment of text-based responses in post-secondary education: A systematic review. Computers and Education: Artificial Intelligence, 6, 100206. https://doi.org/10.1016/j.caeai.2024.100206

Graham, S., Hebert, M., & Harris, K. R. (2015). Formative Assessment and Writing: A Meta-Analysis. The Elementary School Journal, 115(4), 523–547. https://doi.org/10.1086/681947

Hattie, J., Crivelli, J., Van Gompel, K., West-Smith, P., & Wike, K. (2021). Feedback That Leads to Improvement in Student Essays: Testing the Hypothesis that “Where to Next” Feedback is Most Powerful. Frontiers in Education, 6, 645758. https://doi.org/10.3389/feduc.2021.645758



Schreibförderung mit digitalen Tools: Inwieweit profitieren auch Lernende mit geringen literalen Vorkenntnissen?

Kathrin Gade1, Steve Graham2, Vera Busse1

1Universität Münster, Deutschland; 2Arizona State University, USA

Zusammenfassung

Theoretischer Hintergrund

Schreiben ist eine Schlüsselkompetenz, die für einen erfolgreichen Übergang zur weiterführenden Schule zentral ist (Cutler & Graham, 2008). Obwohl die Anzahl der zu Hause mit Medien ausgestatteten Kinder in den letzten Jahren stetig zugenommen hat (Medienpädagogischer Forschungsverbund Südwest [mpfs], 2022), werden digitale Tools in deutschen Grundschulen vergleichsweise selten eingesetzt (Lorenz et al., 2023). Bezogen auf die komplexe Anforderung, längere Texte zu planen, strukturiert und kohärent zu verfassen sowie zu überarbeiten, bergen digitale Tools wie z.B. Tablets aber durchaus Potenziale für die Schreibförderung (Camacho et al., 2021; Döring & Busse, 2022; Wen & Walters, 2022). Unklar ist jedoch bislang, inwieweit auch Lernende mit sehr geringen literalen Vorerfahrungen von Schreibförderungsmaßnahmen am Tablet profitieren.

Fragestellung

FF1: Inwieweit fördern Schreib-AGen mit Tablets die Zunahme von Textlänge und die (analytische sowie holistische) Textqualität bei Kindern mit geringen literalen Vorkenntnissen im Vergleich zu ihren Peers?

FF2: Inwieweit werden auch Schreibfreude und Wohlbefinden gefördert?

Methode

Das (quasi-)experimentelle BMBF-Interventionsprojekt KommSchreib! fördert Schreibkompetenz, -motivation und soziale Partizipation in den Klassen 3/4 an elf Grundschulen. An acht von diesen Schulen (N = 82) wurde zusätzlich zur Intervention im Regelunterricht eine zielgruppenspezifische Intervention für Risikoschreibende mit geringen literalen Vorkenntnissen durch projektintern geschulte Honorarkräfte in Form von Schreib-Arbeitsgemeinschaften (AGen) im Ganztag angeboten. Auch schreibstärkere Peers nahmen an den AGen teil. Übergeordnetes Ziel dieser AGen mit 14 Sitzungen je 90 Minuten war eine über den Regelunterricht hinausgehende, systematische Schreibförderung im Ganztag unter Einsatz von Tablets. An diesen wurden eBooks mit Rezepten erstellt und das Schreiben dieser instruktionalen Texte mit handlungsorientierten Phasen der Zubereitung ergänzt. Zur Überprüfung der Wirksamkeit wurden Prä- und Postvergleiche sowie Fragebogendaten im Längsschnitt erhoben. Diese Daten wurden durch Kurzbefragungen der durchführenden Honorarkräfte und Interviews mit den Schüler:innen ergänzt und quantitativ sowie qualitativ ausgewertet. Ebenso liegt eine qualitative Auswertung der in den AGen enstandenen Medienprodukte vor.

Ergebnisse

FF1: Im Verlauf der Intervention zeigten sich neben einem signifikanten Anstieg der Textlänge (t[81] = 4.76, p < .001, d = 0.53) und der Textqualität bei instruktionalen Texten (t[81] = 13.89, p < .001, d = 1.53) für die Gesamtstichprobe (N = 82). Bei einer ANOVA mit Messwiederholung und Leistungsniveau als Zwischensubjektfaktor zeigten sich außerdem eine signifikante Interaktion von Zeit und Textscore zur Messung von Textqualität sowohl für Risikoschreibende (F[1,80]= 140.01, p < .001, partial eta2 = .637) als auch für die literal erfahrenere Peer-Gruppe (F[1,80]= 78.80, p < .001, partial eta2 = .496).

FF2: Die Schreibfreude im Allgemeinen war zu T1 relativ hoch (M = 3.43, SD = 1.13; theor. max. 5.00), nahm aber im Verlauf der AG-Sitzungen nicht signifikant zu. Die Schreibfreude bei der Verwendung von Tablets war durchgängig höher als die allgemeine Schreibfreude. Die Auswertung des PANAS-C zur Messung des Wohlbefindens in unmittelbarem Anschluss an die AG-Sitzungen ergab durchgehend hohe Werte für positiven Affekt und niedrige Werte für negativen Affekt, wies jedoch auch große Standardabweichungen auf. In einigen Sitzungen zeigten Risikoschreibende einen signifikant höheren negativen Affekt als ihre Peers. Die AGen wurden von den teilnehmenden Kindern sehr positiv bewertet (M = 4.32, SD = 1.02; theor. max. 5.00).

Die Ergebnisse zeigen, dass zusammen mit ihren Peers auch Lernende mit sehr geringen literalen Vorerfahrungen von digitalen Schreibfördermaßnahmen profitieren können. Insgesamt wirkten sich diese positiv aus - sowohl auf die auf Schreibkompetenz als auch auf Schreibfreude (insbesondere am Tablet) und das Wohlbefinden bei beiden Gruppen und sollten daher auch Teil der Aus- und Weiterbildung von Lehrkräften sein. Gleichzeitig diskutieren wir die Diskrepanz zwischen dem Potenzial von Digitalisierung und ihrer tatsächlichen Umsetzung in pädagogischen Umgebungen vor dem Hintergrund infrastruktureller wie didaktischer Herausforderungen, z. B. der fehlenden basalen Beherrschung digitaler Schreibwerkzeuge oder dem erhöhten Ablenkungspotenzial am Tablet ohne Vorhandensein von Selbstregulationsstrategien bei Grundschulkindern.

Literaturverzeichnis

Abbott, R. D., Berninger, V. W. & Fayol, M. (2010). Longitudinal relationships of levels of language in writing and between writing and reading in grades 1 to 7. Journal of Educational Psychology, 102(2), 281–298. https://doi.org/10.1037/a0019318

Augst, G., Disselhoff, K., Henrich, A., Pohl, T. & Völzing, P.‑L. (2007a). Text - Sorten - Kompetenz: Eine echte Longitudinalstudie zur Entwicklung der Textkompetenz im Grundschulalter. Theorie und Vermittlung der Sprache: Bd. 48. Peter Lang.

Becker-Mrotzek, M. & Lemke, V. (2022). Gute Schreibaufgaben für alle Fächer. In V. Busse, N. Müller & L. Siekmann (Hrsg.), Schreiben fachübergreifend fördern: Grundlagen und Anregungen für Schule Unterricht und Lehrkräftebildung (S. 73–95). Kallmeyer.

Bruning, R. & Horn, C. (2000). Developing Motivation to Write. Educational Psychologist, 35(1), 25–37. https://doi.org/10.1207/S15326985EP3501_4

Brunstein, J. C. & Glaser, C. (2011). Testing a path-analytic mediation model of how self-regulated writing strategies improve fourth graders' composition skills: A randomized controlled trial. Journal of Educational Psychology, 103(4), 922–938. https://doi.org/10.1037/a0024622

Camacho, A., Alves, R. A. & Boscolo, P. (2021). Writing Motivation in School: a Systematic Review of Empirical Research in the Early Twenty-First Century. Educational Psychology Review, 33(1), 213–247. https://doi.org/10.1007/s10648-020-09530-4

Cutler, L. & Graham, S. (2008). Primary grade writing instruction: A national survey. Journal of Educational Psychology, 100(4), 907–919. https://doi.org/10.1037/a0012656

Döring, M. & Busse, V. (2022). Förderung der Schreibkompetenz durch den Einsatz digitaler Medien. Ungleichheiten digital begegnen. In N. Harsch, M. Jungwirth, M. Stein, Y. Noltensmeier & N. Willenberg (Hrsg.), Diversität Digital Denken – The Wider View. Eine Tagung des Zentrums für Lehrerbildung der Westfälischen Wilhelms-Universität Münster vom 08. bis 10.09.2021 (S. 259–268). WTM-Verlag.

Graham, S., McKeown, D., Kiuhara, S. & Harris, K. R. (2012). "Meta-analysis of writing instruction for students in elementary grades": Correction to Graham et al. (2012). Journal of Educational Psychology, 104(4), 896. https://doi.org/10.1037/a0029939

Harris, K. R. (2024). The Self-Regulated Strategy Development Instructional Model: Efficacious Theoretical Integration, Scaling Up, Challenges, and Future Research. Educational Psychology Review, 36(4). https://doi.org/10.1007/s10648-024-09921-x

Hascher, T. & Mori, J. (2024). Teacher and Student Well-Being: Theoretical Reflections and Perspectives.: Theoretical Reflections and Perspectives. In G. Hagenauer, R. Lazarides & H. Järvenoja (Hrsg.), New perspectives on learning and instruction. Motivation and emotion in learning and teaching across educational contexts: Theoretical and methodological perspectives and empirical insights (S. 114–127). Routledge.

Hidi, S. & Boscolo, P. (2006). Writing and motivation. Studies in Writing: v. 19. Elsevier. https://doi.org/10.1163/9781849508216

KMK (Ständige Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland). (2022). Bildungsstandards für das Fach Deutsch. Primarbereich. https://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2022/2022_06_23-Bista-Primarbereich-Deutsch.pdf

Laurent, J., Catanzaro, S. J., Joiner, T. E., Rudolph, K. D., Potter, K. I., Lambert, S., Osborne, L. & Gathright, T. (1999). A Measure of Positive and Negative Affect for Children: Scale Development and Preliminary Validation. Psychological Assessment, 11(3), 326–338. https://doi.org/10.1037/1040-3590.11.3.326

Lorenz, R., Goldhammer, F. & Glondys, M. (2023). Digitalisierung in der Grundschule. In N. McElvany, R. Lorenz, A. Frey, F. Goldhammer, A. Schilcher & T. C. Stubbe (Hrsg.), IGLU 2021. Lesekompetenz von Grundschulkindern im internationalen Vergleich und im Trend über 20 Jahre. Waxmann.

Mayringer, H. & Wimmer, H. (2014). SLS - 2-9: Salzburger Lese-Screening für die Schulstufen 2-9. Hogrefe.

Medienpädagogischer Forschungsverbund Südwest. (2022). KIM-Studie 2022. Kindheit, Internet, Medien: Basisuntersuchung zum Medienumgang 6- bis 13 Jähriger. https://www.mpfs.de/fileadmin/files/Studien/KIM/2022/KIM-Studie2022_website_final.pdf

Wen, X. & Walters, S. M. (2022). The Impact of Technology on Students’ Writing Performances in Elementary Classrooms: A Meta-Analysis. Computers and Education Open, 3(2). https://www.sciencedirect.com/science/article/pii/S2666557322000106?via%3Dihub