Im Beitrag von Judith Stanja, Sarah Dannemann, Johannes Krugel und Anett Hoppe mit dem Titel "Investigating evidence-oriented generation of synthetic text data with a generative large language model in science education" wird über eine Explorationsstudie zur Erzeugung und Evaluation von synthetischen Textdaten im Kontext der Naturwissenschaftsdidaktik berichtet. Der Umfang und die Wiederverwendbarkeit von Lernendendaten stellen Herausforderungen bei der Entwicklung datengestützter Methoden zur Diagnose von Schülervorstellungen dar. In der Studie wurde untersucht, inwiefern ein evidenz-orientierter Promptingansatz genutzt werden kann, um mit Hilfe eines generativen Sprachmodells datenschutzkonform synthetische Textdaten zu erzeugen. Basierend auf didaktischer Forschung werden Anforderungen für die Erzeugung und Evaluation vorgeschlagen. Durch die Kombination von quantitativen und qualitativen Methoden wurden (1) Merkmale erzeugter mit denen authentischer Texte verglichen, (2) die Genauigkeit des Verfahrens (Kategorienzugehörigkeit), und (3) Frame-basierte Merkmale von Texten verschiedener Kategorien untersucht.
- Stanja, J., Dannemann, S., Krugel, J., & Hoppe, A. (2025). Investigating evidence-oriented generation of synthetic text data with a generative large language model in science education. International Journal of Science Education, 1–23. https://doi.org/10.1080/09500693.2025.2538834