Von der Herkunft zur Zukunft: Interdisziplinäre Ansätze zur Erforschung von Provenienzen in Museen
Elisa Ludwig, Antoinette Maget Dominicé, Stefanie Schneider, Ricarda Vollmer
Ludwig-Maximilians-Universität München, Deutschland
Infolge des gesteigerten öffentlichen Interesses und des wachsenden Bewusstseins bezüglich der Herkunft von Kulturgütern, gewinnt die Provenienzforschung als Methode und Forschungsgebiet zunehmend an Bedeutung. Die Einreichung untersucht die Relevanz von Forschungsdaten in Bezug auf Provenienzangaben in Museumsdatenbanken. Es wird aufgezeigt, dass Forschungsdaten dort eine essenzielle Rolle bei der Gewährleistung der Transparenz, Vernetzung und Zugänglichkeit einnehmen. Dabei werden Online-Sammlungen internationaler Kunstmuseen mittels aus relevanten Leitfäden abgeleiteten Kriterien vergleichend analysiert, wobei quantitative und qualitative Methoden komplementär eingesetzt werden. Die Einreichung betont die Bedeutung (nach)nutzbarer Forschungsdaten, um provenienzwissenschaftliche Belange zu unterstützen und zu einem verantwortungsbewussten Umgang mit dem kulturellen Erbe beizutragen.
New Ways of Creating Research Data: Conversion of Unstructured Text to TEI XML using GPT on the Correspondence of Hugo Schuchard with a Web Prototype for Prompt Engineering
Christopher Pollin1, Christian Steiner2, Constantin Zach3
1Zentrum für Informationsmodellierung, Österreich; 2Digital Humanities Craft OG; 3Independent Software Developer
This paper explores the use of prompt engineering to streamline the creation of research data in the humanities by converting unstructured correspondence texts into the TEI XML format. Prompt engineering, an approach to optimising large-scale language models such as GPT, generates accurate structured data while preserving the context of the original text. The paper outlines the conversion workflow using prompt engineering techniques and emphasises the iterative refinement of the process. Challenges such as domain-specific training and consistency issues are discussed, as are potential solutions, including the integration of vector databases. A user-friendly web prototype for researchers is presented.
Ein weiteres Toolverzeichnis für die Digital Humanities?! Aber diesmal offen und mit Wikidata
Till Grallert, Sophie Eckenstaler, Samantha Tirtohusodo, Claus-Michael Schlesinger
Humboldt-Universität zu Berlin, Deutschland
Der eingereichte Beitrag skizziert die Landschaft der bestehenden Toolverzeichnisse in den Digital Humanities und ihrer Schwächen und stellt vor diesem Hintergrund unseren Vorschlag eines Wikidata-basierten offenen Ansatzes als einen von minimal computing, making und Open Science informierten Beitrag zu den Digital Commons vor.
Automatische Texterkennung von Handschriften und historischen Drucken. Qualität und Normierung von Ground-Truth-Daten in der Praxis
Dorothee Huff1, Larissa Will2, Kristina Stöbener1
1Universitätsbibliothek Tübingen, Deutschland; 2Universitätsbibliothek Mannheim, Deutschland
Automatische Texterkennung (OCR) übersetzt textliche Bildinhalte in digitale Textformate. Auf diese Weise werden der Zugang zu historischen Drucken und Handschriften erhöht und neue Forschungsfragen an das Material ermöglicht. Vor der wissenschaftlichen Auswertung der Daten gilt es jedoch, sich über Aspekte wie Qualität und Normierung der Ground-Truth-Daten und des erzeugten Outputs bewusst zu werden, diese zu hinterfragen und bei der Nachnutzung der Daten in Betracht zu ziehen. Anhand von Beispielen sollen unterschiedliche Vorgehensweisen bei der Erzeugung von Ground-Truth-Daten sowie Ergebnisse der jeweiligen Modelltrainings vorgestellt und problematisiert werden.
|