FORGE 2023 - ConfTool Pro Printout

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

Sitzung

Vorträge: Daten generieren und analysieren

Zeit:

Freitag, 06.10.2023:

10:30 - 12:30

Chair der Sitzung: Kai Wörner, Universität Hamburg

Ort: Brechtbau Raum 37

Auditorium (200 Pl.)

Präsentationen

Von der Herkunft zur Zukunft: Interdisziplinäre Ansätze zur Erforschung von Provenienzen in Museen

Elisa Ludwig, Antoinette Maget Dominicé, Stefanie Schneider, Ricarda Vollmer

Ludwig-Maximilians-Universität München, Deutschland

Infolge des gesteigerten öffentlichen Interesses und des wachsenden Bewusstseins bezüglich der Herkunft von Kulturgütern, gewinnt die Provenienzforschung als Methode und Forschungsgebiet zunehmend an Bedeutung. Die Einreichung untersucht die Relevanz von Forschungsdaten in Bezug auf Provenienzangaben in Museumsdatenbanken. Es wird aufgezeigt, dass Forschungsdaten dort eine essenzielle Rolle bei der Gewährleistung der Transparenz, Vernetzung und Zugänglichkeit einnehmen. Dabei werden Online-Sammlungen internationaler Kunstmuseen mittels aus relevanten Leitfäden abgeleiteten Kriterien vergleichend analysiert, wobei quantitative und qualitative Methoden komplementär eingesetzt werden. Die Einreichung betont die Bedeutung (nach)nutzbarer Forschungsdaten, um provenienzwissenschaftliche Belange zu unterstützen und zu einem verantwortungsbewussten Umgang mit dem kulturellen Erbe beizutragen.

New Ways of Creating Research Data: Conversion of Unstructured Text to TEI XML using GPT on the Correspondence of Hugo Schuchard with a Web Prototype for Prompt Engineering

Christopher Pollin¹, Christian Steiner², Constantin Zach³

¹Zentrum für Informationsmodellierung, Österreich; ²Digital Humanities Craft OG; ³Independent Software Developer

This paper explores the use of prompt engineering to streamline the creation of research data in the humanities by converting unstructured correspondence texts into the TEI XML format. Prompt engineering, an approach to optimising large-scale language models such as GPT, generates accurate structured data while preserving the context of the original text. The paper outlines the conversion workflow using prompt engineering techniques and emphasises the iterative refinement of the process. Challenges such as domain-specific training and consistency issues are discussed, as are potential solutions, including the integration of vector databases. A user-friendly web prototype for researchers is presented.

Ein weiteres Toolverzeichnis für die Digital Humanities?! Aber diesmal offen und mit Wikidata

Till Grallert, Sophie Eckenstaler, Samantha Tirtohusodo, Claus-Michael Schlesinger

Humboldt-Universität zu Berlin, Deutschland

Der eingereichte Beitrag skizziert die Landschaft der bestehenden Toolverzeichnisse in den Digital Humanities und ihrer Schwächen und stellt vor diesem Hintergrund unseren Vorschlag eines Wikidata-basierten offenen Ansatzes als einen von minimal computing, making und Open Science informierten Beitrag zu den Digital Commons vor.

Automatische Texterkennung von Handschriften und historischen Drucken. Qualität und Normierung von Ground-Truth-Daten in der Praxis

Dorothee Huff¹, Larissa Will², Kristina Stöbener¹

¹Universitätsbibliothek Tübingen, Deutschland; ²Universitätsbibliothek Mannheim, Deutschland

Automatische Texterkennung (OCR) übersetzt textliche Bildinhalte in digitale Textformate. Auf diese Weise werden der Zugang zu historischen Drucken und Handschriften erhöht und neue Forschungsfragen an das Material ermöglicht. Vor der wissenschaftlichen Auswertung der Daten gilt es jedoch, sich über Aspekte wie Qualität und Normierung der Ground-Truth-Daten und des erzeugten Outputs bewusst zu werden, diese zu hinterfragen und bei der Nachnutzung der Daten in Betracht zu ziehen. Anhand von Beispielen sollen unterschiedliche Vorgehensweisen bei der Erzeugung von Ground-Truth-Daten sowie Ergebnisse der jeweiligen Modelltrainings vorgestellt und problematisiert werden.

Veranstaltungsprogramm