FORGE 2023 - ConfTool Pro Printout

Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

Sitzungsübersicht

Ort: Brechtbau Raum 36
Auditorium (160 Pl.)

Datum: Mittwoch, 04.10.2023

13:00 - 14:30

Workshop: Handschriftentranskription
Ort: Brechtbau Raum 36

KI statt Paläographie: Automatische Transkription von Handschriften und Drucken – Einführung in Transkribus und eScriptorium

Larissa Will¹, Dorothee Huff²

¹Universitätsbibliothek Mannheim, Deutschland; ²Universitätsbibliothek Tübingen, Deutschland

Texterkennungs- und Transkriptionsplattformen wie Transkribus und eScriptorium können bei der Erschließung historischer Quellen unterstützen und bieten gegenüber kommandozeilenbasierter Texterkennungssoftware den Vorteil einer einfachen Anwendung über eine graphische Oberfläche. Dabei spielt es keine Rolle, ob es sich um eine Postkarte, eine historische Zeitung oder eine mittelalterliche Handschrift handelt. Von der Layouterkennung und -korrektur über die automatisierte Texterkennung bis hin zur manuellen Korrektur der OCR-Ergebnisse und dem Training eigener Modelle werden die grundlegenden Funktionen von Transkribus und eScriptorium vorgestellt und können von den Teilnehmenden selbst an Beispielen getestet werden. Das Mitbringen eines eigenen Laptops wird empfohlen für aktive Teilnahme; gerne kann vorab bereits eine Registrierung bei Transkribus (https://readcoop.eu/transkribus/) erfolgen.

Datum: Donnerstag, 05.10.2023

15:00 - 17:00

Vorträge: Daten erschließen und dokumentieren
Ort: Brechtbau Raum 36
Chair der Sitzung: Katrin Moeller, Martin-Luther-Universität Halle-Wittenberg

Inhaltserschließung für Forschungsdaten: TextGrid Repository, Normdaten und Basisklassifikation

José Calvo Tello, Stefan Funk, Daniel Kurzawe, Ubbo Ventjeer

Niedersächsische Staats- und Universitätsbibliothek Göttingen

Bibliotheken verwenden Klassifikationssysteme für die Sach- und Inhaltserschließung von Primär- und Sekundärliteratur. Für andere Arten von Publikationen, wie z.B. Forschungsdaten, werden sie jedoch nicht eingesetzt. In diesem Beitrag wird die Einführung eines solchen Klassifikationssystems in das TextGrid Repository vorgestellt, das für textuelle Daten (Editionen und Korpora) in XML-TEI geeignet ist. Konkret wird die Basisklassifikation verwendet, ein offenes und im deutschsprachigen Raum weit verbreitetes Klassifikationssystem mit einer mittleren Anzahl von Klassen. In diesem Beitrag möchten wir dafür plädieren, dass Bibliotheken eine aktivere Rolle bei der Beschreibung von Forschungsdaten übernehmen sollten, weil dies zu einer Verbesserung des FAIR-Status der Forschungsdaten führt.

Total Error Sheets for Datasets (TES-D) zur Dokumentation Digitaler Verhaltensdaten

Leon Fröhling¹, Indira Sen¹, Felix Soldner¹, Leonie Steinbrinker², Maria Zens¹, Katrin Weller^1,3

¹GESIS, Deutschland; ²Universität Leipzig, Deutschland; ³CAIS, Deutschland

Die in den Sozialwissenschaften zunehmend zur Untersuchung bekannter Verhaltensmuster und neuartiger Kommunikationsphänomene verwendeten digitalen Verhaltensdaten sind häufig das Resultat eines mehrstufigen Prozesses der Datensammlung. Die bereits zur Sammlung der Daten zu treffenden Designentscheidungen können sich auf häufig unerwartete Weise in der Zusammensetzung und Qualität des resultierenden Datensatzes niederschlagen. Zur besseren Erkennung, Dokumentation und Kommunikation systematischer Verzerrungen, Eigenheiten und potenzieller Fehler in Datensätzen digitaler Verhaltensdaten präsentieren wir die Total Error Sheets for Datasets (TES-D). Das TES-D leitet Forschende durch die kritische Reflektion des Prozesses der Datensammlung und unterstützt bei der Erstellung einer umfänglichen Dokumentation des resultierenden Datensatzes.

Das “TOSCA Modelling Tool” – nachhaltige Dokumentation von Forschungssoftware

Claes Neuefeind, Marcel Schaeben, Philip Schildkamp

Universität zu Köln, Deutschland

Für die Nachnutzbarkeit von Forschungsanwendungen, welche einen zunehmenden Anteil wissenschaftlicher Forschungsergebnisse ausmachen, ist Dokumentation unerlässlich. Dies betrifft neben nutzungsorientierten Bedienungsanleitungen auch die technische Dokumentation der Funktionalität und Betriebsbedingungen solcher Applikationen. Wir schlagen daher vor, den TOSCA-Standard für die Beschreibung von Forschungsanwendungen, deren Bereitstellung und Laufzeitumgebungen einzusetzen und stellen dazu in unserem Beitrag das durch NFDI4Culture geförderte “TOSCA Modelling Tool” vor. Dabei handelt es sich um einen Desktop-basierten, visuellen Editor zur TOSCA-konformen Modellierung von Anwendungen und deren Laufzeitumgebung. In unserem Beitrag präsentieren wir die zentralen Konzepte des TOSCA-Standards und Anwendungsbeispiele für das “TOSCA Modelling Tool”.

“FAIR Collections as Data”: Services von Kulturerbeeinrichtungen für die datengetriebene Forschung

Kathi Woitas

Zentralbibliothek Zürich, Schweiz

Mit dem Konzept Digital Scholarship wird die digitale Transformation der Wissenschaft beschrieben. Bestände aus Kulturerbe-Institutionen stellen hierbei eine unverzichtbare Grundlage für datengetriebene Forschungsansätze in den Geisteswissenschaften dar. Mit deren breiter Aufbereitung und Kuration als Datenkonvolute könnte die Verfügbarkeit von FAIRen Forschungsdaten im grossen Umfang erhöht werden. Collections as Data als ideeller und praktischer Ansatz im Kulturerbe-Sektor, um die computergestützte Nutzung der Bestände zu ermöglichen und zu vereinfachen, bietet hierfür einen vielversprechenden Ausgangspunkt. Mit der breiten Umsetzung von «FAIR Collections as Data» können Bibliotheken die zentrale Basis für die Entwicklung von Digital Scholarship Services legen.

Datum: Freitag, 06.10.2023

10:30 - 12:30

Vorträge: Dateninfrastruktur und Nachhaltigkeit von Forschungsdaten
Ort: Brechtbau Raum 36
Chair der Sitzung: Peter Gietz, DAASI International

Organisation bestimmt Technik: Persistenz und Veränderung in Infrastrukturen zur langfristigen Sicherung von Forschungsdaten

Sebastian Schiller-Stoff, Gunter Vasold, Elisabeth Steiner

Universität Graz, Österreich

(Digitale) Forschungsdaten nachhaltig und wiederverwendbar zu verwalten, zu archivieren und zur Verfügung zu stellen ist eine wesentliche Herausforderung aktueller Forschung. Der Vortrag stellt die zentrale Frage, ob und wie Forschungsinfrastrukturen im akademischen Kontext im Sinne der Softwarearchitektur nachhaltig entworfen und entwickelt werden können. Durch das tiefere Verständnis und die Bewusstmachung von organisatorischen Einflussgrößen soll die Qualität und Persistenz von technischen Lösungen und ihre langfristige Wartbarkeit verbessert werden. Gerade im Bereich der Langzeitverfügbarkeit kann plakativ auf den Punkt gebracht werden: Personelle und finanzielle Persistenz in einer angemessenen Organisationstruktur führen zu technischer Persistenz.

DATA AFFAIRS: Ein Portal zum Datenmanagement in der ethnografischen Forschung

Camilla Heldt, Anne Voigt, Birgitt Röttger-Rössler, Brigitte Grote

Freie Universität Berlin, Deutschland

Im Vortrag wird ein Informationsportal des Sonderforschungsbereichs Affective Societies vorgestellt, das qualitativ arbeitende Wissenschaftler*innen und Lehrende aus den sozial- und kulturanthropologischen Fächern (SKA) beim Forschungsdatenmanagement (FDM) unterstützen soll. Bisher stehen aus diesen Fächergruppen aufgrund der Besonderheit von Forschung und Methodik kaum geteilte Forschungsdaten gemäß den FAIR-Prinzipien zur Verfügung.

Das frei zugängliche Angebot gibt einen Überblick über Themen des FDMs, diskutiert den aktuellen Stand anthropologischer Debatten und lädt zum interaktiven Selbststudium ein. Erfahrungsberichte und Praxisbeispiele aus ethnographischen Forschungsfeldern regen zur (kritischen) Auseinandersetzung mit den Forderungen nach FAIR geteilten Forschungsdaten an. Inhalte und Quellcode sind unter einer freien Lizenz veröffentlicht.

Digital Humanities in Discuss Data: Aufbau eines Communityspace

Torsten Kahlert¹, Daniel Kurzawe²

¹Herzog-August-Bibliothek, Wolfenbüttel; ²Staats- und Universitätsbibliothek Göttingen

In diesem Beitrag beschreiben wir, wie die Forschungsdatenplattform Discuss Data um einen Bereich (“Communityspace”) für die Digital Humanities (DH) erweitert wird. Dazu ergründen wir die Spezifika dieses Forschungsbereichs für einen entsprechenden Communityspace in Discuss Data und hinterfragen auch kritisch, wie erfolgreich bisherige Ansätze der Plattform Discuss Data im Aufbau der Community des Space für die “Osteuropa, Südkaukasus und Zentralasien” Forschung verlaufen sind und wie diese Erfahrungen bei dem Aufbau eines neuen Communityspace einbezogen werden können. Dies betrifft auch Kernbestandteile, wie die Vernetzungskomponenten und die Möglichkeit für Diskussionen über Daten auf der Plattform.

Das Projektende - Zum praktischen Umgang mit Forschungsdaten eines geisteswissenschaftlichen Editionsprojekts

Markus Schnöpf

Berlin-Brandenburgische Akademie der Wissenschaften, Deutschland

Das an der BBAW angesiedelte Akademienvorhaben Corpus Coranicum arbeitet seit 2007 genuin digital an einem mehrere Module umfassenden Portal zum Text des Korans. Da sich das Projekt dem Ende zuneigt, lohnt sich ein Blick auf die Zukunft der während der Laufzeit angesammelten Forschungsdaten. Während sich die Suche nach einem Fachrepositorium vergleichsweise einfach gestaltet, sind Fragen zur Definition und Typisierung der multilingualen Forschungsdaten durch die Datenvielfalt schwieriger zu beantworten. Auch muss bedacht werden, dass nicht alle Forschungsdaten publizierbar sind und dennoch unter FAIR-Bedingungen in der Institution aufgehoben werden sollten.