Sitzung | ||
Donnerstag 1:1: Editionen I
| ||
Präsentationen | ||
Zum Aufbau digitaler Dramenkorpora. OCR4alltoDraCorTEI als Baustein für die Edition von maschinenlesbaren Versionen historischer Dramendrucke Julius-Maximilians-Universität Würzburg, Deutschland Die verfügbaren digitalisierten Dramenkorpora spiegeln Verzerrungen der Dramengeschichtsschreibung der letzten Jahrzehnte wider. Für die Dramengeschichte des 17.-19. Jahrhunderts fehlen besonders Libretti, populäre Komödien, Dramen von Frauen und Übersetzungen, obwohl diese zahlreich und einflussreich waren. Um Korpora für die Computational Literary Studies (CLS) valide zu erweitern und die historische Diversität besser abzubilden, sollten in Zukunft zahlreiche historische Dramentexte volltextdigitalisiert werden. Herausforderungen sind dabei die Frakturschrift und Druckbesonderheiten. Derzeit fehlt es sowohl an einheitlichen Editionsrichtlinien als auch an Skripten zur Konvertierung von OCR-Software zu DraCorTEI. Im Beitrag werden Vorschläge für editorische Richtlinien und zur Digitalisierung mit der freien Software OCR4all gemacht. Zudem wird ein Open Access Python-Skript vorgestellt, das Dramen, die mit OCR4all ausgezeichnet wurden, in DraCorTEI umwandelt. Korpus 4.0 - Ein innovativer Workflow zur Erstellung eines Korpus wissenschaftlicher Texte Universitäts- und Landesbibliothek Darmstadt, Deutschland Im Rahmen des DFG-geförderten Projekts Workflow Digitale Medien arbeitet die Universitäts- und Landesbibliothek Darmstadt daran, ein Korpus aus wissenschaftlicher Open-Access-Literatur in einem einheitlich strukturierten TEI/XML-Format über frei zugängliche Schnittstellen bereitzustellen. Forschende sollen die Möglichkeit erhalten, alle Arten wissenschaftlicher Dokumente, zum Beispiel Zeitschriftenartikel, E-Books oder Konferenzbände, in großen Mengen über diese Schnittstellen abzurufen, um sie anschließend beispielsweise für Text- und Data-Mining-Analysen nutzen zu können. Zusätzlich zu den Texten werden alle für den Workflow entwickelten Konzepte und Skripte Open Source zur Verfügung gestellt, um deren Nachnutzbarkeit zu gewährleisten. Im vorliegenden Vortrag wird ein Überblick über den Workflow, die Datengrundlage und Zugriffsmöglichkeiten sowie den aktuellen Entwicklungsstand des Projekts gegeben. Der texgenetische Apparat in der digitalen Edition – eine Zukunftsvision, die technisch machbar ist Universität Bern, Schweiz / Forschungsstelle Jeremias Gotthelf Anders als bei den gedruckten Ausgaben messen digitale Editionen Neuerer deutscher Literatur den Mikroprozessen der Textentstehung zumeist keine zentrale Bedeutung zu. Eine entsprechende Ansicht ist die große Ausnahme unter den bestehenden neugermanistischen Online-Editionsprojekten. Die verfügbaren Textansichten sind in der Regel mimetisch-diplomatisch und erlauben es oft nicht, die mikrogenetischen Vorgänge in den Manuskripten lückenlos nachzuvollziehen. Mit der neuen digitalen Gotthelf-Gesamtausgabe, die im Frühjahr 2025 online geht, wird eine Edition vorgestellt, die das philologische Potenzial der digitalen Editorik ausschöpft und den textgenetischen Apparat vollständig oder variabel direkt an den betreffenden Stellen im edierten Text sichtbar macht. |