Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Nur Sitzungen am Veranstaltungsort 
 
Sitzungsübersicht
Sitzung
Workshop 18a: Flexibles Arbeiten mit OCR4all – Massenvolltextdigitalisierung von Drucken mithilfe von OCR-D und hochqualitative Transkription von Handschriften
Zeit:
Dienstag, 08.03.2022:
9:00 - 17:00

Ort: DHd2022 Zoom Workshop 18

Zeige Hilfe zu 'Vergrößern oder verkleinern Sie den Text der Zusammenfassung' an
Präsentationen

Flexibles Arbeiten mit OCR4all – Massenvolltextdigitalisierung von Drucken mithilfe von OCR-D und hochqualitative Transkription von Handschriften

Florian Langhanki1, Maximilian Wehner1, Konstantin Baierer2, Lena Hinrichsen3, Christian Reul1

1Julius-Maximilians-Universität Würzburg, Germany; 2Staatsbibliothek zu Berlin – Preußischer Kulturbesitz; 3Herzog August Bibliothek Wolfenbüttel

Die automatisierte Texterkennung von historischen Drucken und Handschriften stellt eine anspruchsvolle Aufgabe bei der Entwicklung modularer wie flexibler OCR-/HTR-Workflows dar. Besonders Forschungsfelder wie Text Mining oder Sentiment Analysis haben die Schwierigkeiten einer Textdigitalisierung entsprechender Materialien bei gleichzeitigem Bedarf großer Textmengen zur Anwendung quantitativer Analyseverfahren erkannt. Auch im Kontext hochqualitativer Volltexterfassungen digitaler Editionen besteht großer Bedarf an intuitiv und komfortabel zu bedienender Software.

Die an der Universität Würzburg entwickelte Software OCR4all nimmt neben den formulierten Anforderungen entsprechender Workflowsysteme die Ausrichtung auf einen geisteswissenschaftlichen Nutzer:innenkreis für sich in Anspruch. Durch die baldige Unterstützung der im Rahmen von OCR-D entwickelten Lösungen wird nun die Anwendung im Spannungsfeld einer Massenvolltextdigitalisierung und einer hochqualitativen Erfassung historischer Texte möglich.

Der Workshop bietet einen umfassenden Einstieg ins Thema der OCR und HTR historischer Materialien. Teilnehmende werden in die Nutzung von OCR4all eingeführt und dazu befähigt, auf Grundlage anspruchsvoller Ausgangsmaterialien hochqualitative Textdaten zu generieren.