Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Nur Sitzungen am Veranstaltungsort 
 
Sitzungsübersicht
Sitzung
V6_1: Digitale Geschichtswissenschaft
Zeit:
Freitag, 11.03.2022:
9:15 - 10:45

Chair der Sitzung: Stefan Schmunk, Hochschule Darmstadt - University of Applied Sciences
Virtueller Veranstaltungsort: DHd2022 Zoom Freitag 1

Zoom-Kenncode: 03049283

Zeige Hilfe zu 'Vergrößern oder verkleinern Sie den Text der Zusammenfassung' an
Präsentationen

Vom gedruckten Gazetteer zum digitalen Ortsverzeichnis - Das Geschichtliche Ortsverzeichnis (GOV)

Anne Purschwitz1, Jesper Zedlitz2

1Martin-Luther Universität Halle-Wittenberg, Germany; 2Verein für Computergenealogie

Ortsnamen und geographische Räume wie auch ihre Positionierung spielen in der Geschichtswissenschaft eine wichtige Rolle. Vor diesem Hintergrund ist es häufig erforderlich Ortsnamen zu recherchieren, eine Lokalisierung und eine Visualisierung auf unterschiedlichem Kartenmaterial vorzunehmen. Mittlerweile stehen dafür eine Vielzahl von Tools zur Verfügung. Gerade in dem breiten verfügbaren Spektrum liegen Möglichkeiten aber auch Schwierigkeiten für Forscher*innen und interessierte Laien.

Die Besonderheiten historischer Raumzuordnungen beinhalten spezifische Herausforderungen bei der Aufbereitung, Präsentation und Recherche. Die Mehrheit der aktuell als Open-Access verfügbaren Ortsverzeichnisse berücksichtigt dieses ‚historische Werden‘ nur unzureichend bis gar nicht.

Das Geschichtliche Ortsverzeichnis des ‘Vereins für Computergenealogie’ stellt sich den Herausforderungen in der Modellierung von Zeit und Raum. Im GOV wurden dafür topologische Beziehungen modelliert, die im Unterschied zu Time-slices belastbarer sind. Entstanden ist ein hierarchisches Modell, das zwischen Siedlung und Administration trennt, beide Ebenen aber vielfältig miteinander in Beziehung setzen kann. Das GOV geht damit deutlich über bisherige Standards hinaus.



Automatisierte Extraktion und Klassifikation von Variantenschreibungen historischer Berufsbezeichnungen in seriellen Quellen des 16. bis 20. Jahrhunderts

Katrin Moeller, Jan Michael Goldberg

Martin-Luther-Universität Halle-Wittenberg, Germany

Berufsangaben kommen in sehr vielen historischen Quellen vor. Für eine Vielzahl von Forschungsgebieten bildet nicht nur die Standardisierung, sondern vor allem eine ordnende Klassifikation eine zentrale Voraussetzung zur tatsächlichen Analyse von Berufen nach verschiedenen möglichen Ordnungsprinzipien. Einen Ansatz bildet die „Ontologie der historischen Amts- und Berufsbezeichnungen (OhdAB)“. Der Vortag beschäftigt sich mit der automatisierten Zuordnung von Variantenschreibungen von Amts- und Berufsbezeichnungen zu den Berufsgattungsnamen dieses Klassifikationsansatzes. Im Mittelpunkt des Beitrags steht ein Algorithmus zur Identifizierung von Berufsbezeichnungen in strukturierten Quellen. Entwickelt wurde eine Vorgehensweise des Machine Learnings zur Erkennung von Variantenschreibungen. Diese besteht aus einem komplexen Workflow eines automatisierten Preprocessings zur Identifizierung bzw. Separierung der eigentlichen Berufsangaben und einer auf einem Algorithmus beruhenden Zuordnung unbekannter Varianten zur Klassifikation. Bei der Anwendung auf einen unbereinigten und stark heterogenen Datensatz des Vereins für Computergenealogie und eines korrigierten Trainingssets wurde eine Erkennungsrate von 75 Prozent der Berufsangaben mit 5 % fehlerhaften Zuordnungen ermittelt.



Anzeigen als Daten. Dynamisches Tagging und iterative Auswertung eines frühneuzeitlichen Intelligenzblattes

Ina Serif, Anna Reimann, Alexander Engel

Universität Basel, Switzerland

Das SNF-Projekt "Märkte auf Papier – das Basler Avisblatt 1729–1844" untersucht ein wöchentlich erschienenes vormodernes Anzeigenblatt, das einen erheblichen Teil des sozioökonomischen Austauschs in einer Schweizer Stadt über einen Zeitraum von 116 Jahren abdeckt. Es umfasst Angebote und Gesuche von Waren, Dienstleistungen, den Arbeits- und Immobilienmarkt, Geldverleih und andere Aspekte des sozialen und wirtschaftlichen Lebens. Die Quelle wurde digitalisiert und eine Datenbank mit hunderttausenden von Anzeigen aufgebaut. Um diese auswerten und analysieren zu können, wurden sie mit klassifizierenden Metadaten ergänzt. Anstatt zu versuchen, eine a priori, one-serves-all-Klassifizierung vorzunehmen, verwenden wir eine Strategie des algorithmischen Taggings mit dictionary-basierten R-Skripten. Diese können im Verlauf der Analyse dynamisch entwickelt werden, was zu einem iterativen Verfeinerungsprozess von Hypothesen und Heuristiken führt. Ein solcher Ansatz vermeidet die Erzeugung von Single-Use-Datensätzen oder Datenfriedhöfen und versteht damit sowohl Daten als auch deren Analyse als sich ständig weiterentwickelnd und voneinander abhängig.