Conference Agenda
Overview and details of the sessions of this conference. Please select a date or location to show only sessions at that day or location. Please select a single session for detailed view (with abstracts and downloads if available).
|
Session Overview |
| Session | ||
Mittwoch, 2:3: Mittwoch, 2:3 – Named Entities
| ||
| Presentations | ||
Vornamen als Entität. Möglichkeiten und Herausforderungen bei der Entwicklung des historischen Vornamentools – hivoto Martin-Luther-Universität Halle-Wittenberg, Deutschland Im Rahmen des Vortrags soll das historische Vornamentool hivoto vorgestellt werden. Das Tool wurde als Service von NFDI4Memory durch die Task Area Data Connectivity am Historischen Datenzentrum Sachsen-Anhalt entwickelt. Das Vokabular umfasst etwa 98.000 Variantenschreibungen mit kontrollierten ihnen zugewiesenen Normbezeichnungen sowie dem wahrscheinlichen Geschlecht (sex category), das die Namen vermitteln. Es wird über FactGrid zum Download angeboten. Über diesen Datensatz können Vornamen zukünftig einheitlich normiert, mit Geschlechtszuweisungen oder ihren Uneindeutigkeiten (bei mehrfachen Vornamen) versehen und statistisch die Wahrscheinlichkeit des Geschlechts ermittelt werden. Im Zentrum des Vortrags stehen die zugrundeliegenden Überlegungen, die Methode und das Vorgehen bei seiner Erstellung. Darüber hinaus sollen Herausforderungen und Problemlagen erläutert sowie der Umgang mit diesen dargelegt werden. Ort zwischen Text und Daten 1Institut für vergleichende Städtegeschichte, Münster, Deutschland; 2Universität Münster In diesem Beitrag wollen wir Möglichkeiten explorieren, historische Orte als Untersuchungsgegenstände mit Hilfe ontologischer Analyse jenseits der typischerweisen vagen Auffassungen von ‘Ort’ zu erfassen. Unser Fokus liegt dabei auf der Modellierung von historischen Orten als Entitäten im Sinne von place-based information (Blaschke et al. 2018) – ohne dabei zu einseitig den Schwerpunkt auf historische Quellen in Form von Text und Daten über die Untersuchungsgegenstände zu legen. Skalierbare Erfassung buchbezogener Entitäten in Zeitungsinseraten des 18. Jahrhunderts: Das Basler ›Avisblatt‹ als Spiegel des vormodernen Buchmarkts 1Universität Basel, Switzerland; 2Technische Universität Darmstadt, Germany; 3Akademie der Wissenschaften und der Literatur Mainz, Germany Unser Vortrag stellt einen Ansatz zur Erfassung buchbezogener Entitäten in frühneuzeitlichen Zeitungsanzeigen im Basler ›Avisblatt‹ vor. Diese etwa 22000 Anzeigen enthalten häufig mehrere Buchtitel ohne standardisierte Separatoren. Um computergestützte Analysen für Einblicke in den lokalen Buchmarkt, Lesepraktiken und -interessen und Wissenszirkulation erst zu ermöglichen, ist eine strukturierte Extraktion der Buchtitel aus dem Anzeigentext essentiell. Erprobte Named-Entity-Regognition-Ansätze (NER) stoßen hierbei aufgrund von OCR-Fehlern und hoher orthographischer, stilistischer und formaler Varianz an ihre Grenzen. Zur automatischen XML-Annotation relevanter Entitäten (AUTHOR, TITLE, YEAR, ...) schlagen wir die Anwendung von Large Language Models vor, die eine gewisse Toleranz gegenüber historischen Sprachvarianten aufweisen. Die Nutzung eines lokalen, offenen Modells soll dabei möglichst viel Transparenz garantieren. Gleichzeitig werden durch die Annotation Trainingsdaten für die Entwicklung spezialisierter historischer NER-Verfahren generiert. Der resultierende strukturierte Datensatz von 20000 annotierten Anzeigen ermöglicht systematische Analysen frühneuzeitlicher Buchzirkulation und zeigt eine skalierbare Strategie für die systematische Öffnung historischer Textdaten für Analyse- und Trainingsverfahren. | ||
