Conference Agenda
Overview and details of the sessions of this conference. Please select a date or location to show only sessions at that day or location. Please select a single session for detailed view (with abstracts and downloads if available).
|
Session Overview |
| Session | ||
Mittwoch, 3:2: Mittwoch, 3:2 – Doctoral Consortium
| ||
| Presentations | ||
Automatisierte Datenextraktion im Rahmen des FWF-Projekts ‚Digitale Erschließung des Schematismus‘ TU Graz, Österreich Die bestehende Datenextraktion im FWF-Projekt ‚Digitale Erschließung des Schematismus‘ liefert eine sehr akkurate Trennung der Überschriften und Paragraphen sowie eine hochpräzise OCR des komplexen Druckwerks dieses umfangreichen Beamtenalmanachs der Habsburgermonarchie. Da dies allerdings nicht ausreicht um die implizite Baumstruktur vollständig in eine vernetzte Personendatenbank zu überführen, soll meine Dissertation die Datenextraktion weiter vorantreiben. Unter der Prämisse, dass aufeinander aufbauende Informationslayer erzeugt werden, sollen zunächst alle visuellen Merkmale einer Seite erfasst werden, bevor über NER der Textinhalt semantisch analysiert und aus diesen Informationen eine Graphdatenbank erzeugt wird. Mit dem Ziel einer granularen Disambiguierung der Überschriftenstile, wird aktuell das Finetuning von Transformer-Modellen durch Contrastive Learning vorbereitet. Diese Modelle sollen dann für paarweise Vergleiche sder Überschriften herangezogen werden. Ziel ist eine möglichst genaue Zuordnung jeder einzelnen extrahierten Person zu den entsprechenden Stellen und den jeweils übergeordneten Verwaltungseinheiten. Zwischen Struktur und Überraschung – Gestaltung explorativer Suchfunktionen für digitale Korpora Technische Universität Darmstadt, Deutschland Die Arbeit beschäftigt sich mit der Gestaltung explorativer Suchfunktionen für digitale Korpora. Ausgangspunkt ist das Spannungsfeld zwischen gezielter Suche und dem offenen, neugierigen Stöbern. Konventionelle Suchsysteme setzen meist voraus, dass Nutzer:innen wissen, wonach sie suchen – was explorative Recherchen behindert. Die vorgestellte Lösung nutzt Methoden des Graph Mining und der Community Search, um semantisch bedeutungsvolle Netzwerke aus Korpus-Metadaten zu erzeugen. Damit wird eine Suchweise ermöglicht, die sowohl mit als auch ohne Suchbegriffe auskommt. Das Verfahren soll Serendipität fördern und dabei transparente, reproduzierbare Suchergebnisse liefern. Ziel ist neben der Vorstellung einer eigens entwickelten algorithmischen Architektur ein strukturierter Vergleich mit etablierten Suchsystemen. Perspektivisch lässt sich der Ansatz auch auf Objekte der materiellen Kultur übertragen. Die Arbeit soll darüber hinaus Diskussionsgrundlage für die Rolle von Suchsystemen im Forschungsprozess schaffen sowie die Rolle deterministischer Verfahren im Vergleich zu jenen des maschinellen Lernens. | ||
