Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Nur Sitzungen am Veranstaltungsort 
 
 
Sitzungsübersicht
Sitzung
V7_1: Maschinelles Lernen in der Literaturwissenschaft
Zeit:
Freitag, 11.03.2022:
11:15 - 12:45

Chair der Sitzung: Christof Schöch, Universität Trier
Virtueller Veranstaltungsort: DHd2022 Zoom Freitag 1

Zoom-Kenncode: 03049283

Zeige Hilfe zu 'Vergrößern oder verkleinern Sie den Text der Zusammenfassung' an
Präsentationen

Evaluating Hyperparameter Alpha of LDA Topic Modeling

Keli Du

Universität Trier, Germany

As a quantitative text analytic method, Latent Dirichlet Allocation (LDA) topic modeling has been widely used in Digital Humanities in recent years to explore numerous unstructured text data. When topic modeling is used, one has to deal with many parameters that can influence the result of the modeling such as the hyperparameter Alpha and Beta, topic number, document length, number of iterations of model-updating. The present research has evaluated the influence of hyperparameter Alpha in topic modeling on a newspaper corpus and a literary text corpus from two perspectives, document classification and topic coherence. The results show that one should avoid training topic models with setting Alpha of each topic higher than 1 if one wants to ensure better topic modeling based document classification and more coherent topics.



Adapting Coreference Algorithms to German Fairy Tales

David Schmidt, Markus Krug, Frank Puppe

Universität Würzburg, Germany

Coreference Resolution is an important task in natural language processing that enables the combination of locally extracted information on a document level context or even across different documents, e.g. to display the relations between characters of a novel in a character network. In this work, we adapt a rule-based and an end-to-end deep learning algorithm which have previously been used on German novel fragments to the domain of German fairy tales and examine their performance. We find that the adaptation can improve their performance considerably, especially that of the deep learning algorithm.



Verwendung von Wissensgraphen zur inhaltlichen Ergänzung kleinerer Textkorpora

Thora Hagen

Julius-Maximilians-Universität Würzburg

Die Korpuserstellung ist einer der essenziellsten Schritte um ein Forschungsvorhaben im Bereich der Digital Humanities durchzuführen. Vor allem für speziellere Domänen (etwa bei der Analyse von Subgenres oder Dialekten) ist allerdings häufig nicht genügend Material verfügbar, um Methoden aus dem NLP Bereich nachnutzen zu können, da diese Gigabytes an Text verlangen. Dieser Aufsatz zeigt wie Wissensgraphen, welche zum Beispiel aus Wörterbüchern erstellt werden können, helfen, kleinere Textkorpora aufzuwerten. In dem hier durchgeführten Experiment wird ein auf 20 Megabytes trainiertes FastText Modell mit den Informationen aus GermaNet angereichert. Das resultierende Modell weist die selbe Performanz auf wie ein einfaches FastText Modell, welches auf etwa dreimal soviel Daten trainiert wurde.



 
Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: DHd2022
Conference Software - ConfTool Pro 2.6.143
© 2001–2022 by Dr. H. Weinreich, Hamburg, Germany