DHd2022
DHd2022. 8. Jahrestagung des Verbands
»Digital Humanities im deutschsprachigen Raum«
07. - 11. März 2022 | Potsdam
Veranstaltungsprogramm
Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.
|
Sitzungsübersicht |
Sitzung | ||
V7_1: Maschinelles Lernen in der Literaturwissenschaft
Zoom-Kenncode: 03049283
| ||
Präsentationen | ||
Evaluating Hyperparameter Alpha of LDA Topic Modeling Universität Trier, Germany As a quantitative text analytic method, Latent Dirichlet Allocation (LDA) topic modeling has been widely used in Digital Humanities in recent years to explore numerous unstructured text data. When topic modeling is used, one has to deal with many parameters that can influence the result of the modeling such as the hyperparameter Alpha and Beta, topic number, document length, number of iterations of model-updating. The present research has evaluated the influence of hyperparameter Alpha in topic modeling on a newspaper corpus and a literary text corpus from two perspectives, document classification and topic coherence. The results show that one should avoid training topic models with setting Alpha of each topic higher than 1 if one wants to ensure better topic modeling based document classification and more coherent topics. Adapting Coreference Algorithms to German Fairy Tales Universität Würzburg, Germany Coreference Resolution is an important task in natural language processing that enables the combination of locally extracted information on a document level context or even across different documents, e.g. to display the relations between characters of a novel in a character network. In this work, we adapt a rule-based and an end-to-end deep learning algorithm which have previously been used on German novel fragments to the domain of German fairy tales and examine their performance. We find that the adaptation can improve their performance considerably, especially that of the deep learning algorithm. Verwendung von Wissensgraphen zur inhaltlichen Ergänzung kleinerer Textkorpora Julius-Maximilians-Universität Würzburg Die Korpuserstellung ist einer der essenziellsten Schritte um ein Forschungsvorhaben im Bereich der Digital Humanities durchzuführen. Vor allem für speziellere Domänen (etwa bei der Analyse von Subgenres oder Dialekten) ist allerdings häufig nicht genügend Material verfügbar, um Methoden aus dem NLP Bereich nachnutzen zu können, da diese Gigabytes an Text verlangen. Dieser Aufsatz zeigt wie Wissensgraphen, welche zum Beispiel aus Wörterbüchern erstellt werden können, helfen, kleinere Textkorpora aufzuwerten. In dem hier durchgeführten Experiment wird ein auf 20 Megabytes trainiertes FastText Modell mit den Informationen aus GermaNet angereichert. Das resultierende Modell weist die selbe Performanz auf wie ein einfaches FastText Modell, welches auf etwa dreimal soviel Daten trainiert wurde. |
Impressum · Kontaktadresse: Datenschutzerklärung · Veranstaltung: DHd2022 |
Conference Software - ConfTool Pro 2.6.146 © 2001–2023 by Dr. H. Weinreich, Hamburg, Germany |