About the Course
Computerlinguistische Methoden für (historische) Texte (DH Methoden)
BITTE BEACHTEN SIE: Dieses Seminar kann von Studierenden der Germanistik nur im Rahmen der Fachlehre, nicht über den Optionalbereich belegt werden.
Waren die Digital Humanities (DH) früher noch eine Nische zwischen Computerlinguistik, Philologie, Bibliothekswissenschaften und Informatik, so werden ihre Forschungsfragen mittlerweile von vielen wissenschaftlichen Disziplinen geteilt. Zusammenfassend befassen sich die DH mit der Anwendung von computergestützten Verfahren auf mehrheitlich historischen Texte und Datenträgern. Diese Textdaten mussten aber nicht nur digitalisiert werden, sondern erst einmal die Jahrtausende überdauern.
Das Seminar baut auf den Herausforderungen auf, mit denen sich Geisteswissenschaftler schon immer beschäftigen mussten, nämlich die Bewahrung, Analyse und Verbreitung des kulturellen Erbes. Mithilfe der Einführung von Techniken des Natural Language Processing (NLP) wird gezeigt, wie das wissenschaftliche Arbeiten in den Geisteswissenschaften, durch die Übersetzung kulturellen Erbes in einen digitalen Raum, unterstützt werden kann. Es zeigt auch, wie computergestützte Methoden dazu beitragen können, neue Forschungsmöglichkeiten in den Geisteswissenschaften zu etablieren.
Das Seminar fokussiert auf die Anwendung Computerlinguistischer Methoden auf (historische) Texte und damit ein Teilgebiet der Digital Humanities/Computerlinguistik.
Themen: Handwritten Text Recognition, Text Preprocessing, Corpus Creation, Digital Libraries, Text Classification
Formerly a niche between computational linguistics, philology, library and computer science, Digital Humanities (DH) research questions and problems today are shared by many scientific disciplines. In short, DH focuses on applying computational techniques to mainly historical data. However, these textual data not only needed to be digitized at some point, it first needed to survive the millennia.
This seminar builds upon the challenges that humanities scholars have dealt with for centuries, namely the preservation, analysis and dissemination of cultural heritage. By presenting the development of Natural Language Processing (NLP) techniques in parallel, it shows how scholarly work can be supported by translating cultural heritage into a digital space. It also shows how computational methods can help to open up new research possibilities in the humanities.
Voraussetzungen für die CP-Vergabe/ Modus:
- Regelmäßiges lesen der vorrangig englischsprachigen Literatur
- Aktive Mitarbeit und Teilnahme an Diskussionen
- Präsentation mindestens eines Papers mit Diskussion
Nach erfolgreicher Teilnahme am Seminar sollten die Studierenden:
- die Hauptziele der Digital Humanities kennen
- einige Anwendungsgebiete der NLP kennen
- Basistechnologien der NLP kennen und kategorisieren können
- verschiedene Methoden zur Digitalisierung und Analyse von digitalen Texten kennen
Themen-Auswahl:
- Einführung in die NLP (morphological and spelling similarity, change of meaning)
- Einführung in die DH (digitization, fragments, etc.)
- Pre-processing (segmentation, tokenization, morphological analysis, treebanking, spelling and cognate similarity)
- Von Inschriften zur Digitalen Bibliothek/ zum Corpus
Lehrende
Dr. rer. nat. Maria Berger
Termine
Anmeldung
Bitte melden Sie sich in eCampus für die Veranstaltung an.