Veranstaltungsdetail
Grundlagen der Datenanalyse und des Text Minings in R (Teil I, Modul DH-Methoden und Modul DH-Anwendung)
**BITTE BEACHTEN SIE: Diese Veranstaltung ist Teil I der Optionalbereichsmodule DH-Methoden und DH-Anwendung, um das jeweilige Modul abzuschließen müssen sie zusätzlich noch Teil II belegen (siehe Modulbeschreibung).** Textdaten sind überall: Auf Social-Media-Plattformen, in Nachrichtenartikeln, in Chats, der Werbung, in Plenarprotokollen. Die Auswertung dieser Daten ist heutzutage spannender denn je. Immer leistungsstärkere Computer und immer ausgefeiltere Algorithmen erlauben heute Analysen, die vor zehn Jahren noch undenkbar gewesen wären. Wenn Sie sich je gefragt haben, woher Google eigentlich weiß, welches Wort Sie als Nächstes in die Suchleiste tippen wollen, wie DeepL funktioniert oder welche Themen eigentlich die deutsche Presselandschaft in den letzten 20 Jahren dominiert haben: Text-Mining-Methoden liefern Ihnen eine Antwort. Der Kurs „Grundlagen der Datenanalyse und des Textminings mit R“ vermittelt Ihnen die Basics der wichtigsten Text-Mining-Methoden und soll Sie ermuntern, eigenständig große Textkorpora unter die Lupe zu nehmen. Grundlage der Veranstaltung ist die Statistiksoftware R, in die alle Teilnehmenden eine umfassende Einführung erhalten. Sie werden lernen, wie man Textdaten vorverarbeitet, wie Sie Themen in großen Textmengen identifizieren oder wie Sie mithilfe einfacher Algorithmen Wort- und Dokumentähnlichkeiten ermitteln können. Als Datenbasis dienen unter anderem große Zeitungskorpora, Bundestagsdebatten sowie Film- und Serienbeschreibungen. Themen des Kurses sind unter anderem: • Grundlagen von R und RStudio • Grundlagen des Text Minings (text selection, cleaning, editing) • Regular Expressions • Bag-of-Words-Analysen (Text Clustering, Topic Modeling, simple Text Classifiers) • Web Scraping Die Veranstaltung richtet sich an Studierende, die noch keine Erfahrung mit Text-Mining haben. Der Kurs vermittelt die Grundlagen des Statistikprogramms R sowie die Basics der wichtigsten Text-Mining-Konzepte und -Methoden.