Veranstaltungsdetail

S Methoden der Datenrepräsentation und Klassifikation (VSD, Teil II)

Ein der herausragenden Aufgaben der Statistik ist die Reduktion der Komplexität von Daten, um Muster und Regelmäßigkeiten überhaupt erkennbar zu machen. Zu diesem Zweck wurden verschiedene statistische Methoden entwickelt, um Untersuchungsobjekte zu klassifizieren und zu Gruppen zusammenzufassen.
Das Seminar behandelt fortgeschrittene statistische Klassifikationsverfahren und Verfahren zur Beschreibung von Ähnlichkeiten sowie deren rechentechnische Umsetzung mit dem Statistikprogramm R.

Die geplanten Themen der Veranstaltung sind:
• Ziele von Klassifikationsverfahren und Gütekriterien für Klassifikationen
• Abstandsmaße
• Multidimensionale Skalierung
• Hierarchische und nicht-hierarchische Clusteranalyseverfahren
• Modellbasierte Klassifikationsverfahren (Latente Klassenanalyse)
• Klassifikationsbäume und maschinelles Lernen
• Validierung von Klassifikationslösungen

Im Seminar werden Auswertungen mit der kostenlosen Open Source-Software „R“ (www.r project.org) durchgeführt. R ist eine flexible, freie Software zur Analyse von empirischen Daten, die nicht nur in weiten Teilen der akademischen Forschung verbreitet ist, sondern auch in vielen Bereichen der Wirtschaft Verwendung findet.

Voraussetzung für Studienachweise / Modulprüfungen
Studiennachweise können durch aktive Teilnahme und das Bearbeiten von Übungsaufgaben erworben werden. Die Modulprüfung umfasst zusätzlich die Anfertigung einer Hausarbeit.

Lehrende

Sebastian Jeworutzki

Termine

  • Montag, 10.10.2022 (1. Termin)
    14:00 bis 16:00 Uhr
    GD E2/208 CIP-Pool

Anmeldung

Bitte melden Sie sich in eCampus für die Veranstaltung an.