Veranstaltungsdetail

S Große Datensätze: Datenbanken (AMS, Teil II)

Relevante und reproduzierbare statistische Analyseergebnisse erfordern zuverlässige statistische Algorithmen und nachvollziehbare Datentransformationen und -selektionen. Für die Analysearbeit sind wiederum effiziente, zuverlässige und möglichst zeitsparende Verfahren unerlässlich. Im Seminar werden zunächst einige der wichtigsten Problem- bereiche anhand von Beispielen identifiziert: Probleme der endlichen Darstellung von reellen Zahlen und daraus folgende Rundungs- und Approximationsfehler, Verwendung ineffizienter Algorithmen, ineffiziente Speicherung von Daten und ineffizienter Zugriff, sowie ineffiziente Dokumentationsprozesse. In all diesen Bereichen sind oft und ohne großen Aufwand erhebliche Präzisionssteigerungen und Zeitgewinne gegenüber Standardverfahren erzielbar, so dass selbst kleine Projekte spürbar von entsprechenden Techniken profitieren. Im Einzelnen werden behandelt:
- Rundungs- und Approximationsfehler und deren Vermeidung
- Rechnen mit Zahlen unterschiedlicher Präzision
- spärlich besetzte Matrizen
- rekurrente Algorithmen und "exakte" Verfahren
- Datenhaltung: Speicherverwaltung und schneller Zugriff/schnelle Transformation; Datenbanken

Leistungsnachweise:
Übungen am Rechner (Studiennachweis) bzw. Bearbeitung von Übungsaufgaben.


Lehrende

Prof. Dr. Ulrich Pötter

Termine

Anmeldung

Bitte melden Sie sich in eCampus für die Veranstaltung an.