Veranstaltungsdetail
S Große Datensätze: Datenbanken (AMS, Teil II)
Relevante und reproduzierbare statistische Analyseergebnisse erfordern zuverlässige statistische Algorithmen und nachvollziehbare Datentransformationen und -selektionen. Für die Analysearbeit sind wiederum effiziente, zuverlässige und möglichst zeitsparende Verfahren unerlässlich. Im Seminar werden zunächst einige der wichtigsten Problem- bereiche anhand von Beispielen identifiziert: Probleme der endlichen Darstellung von reellen Zahlen und daraus folgende Rundungs- und Approximationsfehler, Verwendung ineffizienter Algorithmen, ineffiziente Speicherung von Daten und ineffizienter Zugriff, sowie ineffiziente Dokumentationsprozesse. In all diesen Bereichen sind oft und ohne großen Aufwand erhebliche Präzisionssteigerungen und Zeitgewinne gegenüber Standardverfahren erzielbar, so dass selbst kleine Projekte spürbar von entsprechenden Techniken profitieren. Im Einzelnen werden behandelt:
- Rundungs- und Approximationsfehler und deren Vermeidung
- Rechnen mit Zahlen unterschiedlicher Präzision
- spärlich besetzte Matrizen
- rekurrente Algorithmen und "exakte" Verfahren
- Datenhaltung: Speicherverwaltung und schneller Zugriff/schnelle Transformation; Datenbanken
Leistungsnachweise:
Übungen am Rechner (Studiennachweis) bzw. Bearbeitung von Übungsaufgaben.
- Rundungs- und Approximationsfehler und deren Vermeidung
- Rechnen mit Zahlen unterschiedlicher Präzision
- spärlich besetzte Matrizen
- rekurrente Algorithmen und "exakte" Verfahren
- Datenhaltung: Speicherverwaltung und schneller Zugriff/schnelle Transformation; Datenbanken
Leistungsnachweise:
Übungen am Rechner (Studiennachweis) bzw. Bearbeitung von Übungsaufgaben.