About the Course
S DIGITAL-Datenschutz und statistische Geheimhaltungsverfahren (AMS, Teil I / II)
Fragen des Datenschutzes und der Sicherung der statistischen Geheimhaltung spielen spätestens seit dem Volkszählungsurteil des Bundesverfassungsgerichts im Jahr 1983 eine wichtige Rolle bei der Datenerhebung und bei der Veröffentlichung von Analyseergebnissen. Insbesondere in der amtlichen Statistik – aber genauso in der Forschung oder bei privaten Datenanbietern – werden Methoden der Sicherung statistischer Daten gegen Offenlegung (statistical disclosure control – SDC) eingesetzt, um die faktische Anonymität der erhobenen Daten sicherzustellen. Die Relevanz dieser Methoden nimmt mit der Digitalisierung und der dadurch einfacheren Erhebung und Verbreitung von Daten sowie dem steigenden Bedarf an Informationen seit längerem zu.
Im Seminar werden neben den rechtlichen und organisatorischen Rahmenbedingungen verschiedene SDC-Verfahren für unterschiedliche Datenarten diskutiert:
- Rechtliche Rahmenbedingungen und Datenschutz
- Stochastisch und deterministische Geheimhaltungsverfahren für Mikrodaten
- Pre- und posttabulare Verfahren für Häufigkeitstabellen
- Methoden für georeferenzierte Daten
- Veröffentlichung von synthetischen Daten
Das Seminarkonzept umfasst zum einen die selbstständige Aneignung der behandelten Methoden und die eigenständige Umsetzung exemplarischer Anwendungsbeispiele in R. Die Teilnehmenden werden dabei durch interaktive Skripte, Codebeispiele und weitere Materialien unterstützt.
Zum anderen ist ein kontinuierlicher Austausch zwischen den Studierenden sowie regelmäßige Webkonferenzen bzw. Präsenztermine mit dem Lehrenden (während der angekündigten Veranstaltungszeit) vorgesehen, in denen Fragen zu den bereitgestellten Materialien, zur Umsetzung in R sowie den Ergebnissen der Analysen diskutiert werden.
Die eingesetzten Anwendungen R und RStudio Desktop sind kostenlos und für alle gängigen Betriebssysteme verfügbar