Schnellere statistische Auswertung großer Datensätze
Freiburg, 09.07.2021
Mathematikerin Angelika Rohde entwickelt eine neue statistische Methodik zur Datenanalyse. Foto: privat
Mit zunehmender Digitalisierung werden immer größere Datenmengen generiert, zum Beispiel beim Surfen im Internet, bei der Sammlung naturwissenschaftlicher Daten durch Sensoren oder bei der Analyse von Zusammenhängen in der medizinischen Diagnostik. Durch ihre statistische Auswertung können Forschende beispielsweise Vorhersagen treffen und passende Handlungsoptionen ableiten. Die herkömmlich verwendeten Verfahren und Arbeitsschritte sind aber nicht immer optimal aufeinander abgestimmt oder lassen sich aufgrund äußerer Faktoren wie beispielsweise eine limitierte Rechenleistung nicht umsetzen. Die Forschungsgruppe „Mathematische Statistik im Informationszeitalter – Statistische Effizienz und rechentechnische Durchführbarkeit“ um Sprecherin Prof. Dr. Angelika Rohde vom Mathematischen Institut der Universität Freiburg nimmt sich dem Problem an und möchte die statistische Auswertung großer Datenmengen effizienter gestalten. Die Deutsche Forschungsgemeinschaft (DFG) fördert die Gruppe in den kommenden vier Jahren mit insgesamt 2,1 Millionen Euro. Der österreichische Fonds zur Förderung der wissenschaftlichen Forschung (FWF) finanziert zusätzlich zwei Doktorandenstellen.
In jedem Schritt die maximale Menge an statistischer Information
„Unser Ziel ist es, eine umfassende statistische Methodik zu entwickeln, die den Anforderungen der modernen Datenanalyse gerecht wird“, sagt Rohde. Dazu entwickelt das Team schnelle Verfahren zur statistischen Datenauswertung und studiert alle nacheinander ablaufenden Datenverarbeitungsschritte gleichzeitig, um bestmögliche statistische Evidenz zu ermöglichen. „Statistische Garantien sind nämlich nur dann gültig, wenn die Verteilungseigenschaften der vorverarbeitenden Daten bei der Weiterverarbeitung berücksichtigt werden“, erklärt Rohde. Dabei möchten die Forschenden in jedem Verarbeitungsschritt die maximale Menge an statistischer Information extrahieren. Das führe im Gesamten zu einer minimalen Anzahl von Verarbeitungsschritten, womit die statistische Datenanalyse effizienter und auch für große Mengen rechnerisch umsetzbar werde.
Neben Rohde sind Prof. Dr. Alexandra Carpentier von der Universität Potsdam, Prof. Dr. Holger Dette von der Ruhr-Universität Bochum, Prof. Dr. Johannes Moritz Jirak und Assistenzprofessor Dr. Lukas Steinberger von der Universität Wien/Österreich, Prof. Dr. Alexander Meister von der Universität Rostock, Prof. Dr. Axel Munk von der Georg-August-Universität Göttingen und Prof. Dr. Markus Reiß von der Humboldt-Universität zu Berlin an der Forschungsgruppe beteiligt.
Kontakt:
Prof. Dr. Angelika Rohde
Mathematisches Institut
Albert-Ludwigs-Universität Freiburg
Tel.: 0761/203-98659
E-Mail: angelika.rohde@stochastik.uni-freiburg.de
Franziska Becker
Presse- und Öffentlichkeitsarbeit
Albert-Ludwigs-Universität Freiburg
Tel.: 0761/203-54271
E-Mail: franziska.becker@pr.uni-freiburg.de