Datenschätze heben
Freiburg, 08.03.2017
Einkaufen, Twittern, Bahnfahren, Kaufen von Theatertickets – der moderne Mensch hinterlässt täglich eine riesige Datenspur. Gesammelt werden diese Informationen unter anderem von Unternehmen. Doch die nutzen die Daten oft nicht in dem Maße, wie sie es könnten.
„Hier liegt ein riesiger Datenschatz, den man allerdings nur heben kann, wenn man ihn zu lesen versteht", sagt Dr. Christoph Gebele, Leiter Marketing und Vertrieb der Firma Geospin. Er ist einer von fünf Wissenschaftlern der Universität Freiburg, die das Spin-off im März 2016 gegründet haben. „90 Prozent aller Unternehmensdaten haben einen räumlichen Bezug", heißt es auf der Website von Geospin. Die Kunst der jungen Existenzgründer: Sie können zum Beispiel die von Unternehmen gesammelten Daten so analysieren, dass die Firmen erfahren, wo sich – rein geographisch gesehen – neue Filialen rentieren würden. Würde also ein fiktives Unternehmen für Kaugummiautomaten wissen wollen, wo es idealerweise die nächsten Automaten aufstellen sollte, damit diese viel Umsatz bringen, schauen sich die Experten von Geospin an, wie viele Kaugummis an den bisherigen Automaten verkauft wurden.
Wo sind Carsharing-Parkplätze sinnvoll, wo rentieren sich Kaugummiautomaten? Antworten auf solche Fragen lassen sich aus raumbezogenen Daten ableiten.
Fotos: Thomas Kunz
Darüber hinaus ziehen sie weitere Faktoren zu Rate. „Wir nutzen zusätzlich zu den von dem Unternehmen zur Verfügung gestellten Daten so genannte Open Data", erklärt Dr. Tobias Brandt, Experte für Analytik und Statistik bei Geospin. Das sind frei verfügbare, in der Regel öffentlich zugängliche Daten, unter anderem Zensus-, Wetter- oder Verkehrsdaten, die oft ebenfalls einen Raumbezug aufweisen. Auch Twitter-Daten beziehen Brandt und seine Kollegen ein. So kommt das Team dann womöglich zu dem Schluss, dass Kaugummiautomaten vor allem dort gefragt sind, wo es besonders viele Kinos gibt. Vielleicht spielt das aber auch gar keine Rolle, und die aufgestellten Kaugummiautomaten werden besonders häufig an heißen Tagen aufgesucht.
„Wir arbeiten mit erklärenden und vorhersagenden Verfahren und helfen den Firmen so, einen maximalen Nutzen aus den gesammelten Daten zu ziehen", sagt Gebele. Das Konzept wurde vom Bundesministerium für Wirtschaft und Energie und der Initiative „Existenzgründungen aus der Wissenschaft" gefördert, und es kommt an: Die Dienste von Geospin sind inzwischen gefragt, Aufträge kommen aus Deutschland und der Schweiz.
Die Idee einer Unternehmensgründung entstand auf einem zweiwöchigen Roadtrip nach einer Konferenz in Neuseeland. „Wir waren immer schon von unternehmerischem Geist beseelt und wollten das jetzt einfach mal ausprobieren", sagt Gebele. Zuvor war ein Projekt, bei dem die Wissenschaftler mit einem deutschen Carsharing-Anbieter kooperiert hatten, auf sehr gute Resonanz gestoßen. Das könne als Unternehmensidee funktionieren, dachten sie sich.
Statistische Modelle entwickeln
„Viele Firmen verfügen über Unmengen betriebsinterner Kennzahlen, die sie im Laufe der Jahre sammeln und speichern. Allerdings fehlt es oft an Know-how, was sich aus diesen Daten alles erkennen ließe, wenn man sie unter bestimmten Gesichtspunkten und mit dem richtigen Werkzeug betrachtet", sagt Brandt. Das Werkzeug sind bestimmte Analysetools, die zum Beispiel helfen, die Daten nach den gewünschten Kriterien zu bereinigen und zueinander in Bezug zu setzen. Auf dieser Grundlage entwickeln die Experten von Geospin statistische Modelle. „Das funktioniert umso besser, je genauer ein Unternehmen schon weiß, was genau es wissen möchte", sagt Brandt. „Aber wir können auch mit einem offenen Ansatz herangehen und schauen, was wir in den Daten finden."
Ein Markenzeichen des Start-ups ist die aufwendige, ästhetisch anspruchsvolle und klar verständliche Visualisierung der Daten, insbesondere in geographischen Karten. So haben zum Beispiel die Vorhersage und anschließende Visualisierung der Fahrzeugnachfrage dabei geholfen, dass das besagte Carsharing-Unternehmen bei einer geplanten Gebietserweiterung von vornherein die erfolgversprechendsten Ecken der Stadt anpeilen konnte – die Firma sparte sich so teure Testphasen.
Die ästhetisch anspruchsvolle und klar verständliche Visualisierung von Daten, insbesondere in geographischen Karten, zählt zu den Markenzeichen von Geospin.
Grafik: Geospin
„Natürlich sind der Idee auch Grenzen gesetzt", sagt Prof. Dr. Dirk Neumann, der die Professur für Wirtschaftsinformatik an der Universität Freiburg innehat und die Ausgründung unterstützt hat. Ihm ist es zu verdanken, dass die fünf Firmengründer kostenlos an einem Business-Development-Lehrgang teilnehmen durften. „Das, was möglich ist, steht und fällt mit dem vorhandenen Material. In welchem Format liegen die Daten vor? Und sind überhaupt statistische Muster vorhanden, aus denen sich Rückschlüsse und Vorhersagen ableiten lassen?" Je nachdem, wie gut und wie umfangreich die Daten seien, könnten dann auch zuverlässige Prognosen getroffen werden. Dabei ließen sich meist mehrere Möglichkeiten im Stil von „Was wäre, wenn?" durchspielen. „Geospin verbindet maschinelles Lernen mit ökonometrischen Verfahren", sagt Neumann. Was den Firmengründern hilft, ist ihre Erfahrung mit Daten. „Wir sehen inzwischen recht schnell, für welche Fragestellung sich welches Verfahren eignet oder eben nicht", sagt Gebele.
Gemeinsame Basis für alle Daten
Bevor das Geospin-Team einen Datensatz auf die in ihm steckenden Geheimnisse untersucht, sind einige komplexe Arbeitsschritte nötig. Der scheinbar einfachste ist oft herausfordernd: Wie kommen die Daten vom Unternehmen zu Geospin? „Das sind ja meist sensible Kundendaten, die verschicken sie nicht mal eben so per E-Mail", erklärt Gebele. Als Nächstes muss das Team die Daten auf Sauberkeit überprüfen. Das heißt: Gibt es Lücken? Fehlerhafte Eingaben? Auffällige Ausreißer in die eine oder andere Richtung? Dann wird geschaut, in welchen Dimensionen die Daten sich bewegen. Können Aussagen über Stunden, Tage, Wochen getroffen werden? Handelt es sich um Punkt- oder Streckendaten? Zeiten? Beträge? Gebiete? „Dieses so genannte Screenen nimmt eine Menge Zeit in Anspruch, doch es ist notwendig. Nur wenn wir alle vorhandenen Daten auf eine Basis bringen, ist eine zuverlässige Analyse mit Aussagekraft möglich", sagt Brandt.
Das Analysieren von Daten kann jedoch auch aufs Glatteis führen. „Ein Großteil der Daten in einem Datensatz ist überflüssig und nicht relevant für das, was man herausfinden möchte", so Gebele. „Hier besteht die Gefahr, dass man schnell Zusammenhänge sieht, die aber nicht zwingend kausal sind. So etwas wollen wir natürlich vermeiden."
Ist die Analyse einmal gelungen, kann die Zusammenarbeit mit dem Unternehmen auf eine dauerhafte Partnerschaft ausgedehnt werden. „Wir wollen dabei helfen, Probleme zu lösen, die eine bestimmte Relevanz haben", betont Brandt. „Deswegen sind wir ja in der angewandten Wissenschaft unterwegs."
Claudia Füßler