Förderdaten Berlin; Recherche-Tool; Senat Finanzen; Technolgiestiftung; Open Data
© Marian Weyo/Shutterstock.com

Wo fließen die Milliarden hin?

Recherche-Instrument nutzt Informationen der Berliner Senatsverwaltung, um georeferenziert darzustellen, wann welche Subventionen an wen gegangen sind

„Zuwendungsdaten“ sind solche Informationen, die zeigen, welche Organisationen und Unternehmen öffentliche Fördermittel beziehen. Die Berliner Senatsverwaltung für Finanzen stellt diese Daten auf ihrer Homepage ins Netz. Mit einer Suchfunktion lassen sich einzelne Subventionen gut nachvollziehen. Allerdings schafft die Website keinen Überblick, wann welche Mittel über die letzten Jahre eigentlich an wen und welchen Stadtteil geflossen sind. Nun gibt es ein interaktives Tool, das die offenen Daten nutzt.

Es geht immerhin um rund 73.500 Förderungen aus den Jahren 2009 bis 2017. Die Technologiestiftung Berlin hat auf Grundlage dieser offenen Daten eine interaktive Plattform gebaut, die gleichermaßen eine ausführliche Darstellung sowie einen schnellen Überblick durch eine georeferenzierte Visualisierung bietet.

Auf „nachhaltige“ Datensätze bauen

Neben den eigentlichen Zuwendungsdaten sei es deshalb wichtig, auch an die räumlichen Daten zu gelangen, unterstreicht Dr. Sebastian Meier, Lead Data Scientist im Ideation & Prototyping Lab der Stiftung. Dafür braucht es Adressdaten die sich an den lokalen offiziellen Standards orientieren: „In Berlin liegen diese im sogenannten „Regionalen Bezugssystem“, kurz RBS.“ Die Datensätze sollten ihre Struktur langfristig nicht ändern, es brauche auch historische Daten, die nicht gelöscht werden. „Hilfreich ist zudem, wenn standardisiertes Vokabular bei der Vergabe der Förderungen bzw. bei deren Dokumentation genutzt wird.“  

Dr. Sebastian Meier ist Lead Data Scientist im Ideation & Prototyping Lab der Technologiestiftung Berlin.
© Technologiestiftung Berlin

Fehler herausfiltern

Wie bei den meisten Daten-Projekten muss ein Großteil der Zeit darauf verwendet werden, Daten zu säubern, zu verschneiden und zu optimieren. Im Berliner Datensatz waren etwa die Namen der Firmen, die Fördergelder erhalten haben, im Rahmen von Freitext-Feldern anzulegen. „Dies bedeutet, dass Mitarbeiter*innen die Namen manuell eingetragen haben – dabei kann es verständlicher Weise zu Fehler kommen“, so Meier. „Hierzu haben wir ein Programm geschrieben, um ähnliche Schreibweisen zu identifizieren und mit der dominanten Schreibweise teilautomatisiert zu korrigieren.“ Das sei viel Fleißarbeit, brauche Erfahrung im Umgang mit Daten.

»

Hilfreich ist, wenn standardisiertes Vokabular bei der Vergabe der Förderungen bzw. bei deren Dokumentation genutzt wird.

«

Innerhalb weniger Wochen umzusetzen

Das System basiert auf den Open Source-Visualisierungs- und Datenbibliotheken „D3“ und „CrossFilter“, mit denen die Technologiestiftung die Anwendung spezifisch für diesen Einsatzzweck entwickelt hat. „Da wir ein großes Interesse hatten, alle Datenpunkte der knapp 70.000 Förderprojekte gleichzeitig anzuzeigen und eine flüssige Interaktion zu gewährleisten, musste viel Zeit in die Optimierung der Anwendung gesteckt werden.“ Demnach braucht es zwar Fachleute für Daten, Visualisierung und Webentwicklung, diese können dann aber ein Projekt in dieser Größe innerhalb weniger Wochen umsetzen.

Wohin und an wen fließen die Fördergelder? Mit dem Recherche-Instrument der Technologiestiftung Berlin können Gesellschaft, Wirtschaft und Verwaltung die Beihilfen des Landes genauer unter die Lupe nehmen.
© Christian Draghic / Shutterstock.com

Offene Lizenz – für andere Behörden verfügbar

Wie auch die anderen Anwendungen, die im „Ideation & Prototyping Lab“ der Technologiestiftung entwickelt werden, steht die Software unter einer offenen Lizenz zur Verfügung. Das heißt, bundesweit können Behörden die Anwendung kostenlos für ihre Zwecke weiternutzen. Zeitlicher bzw. finanzieller Aufwand fällt danach aber für die Aufbereitung der Daten an: „Sobald die Daten dann in einem entsprechenden Format vorliegen, kann die Anwendung auch ​​von anderen Städten genutzt werden“, erklärt Meier.

»

Wir haben zuvor auch mit vielen Akteuren aus der Verwaltung gesprochen, um die genauen Bedarfe auch auf Behördenseite zu erfahren.

«

Mit Reaktionen rechnen

Nicht nur die Medien, sondern auch interessierte Bürger und Organisationen aus der Zivilgesellschaft können nunmehr auf ein einfach gehaltenes Recherche-Instrument zugreifen, das anschauliche Ergebnisse liefert. Laut Technologiestiftung hat es deshalb viel positives Feedback gegeben. „Wir sind uns bewusst, dass dieses Werkzeug im Vergleich – etwa zu unserer Kita-Suche oder der Anwendung zur Badegewässerqualität – ein nicht ganz so breites Publikum anspricht“, sagt Meier. Trotzdem sei gerade mit diesem Projekt ein Schritt in Richtung mehr Transparenz getan, weil es Strukturen sichtbar macht, die für unser Zusammenleben konstitutiv sind. So werde deutlich, wie sich etwa die Schwerpunkte der Berliner Förderpolitik mit den Jahren verändert haben. „Bei genauem Hinschauen sieht man z. B. klare gesellschaftliche und politische Trends bei der Vergabe von Förderthemen z.B. in den Bereichen 'Diskriminierung' und 'Tierschutz' “.

Open Data erfolgreich umsetzen
Kita-Suche Berlin

Open Data erfolgreich umsetzen

10 Praxistipps der Berliner Open Data Informationsstelle (ODIS)

Intensive Kooperation mit Senat und Bezirken

„Wir haben zuvor auch mit vielen Akteuren aus der Verwaltung gesprochen, um die genauen Bedarfe auch auf Behördenseite zu erfahren.“ Mit einer Vielzahl der Berliner Behörden auf Senats- und Bezirksebene pflegen Meier und seine Kolleg*innen und Kollegen schon seit längerer Zeit einen intensiven Austausch. Erst im Mai 2018 eröffnete die Technologiestiftung mit Unterstützung der Berliner Senatsverwaltung für Wirtschaft, Energie und Betriebe die „Open Data Informationsstelle“ (ODIS). Seither können sich Mitarbeiterinnen und Mitarbeiter aus allen Berliner Behörden an dieses Büro wenden, wenn sie Fragen oder Probleme haben, Daten überhaupt zu finden, aufzubereiten oder bereitzustellen.

Sich des Datenschatzes bewusst werden

„Auch jetzt hatte die Senatsverwaltung für Wirtschaft, Energie und Betriebe wieder Zeit für uns“, so Meier. „Dadurch waren wir in der Lage, vorab einen Einblick in die Berliner Förderlandschaft zu gewinnen und uns selbst auch erst einmal der Bedeutung dieser Daten für das Land und die Verwaltung bewusst zu werden.“ Durch diese enge Zusammenarbeit seien die Daten letztlich schneller analysiert und durch die Visualisierungen zudem sehr effektiv aufbereitet worden.  

Mehr zum Thema „Open Data in der Verwaltung“: