Ein ganz normaler Morgen in Berlin: Wir werfen einen Blick auf die Wetter-App, prüfen die Abfahrtszeiten unseres Busses und suchen schnell eine Adresse für den Paketversand. Hinter diesen alltäglichen Momenten steckt eine unsichtbare, aber unverzichtbare Ressource: offene Daten. Doch was sind offene Daten überhaupt? Und wie profitieren Bürger:innen, die Wirtschaft und die Verwaltungsdigitalisierung davon, dass Städte ihre Daten offen und verständlich machen?
In Berlin sorgt unter anderem die Open Data Informationsstelle (ODIS) für freien Zugang zu städtischen Daten. Lisa Stubert (Bereichs- und Projektleitung), Klemens Maget (Wissensvermittlung & Kommunikation), Hans Hack (Datenvisualisierung & Programmierung), Anna Meide (Datenvisualisierung & Konzeptentwicklung) und Max Eckert (Data Scientist) berichten uns von ihrer Arbeit mit offenen Daten. Das Team erklärt, wie Datenvisualisierungen neue Diskurse in Gang setzen können, welche Herausforderungen bei der Arbeit mit offenen Daten entstehen und wohin offene Daten Berlin noch führen können.
Was sind offene Daten und wo liegen ihre größten Vorteile?
Lisa: Daten werden oft für einen speziellen Zweck erhoben. Wenn diese Daten als Open Data veröffentlicht werden, verlassen sie ihr ursprüngliches Nutzungsumfeld. Das ermöglicht neue Perspektiven und Ideen für die Nutzung, an die die ursprünglichen Datenbesitzer vielleicht nie gedacht hätten. Dadurch entstehen innovative Ideen und neue Anwendungsfälle. Diese datenbasierte Wertschöpfung ist für mich einer der wichtigsten Gründe, warum ich Open Data fördere.
Klemens: Offene Daten sind Daten, die von allen frei verwendet, weiterverbreitet und weiterverwendet werden können. Ein wichtiges Kriterium ist ein möglichst niedrigschwelliger Zugang. Idealerweise liegen die Daten gut beschrieben, in maschinenlesbaren Formaten an einem zentralen Ort. Für Berliner Verwaltungsdaten ist das beispielsweise das Open Data Portal daten.berlin.de. Die Möglichkeit unterschiedliche Daten zu finden, zu nutzen und miteinander zu kombinieren wird so erleichtert.
Hans: Informationen transparent zu teilen ist wichtig, um Vertrauen und Akzeptanz für behördliche Entscheidungen in der Bevölkerung zu schaffen. Ein häufiges Missverständnis, ist die Annahme, dass Open Data und der Schutz personenbezogener Daten sich gegenüberstehen. Die Daten, mit denen wir arbeiten, haben aber selten einen direkten Bezug zu Einzelpersonen. Falls doch, werden sie anonymisiert und aggregiert, wie zum Beispiel im Fall der Ausleihdaten der Pankower Bibliotheken. Diese und ähnliche Open Data Projekte helfen schlussendlich Transparenz und Innovation zu fördern und öffentliche Dienstleistungen zu verbessern.
Wie trägt die ODIS zur Förderung und Verbreitung offener Daten bei?
Klemens: Wer Daten veröffentlichen möchte oder soll, steht zu Beginn vor einer Vielzahl an zu klärenden Fragen und möglichen Vorgehensweisen. Wir unterstützen die Verwaltung unter anderem mit der Open Data Journey, um eine klare Schritt-für-Schritt-Anleitung bereitzustellen, die alle wichtigen Aspekte der Datenveröffentlichung abdeckt und hilfreiche Materialien zur Verfügung stellt. Ganz wichtig ist auch eine Vernetzung der verschiedene Akteur:innen. Dafür begleiten wir Formate wie das Open Data Frühstück, die AG Open Data (von der Senatskanzlei Berlin) und die Vorstellung der Berliner Open Data Aktivitäten auf Konferenzen. Weitere ODIS-Formate sind Workshops und Schulungen zu Datenvisualisierung, in denen wir Teilnehmer:innen dazu befähigen mit Daten zu arbeiten.
Anna: Wenn wir Daten “sichtbar machen”, hilft uns das, neue Diskurse in Gang zu setzen. Um offene Daten zu fördern und zu verbreiten, erstellen wir deshalb interaktive, digitale Datenvisualisierungen, in denen wir offene Daten verarbeiten und aufzeigen, was damit möglich ist. Hierzu gehören ODIS-Projekte, wie KiezColors, der IHK-Branchenpuls oder der EnergieCheckpoint. Diese Projekte können uns dann als Diskussionsstarter z.B. über die Qualität und Verfügbarkeit der Daten dienen. Eines unserer neueren Formate ist die Datenperle. In dieser regelmäßig erscheinenden Datenvisualisierung-Serie wird jeweils ein Datensatz vorgestellt, bei dessen Öffnung wir unterstützt haben. Das Format wird auch illustrativ begleitet und verbindet so datenbasierte Inhalte und Wissenskommunikation zum Thema DataViz.
Lisa: Wir explorieren neue Ansätze und Technologien, um Verwaltung und Stadtgesellschaft Tools zu bieten, die den Austausch, das Finden und die Nutzung von Daten erleichtern. Unser Arbeitsumfeld erlaubt es uns, innovative Ideen auszuprobieren und am lebenden Objekt zu lernen. Mit unserer Fallstudie zum Organigramm-Tool untersuchen wir, wie Linked Data in Berlin implementiert werden kann. Zudem testen wir mit dem Geoexplorer, wie KI eingesetzt werden kann, um Daten besser zugänglich zu machen. Die Erkenntnisse aus diesen Projekten helfen uns, die Anforderungen an einen geplanten DataHub für Berlin gemeinsam mit anderen Akteur:innen präziser zu formulieren.
Welche konkreten Beispiele gibt es, bei denen offene Daten den Alltag der Menschen verbessert haben?
Hans: Es gibt viele Beispiele, bei denen wir uns gar nicht bewusst sind, dass sie auf offenen Daten basieren. Täglich checken wir das Wetter, oft beruhend auf den Daten des Deutschen Wetterdienstes. Wir schauen nach, wie wir von A nach B kommen, basierend auf den Daten der öffentlichen Verkehrsmittel. Oder suchen nach einer Adresse, um ein Paket zu verschicken, basierend auf offenen Geodaten.
Max: Ein Beispiel für eine einfache, aber sehr effektive Aufbereitung von offenen Daten ist die Webseite https://www.brokenlifts.org/. Sie bietet eine Übersicht aller Aufzüge in Bahnhöfen der BVG und S-Bahn Berlin mitsamt derzeitigen Störungen und Wartungen. So können sich Menschen, die auf Aufzüge angewiesen sind, vor Reiseantritt über den Status der Aufzüge vergewissern. Als Datenbasis werden viertelstündlich die Aufzugstörungsinformationen der Berliner S-Bahn und der BVG abgerufen, analysiert und gebündelt. Dieses Projekt ist darüber hinaus ein Beispiel von erfolgreicher Zusammenarbeit von Datenlieferanten (Nahverkehrsbetriebe) auf der einen Seite, und Nutzer:innen dieser Daten auf der anderen Seite.
Anna: Unsere Berliner Erfrischungskarte, die kühle, schattige und erfrischende Orte in Berlin auf einer Karte zeigt, ist für mich ein gelungenes Beispiel dafür was möglich ist, wenn viele verschiedene offene Daten aus verschiedenen Quellen miteinander kombiniert werden. Sie ist auch ein tolles Beispiel dafür, wie vielfältig die Use Cases und Zielgruppen sein können. Von der Klimaresilienzforschung, über Stadtplanung hin zur Planung des Familienausflugs am Wochenende – die Karte ist aus verschiedenen Perspektiven relevant.
Welche Herausforderungen gibt es bei der Sammlung und Bereitstellung offener Daten?
Anna: Bei offenen Daten mangelt es leider häufiger an einer angemessenen Datenqualität, aber auch an den richtigen Datenformaten. Damit Datensätze leicht weiterverwendet werden können, sollten diese nicht nur öffentlich zugänglich, kostenfrei und permanent abrufbar sein, sondern auch maschinenlesbar sein. An der Stelle begegnen uns noch regelmäßig Hürden, wenn Daten beispielsweise ausschließlich mit Fokus auf Menschenlesbarkeit, zum Beispiel zur Verwendung in PDF-Berichten erstellt wurden.
Lisa: Oft werden wir gefragt, warum überhaupt der Aufwand betrieben werden sollte gerade diesen oder jenen Datensatz als Open Data bereitzustellen. Wer sollte denn diese Daten außerhalb des Expert:innenkreises nutzen wollen? Wie misst man den “Impact” einer Datenveröffentlichung? Diese Fragen sind nicht leicht zu beantworten, da es in der Natur der Sache liegt, dass wir bei offenen Daten nicht immer erfahren oder sicherstellen können, ob und wie die Daten weiterverwendet werden. Das bedeutet aber auch: Man weiß im Vornherein nie, ob ein vermeintlich “trockener” Datensatz nicht irgendwann die Initialzündung für ein innovatives Projekt oder der Schlüssel für die Digitalisierung eines Prozesses sein kann.
Max: Mitunter ist innerhalb der Verwaltung nicht immer bekannt, welche Daten eigentlich wo vorliegen, erhoben oder veröffentlicht werden. Als vorbereitender Schritt für die Bereitstellung offener Daten, und um für digitale Projekte eine Datenbasis zu kennen, ist es wichtig, eine organisationsübergreifende Übersicht zu schaffen. Dazu gehört auch die Beschreibung der Daten selbst. Wir unterstützen aus diesem Zweck derzeit die Durchführung von Dateninventuren in den Behörden.
In welchen Bereichen siehst Du das größte Potenzial für die Nutzung offener Daten? Auch in Zusammenarbeit mit der Verwaltung.
Klemens: Im Kontext der Verwaltungsdigitalisierung gibt es viel Potential, wenn Verwaltungsmitarbeitende außerhalb ihrer Informationssilos leichten Zugang zu weiteren Daten erhalten. So könnte ein offenes Datenangebot die Recherche nach relevanten Informationen für die Erfüllung von Aufgaben, die Suche nach Ansprechpersonen oder die Arbeit mit den Daten selbst erleichtern, um beispielsweise schriftliche Anfragen schneller zu beantworten, Reportings zu erstellen oder generell Prozesse zu vereinfachen und datengetrieben bessere Entscheidungen zu treffen.
Hans: Durch das Öffnen der Daten werden sie auch anderen Menschen aus Zivilgesellschaft, Wirtschaft und Wissenschaft zugänglich, die neue Perspektiven, Fragestellungen und Anwendungen entwickeln können. Die dadurch entstehenden Projekte und Synergien können dann auch der Verwaltung wieder zugutekommen können. Gut sichtbar wird das bei Projekten wie Parla oder QTrees, die bei unseren Kolleg:innen des CityLAB und der Technologiestiftung Berlin entstanden sind – und auch über die Stadtgrenzen hinaus für neue Impulse gesorgt haben.
Max: Offene Daten sind entscheidend für das Training von maschinellen Lernmodellen und Algorithmen, die beispielsweise von Entwickler:innen und Firmen genutzt werden, um wiederum die Entscheidungsfindung in der öffentlichen Verwaltung zu verbessern. Sie ermöglichen präzisere und effektivere Modelle, die verlässlichere Vorhersagen und bessere Entscheidungen unterstützen. Beispielsweise können Verkehrs- und Gesundheitsdaten genutzt werden, um Verkehrsflüsse zu steuern und Krankheitsausbrüche schneller zu erkennen. Dies kann perspektivisch zu effizienteren Infrastrukturen und besserer öffentlicher Gesundheit führen.
Trotz der Herausforderungen hinsichtlich Datenqualität und Zugänglichkeit bieten offene Daten große Chancen für die Entwicklung smarter städtischer Lösungen. Initiativen wie die Open Data Informationsstelle in Berlin spielen eine entscheidende Rolle dabei, den Zugang zu diesen Daten zu erleichtern, neue Diskurse anzustoßen und Potenziale sichtbar zu machen. Langfristig kann die Nutzung offener Daten somit zu einer nachhaltigeren und lebenswerteren Stadt beitragen. Vielen Dank für den Einblick, liebe ODIS!