Seit 2018 begleitet die Open Data Informationsstelle Berlin (ODIS) unsere Stadt auf ihrem Weg zu einer offenen, nachhaltigen und datengetriebenen Gesellschaft. Der Fokus liegt dabei auf der Bereitstellung und Nutzung offener Daten. In unserer Kolumne berichtet jeweils ein Teammitglied, anhand der Etappen der Open Data Journey, ihre Arbeitserfahrungen und gewährt einen spannenden Einblick in ihre Projekte – inklusive ein paar Geschichten aus dem Nähkästchen!
KI, Daten und Würste: Es kommt darauf an, was drinsteckt
„Gesetze sind wie Würste – niemand will dabei sein, wenn sie gemacht werden.“ Ein Zitat, das man Otto von Bismarck zuschreibt und damals auf die Gesetzgebung gemünzt war, könnte heute genauso gut auf die Entwicklung von Künstlicher Intelligenz (KI) angewendet werden: Algorithmen, maschinelles Lernen, automatisierte Entscheidungsfindung. Begriffe, die aktuell wie Zauberworte durch Konferenzen und Debatten hallen – vor allem, wenn es um Effizienzgewinne oder Lösungen für den Fachkräftemangel in der öffentlichen Verwaltung geht.
Doch hinter den vielversprechenden Buzzwords stecken komplexe Herausforderungen. Während über KI-Ethik und rechtliche Fragen hitzig diskutiert wird, könnten zahlreiche Verwaltungsleistungen von so viel Aufmerksamkeit nur träumen: Berliner:innen warten beispielsweise mindestens 3 bis 6 Monate auf ihr Wohngeld, das vielerorts per Post beantragt wird.
Darüber hinaus bleibt oft unbeachtet, dass viele KI-Anwendungen auf unbekannten Datenfundamenten stehen. Wer weiß schon, welche Daten ein Algorithmus nutzt oder wie diese erhoben und verarbeitet wurden? Von fragwürdigen Arbeitsbedingungen für Klickworker bis hin zu potenziellen Urheberrechtsverletzungen ist vieles im Argen. Doch um KI sinnvoll in der Verwaltung einzusetzen, braucht es vor allem eins: Daten – qualitativ hochwertige, maschinenlesbare und verwaltungsspezifische Daten.
Datenqualität als Schlüssel für KI
Der Einsatz von KI in der öffentlichen Verwaltung steht und fällt mit der Datenbasis. KI-Systeme, insbesondere solche, die auf großen Sprachmodellen (LLMs) wie GPT-3 basieren, lernen aus gigantischen Datenmengen. Bei GPT-3, einem der bekanntesten Modelle, stammen nach Schätzungen rund 3% der Trainingsdaten aus Wikipedia-Einträgen (7 Millionen Artikel). Bei den restlichen 97% verliert sich die Spur schnell im World Wide Web.
Für den spezifischen Einsatz in der Verwaltung sind solche Daten oft ungeeignet. Es fehlt nicht nur an inhaltlicher Relevanz, sondern auch an Verlässlichkeit. Dabei sitzt die öffentliche Verwaltung auf einem Datenschatz – von Finanzdaten über Baupläne bis hin zu sozialen Statistiken. Doch diese Daten sind oft schwer zugänglich: Sie schlummern in PDFs, bunt formatierten Excel-Tabellen oder, schlimmer noch, auf Papier ausgedruckt in Umlaufmappen. Solange diese Daten nicht maschinenlesbar und strukturiert sind, bleiben sie für KI-Anwendungen unbrauchbar.
Not all Heroes wear Capes – die Rolle von Metadaten
Neben der Qualität der Daten selbst spielen Metadaten eine entscheidende Rolle. Metadaten – also Daten über Daten – beschreiben Eigenschaften wie Format, Herkunft und Aktualität eines Datensatzes. Ohne standardisierte, maschinenlesbare Metadaten wird es unmöglich, relevante Daten für KI-Anwendungen zu finden und zu nutzen.
Um an die vorhergehende Kolumne meines Kollegen Klemens anzuknüpfen: Eine behördenübergreifende Datenbestandsübersicht könnte helfen, geeignete Datensätze sichtbar zu machen – sowohl für Menschen als auch für Algorithmen. Dafür sollten Metadaten jedoch nicht in Freitextform eingetragen werden, sondern maschinell nach gängigen Standards wie dem RDF-Format (Resource Description Framework) erstellt werden. Solche Standards gewährleisten, dass Metadaten maschinenlesbar und interoperabel sind, was ihre Wiederverwendbarkeit massiv verbessert und genau hier können KI-Tools schon heute unterstützen.
KI als Treiber für offene Daten
Die öffentliche Verwaltung hat sich bereits auf den Weg gemacht, Daten transparenter zu machen. Seit der Gründung der ODIS lenken wir gemeinsam mit der Verwaltung mit jeder Öffnung eines Datensatzes Aufmerksamkeit auf das Thema und bauen verwaltungsintern Kompetenz bezüglich Datenqualität auf. Doch der KI-Boom könnte diese Bemühungen beschleunigen.
Während gut trainierte KI-Modelle im Bereich der natürlichen Sprache mithilfe von Wahrscheinlichkeiten Texte generieren, die für Außenstehende erstaunlich menschlich wirken, besteht bei ihnen die Gefahr sogenannter Halluzinationen – das bedeutet, sie formulieren überzeugend Aussagen, die faktisch falsch sind. Die Bereitstellung qualitativ hochwertiger, offener Daten, die nicht nur korrekt, sondern auch leicht zugänglich sind, könnte dazu beitragen, dass öffentliche KI-Systeme ihre Nutzenden ausschließlich mit verlässlichen Informationen versorgen. Beispiele für solche Datenbanken existieren bereits, etwa Wikidata, dessen offene und maschinenlesbare Informationen eine solide Datengrundlage für faktenbasierte Anwendungen bieten können.
Ein Schritt zurück für einen Sprung nach vorne
Um KI nachhaltig in der Verwaltung zu verankern, müssen zunächst grundlegende Herausforderungen angegangen werden. Dazu gehört die Verbesserung der Datenqualität und -struktur sowie die Etablierung von Metadatenstandards. Diese Grundlagenarbeit mag weniger glamourös erscheinen als die Einführung eines neuen KI-Tools, doch sie ist unverzichtbar. Ohne qualitativ hochwertige Daten bleiben KI-Anwendungen anfällig für die genannten Fehler.
Verwaltungen können diese Herausforderungen jedoch auch als Chance nutzen, denn es geht nicht darum, KI und Open Data gegeneinander auszuspielen. Im Gegenteil: Der aktuelle KI-Hype bietet die Chance, “traditionelle” Themen wie Datenqualität und offene Daten wieder auf die Agenda zu bringen. Jede Diskussion über KI in der Verwaltung sollte auch die Frage einbeziehen, wie Daten besser verfügbar gemacht werden können – sowohl für die Maschinen als auch für die Menschen.
Jetzt gehts um die Wurst – gute Daten(qualität) ist der Schlüssel
Die Verwaltung der Zukunft wird digital und datengetrieben sein. Doch damit diese Vision Wirklichkeit wird, müssen wir die Grundlagen schaffen. Vor allem muss die Verwaltung sich mit den eigenen Daten beschäftigen – sie strukturiert, maschinenlesbar und zugänglich machen. Und wer weiß, vielleicht wird eines Tages ein KI-System helfen, Wohngeldanträge zu bearbeiten, ohne dass 15 Seiten Papier quer durch die Stadt geschickt werden. Bis dahin bleibt uns nur, an den Datenfundamenten zu arbeiten – denn wie bei Gesetzen und Würsten gilt auch hier: Die Qualität des Ergebnisses hängt davon ab, was hineinkommt.
Bleib dran – Nächsten Monat geht’s weiter!
Die nächste ODIS-Kolumne wird weihnachtlich, bleibt gespannt und lest nächsten Monat mehr.