Parla: Intelligentes Wissensmanagement für Verwaltungsdokumente

Von Benjamin Seibel
Die neue Anwendung Parla des CityLAB Berlin macht schriftliche Anfragen durchsuchbar - mobil und auf dem desktop

Mit unserer neuesten Anwendung Parla machen wir öffentliche Verwaltungsdokumente mit Hilfe von Künstlicher Intelligenz durchsuchbar – und schaffen so einen neuartigen und intuitiven Zugang zu mehr als 10.000 Dokumenten, die viel über das Innenleben unserer Stadt verraten. 

Die öffentliche Verwaltung verarbeitet täglich große Mengen an Informationen, verfügt jedoch in weiten Teilen nicht über ein digitales Wissensmanagement. Daten und Dokumente werden nicht zentral und einheitlich gespeichert, sondern liegen verteilt in tausenden unterschiedlichen Systemen, Datenbanken, Excel-Dateien, Protokollen oder Vermerken. Entsprechend viel Zeit verbringen Beschäftigte der Berliner Behörden damit, Informationen aus verschiedenen Quellen anlassbezogen zusammenzustellen und aufzubereiten. 

Mit unserem neuen Prototypen Parla erproben wir die Möglichkeiten, diesen Prozess der Informationsgewinnung durch Künstliche Intelligenz zu unterstützen. Leistungsstarke Sprachmodelle, wie wir sie etwa durch ChatGPT kennen, sind schließlich in der Lage, große, unstrukturierte Textmengen in Sekundenschnelle zu durchsuchen, sinnvoll zu verknüpfen und zusammenzufassen. Das mühsame händische Suchen nach einer bestimmten Information, die in einem der zahlreichen Sitzungsprotokolle erwähnt ist, kann so perspektivisch entfallen. 

KI-generierte Antwortvorschläge zu jeder Suchanfrage 

Parla hat Zugriff auf mehr als 10.000 öffentlich verfügbare Dokumente, die auf dem parlamentarischen Dokumentationssystem PARDOK in der laufenden Wahlperiode publiziert wurden. In der aktuellen Version umfasst der Textkorpus neben sämtlichen Antworten auf Schriftliche Anfragen von Abgeordneten auch die wichtigen Hauptausschussvorgänge (sogenannte „Rote Nummern“). Stellt man Parla eine Frage, formuliert das System auf dieser Textgrundlage einen Antwortvorschlag und referenziert die dafür genutzten Dokumente, sodass die Nachvollziehbarkeit gewährleistet bleibt. 

Parla kann so nicht nur die tägliche Arbeit von Parlament und Verwaltung digital unterstützen. Auch für viele andere Akteure, etwa für Verbände, Kammern, Medien und zivilgesellschaftliche Organisationen ist es oft aufwändig, einen Überblick über aktuelle Sachverhalte und Beschlusslagen zu erhalten. 

In unseren Tests hat sich Parla als hilfreich für eine Vielzahl von Anwendungsfällen erwiesen. Gleichwohl arbeitet auch unser System nicht immer fehlerfrei. Es ist inzwischen bekannt, dass große Sprachmodelle mitunter Informationen falsch interpretieren und nicht akkurat wiedergeben können. Unser Prototyping-Team hat intensiv daran gearbeitet, diese sogenannten „Halluzinations“-Probleme zu minimieren – ganz ausschließen lassen sie sich aber beim aktuellen Stand der Technik nicht. Es ist deshalb grundsätzlich sinnvoll, die von Parla generierten Antworten mit Hilfe der referenzierten Dokumente zu überprüfen.  

Parla: Experiment statt fertiger Lösung 

Ohnehin betrachten wir Parla zum gegenwärtigen Zeitpunkt eher als Experiment, denn als fertige Lösung. Es ist schließlich gerade einer der Mehrwerte eines agilen Prototpying-Ansatzes, Hindernisse und Hürden auf dem Weg zu einer fertigen Lösung sichtbar zu machen, um daraus weitere Schritte abzuleiten.  

Parla macht auf diese Weise zum Beispiel deutlich, wie wichtig es für Verwaltungen ist, gut strukturierte, maschinenlesbare Daten- und Metadatenbestände aufzubauen und zu pflegen. Die Qualität einer KI-generierten Antwort kann letztlich nur so gut sein wie die Datengrundlagen, die der KI zur Verfügung stehen. Diese Datengrundlagen sind in den meisten Verwaltungen – vorsichtig formuliert – ausbaufähig. Zusammen mit unserem Schwesterprojekt, der Open Data Informationsstelle (ODIS) arbeiten wir im CityLAB seit vielen Jahren daran, die Qualität und Zugänglichkeit von Verwaltungsdaten zu verbessern. Trotzdem bleibt hier noch viel zu tun.   

Insbesondere für die Verwaltungsarbeit wäre es zudem hilfreich, Parla um weitere, auch verwaltungsinterne Dokumente zu ergänzen. Aus Gründen des Datenschutzes und der Informationssicherheit ist dies jedoch zurzeit nicht möglich. In der jetzigen Form hat Parla kein Problem mit Datensicherheit, weil es sich ausschließlich auf Dokumente stützt, die bereits öffentlich zugänglich und gemeinfrei sind. Um interne Dokumente sicher verarbeiten zu können und die Datenhoheit zu behalten, müsste das Land Berlin aber vermutlich ein Sprachmodell auf eigener Infrastruktur betreiben – ein Schritt, der für die Zukunft ernsthaft in Betracht gezogen werden sollte.  

Transparenz bei Nutzung von KI im Öffentlichen Sektor

Die Nutzung von Künstlicher Intelligenz im Öffentlichen Sektor bietet in unseren Augen enorme Potenziale, aber natürlich auch Risiken. Wir finden es wichtig, dass diese Diskussion öffentlich und auf einer soliden Faktenbasis geführt wird. Aktuell experimentieren viele Verwaltungen mit dem Einsatz von Sprachmodellen, aber meist laufen diese Experimente hinter verschlossenen Türen. Es ist dann schwer nachzuvollziehen, ob die genutzten Systeme wirkliche Mehrwerte generieren, oder ob es sich nicht doch nur um einen Marketing-Gag handelt.  

Wir wollen mit Parla zeigen, dass es auch anders geht, und machen das System deshalb öffentlich zugänglich. Auch wenn es, wie erwähnt, noch lange nicht perfekt ist. Auch der Source Code kann, wie bei all unseren Projekten, auf GitHub eingesehen und weiterverwendet werden. Dies erfolgt nicht nur aus Gründen der Transparenz, sondern auch, weil wir die Erfahrung gemacht haben, dass unsere Produkte durch öffentliches Feedback besser werden.   

In diesem Sinne freuen wir uns auf Resonanz und sind gespannt, wie es mit Parla weitergeht. Wer sich für die technischen Details und Hintergründe der Entwicklung interessiert, findet hier zudem einen vertiefenden Artikel aus unserem Prototyping-Team.  

Wir würden uns freuen, wenn Ihr an einer kurzen Umfrage teilnehmt, um die kontinuierliche Weiterentwicklung von Parla zu unterstützen!