Publiziert am: 23.05.2023
Autor: Alex Lavrynets
StatBot.swiss: mit offenen Daten diskutieren

Mit dem Projekt StatBot.swiss soll ein Chatbot entwickelt werden, der nach dem Frage-Antwort-Prinzip mit den offenen Daten der öffentlichen Verwaltung (Open Government Data, OGD) in der Schweiz interagieren kann. Federführend sind derzeit das Kompetenzzentrum für Datenwissenschaft (DSCC) und die Konferenz der regionalen statistischen Ämter der Schweiz (KORSTAT). Sie werden dabei von der Digitalen Verwaltung Schweiz (DVS) und der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) unterstützt. Ein erster Prototyp des Chatbots soll Ende 2023 vorliegen.
StatBot.swiss: Ein Projekt auf der Grundlage der OGD
Gemäss der Open-Government-Data-Strategie (OGD) 2019–2023 «fördert der freie Zugang zu Verwaltungsdaten Transparenz und Partizipation, stärkt die Verantwortlichkeit und trägt zur Steigerung der Wertschöpfung bei (höhere Effizienz der Verwaltung, Ermöglichung von Innovation, Realisierung neuer Geschäftsmodelle)». Dementsprechend werden auf dem Portal opendata.swiss diverse offene Datensätze aufgelistet und der Öffentlichkeit zur Verfügung gestellt. Diese Daten effizient zu durchsuchen und zu nutzen ist allerdings für ein unkundiges Publikum schwierig. Häufig werden Datenbearbeitungskompetenzen benötigt, z. B. für die Kodierung oder die Datenformatierung. Mit dem Projekt StatBot.swiss soll deshalb ein Chatbot entwickelt werden, der nach dem Frage-Antwort-Prinzip in natürlicher, d. h. vom Menschen verwendete Sprache mit den OGD interagieren kann. Ziel dieser Lösung ist die Vereinfachung der Nutzung von OGD. Das Projekt StatBot.swiss wird von der Digitalen Verwaltung Schweiz (DVS) unterstützt.
StatBot.swiss: Ein Gemeinschaftsprojekt
Das Projekt StatBot.swiss wird vom Kompetenzzentrum für Datenwissenschaft (DSCC) und der Konferenz der regionalen statistischen Ämter der Schweiz (KORSTAT) gemeinsam geleitet. Die erste Projektphase bestand in der Harmonisierung und Standardisierung einer Teilmenge der Daten aus dem Portal opendata.swiss mit dem Ziel, die Daten maschinenlesbar zu machen. Ausgehend von diesen Arbeiten entwickelt das DSCC nun unter Beteiliung der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) einen Chatbot, der auf maschinellem Lernen basiert und dadurch die Datenbank effizient abfragen kann.
StatBot.swiss: Ein ehrgeiziges Projekt
Das Projekt StatBot.swiss beruht auf der innovativen Open-Source-Lösung ValueNet (in Englisch). Sie wurde von der ZHAW im Rahmen des von der Europäischen Union unterstützten Forschungsprojekts INODE (Intelligent Open Data Exploration, in Englisch) präsentiert. ValueNet enthält ein umfassendes System zur Interpretation natürlicher Sprache und ihrer Übersetzung in eine strukturierte Abfragesprache (SQL, Structured Query Language). Damit kann anhand der spezifischen Begriffe der Suchanfrage eine relationale Datenbank (nach ihren logischen Beziehungen strukturierte Daten) durchsucht werden. Für die Abfrage mit ValueNet werden keine Programmierkenntnisse benötigt und es werden auch keine Kenntnisse des Relationenschemas (Logik hinter der relationalen Organisation der Daten) vorausgesetzt. Der Chatbot wird in einem ersten Schritt so programmiert, dass Abfragen auf Deutsch und Englisch getätigt werden können. Französisch und Italienisch werden später integriert. Ein Prototyp des Chatbots in Form eines Minimal Viable Products (MVP) ist für Ende 2023 geplant. Der Quellcode des Programms soll anschliessend der Öffentlichkeit zugänglich gemacht werden.