Das belgische Parlament ist ein essentieller Bestandteil der föderalen Demokratie des Landes und umfasst die Kammer der Abgeordneten mit 150 direkt gewählten Mitgliedern. Diese Volksvertreter sind alle fünf Jahre gewählt und sind maßgeblich daran beteiligt, Gesetze zu debattieren, abzustimmen und parlamentarische Anfragen an Minister zu richten. Obwohl diese Vorgänge grundlegend für die demokratische Willensbildung sind, war es für die Bürgerinnen und Bürger überraschend schwierig, detaillierte Informationen zu den Abstimmungsverhalten einzelner Abgeordneter oder zu spezifischen politischen Themen auf einfache und zugängliche Weise zu erhalten. Genau an dieser Stelle setzt ein innovatives Projekt an, das sich der Herausforderung stellt, die umfangreichen und komplexen Daten des belgischen Parlaments zu sammeln, systematisch aufzubereiten und in verständlichen Formaten bereitzustellen. Die Zielsetzung ist klar: Transparenz schaffen und die aktive politische Teilhabe stärken, indem die Daten öffentlich, übersichtlich und nutzerfreundlich zugänglich gemacht werden.
Eine der Hauptquellen für Informationen zu den Sitzungen der Kammer der Abgeordneten sind die wöchentlichen Sitzungsberichte, die nach jeder Plenarsitzung veröffentlicht werden. Diese Berichte, sowohl als PDF als auch als HTML erhältlich, enthalten umfangreiche Protokolle der Debatten und Abstimmungen. Sie decken ein breites Spektrum ab und sind mit etwa vierzig bis achtzig Seiten sehr ausführlich. Alle relevanten Abstimmungsergebnisse werden dokumentiert, inklusive des Themas der Abstimmung, der Stimmenverteilung und schließlich – etwas versteckt – eine Auflistung der Namen der Abgeordneten, gruppiert nach Ja-, Nein- oder Enthaltungsstimmen. Die Schwierigkeit liegt jedoch darin, dass die konkreten Stimmen der einzelnen Abgeordneten am Ende des jeweiligen langen Sitzungsberichts versteckt sind, was die manuelle Auswertung für interessierte Bürger sehr aufwendig macht.
Zudem gibt es keine Möglichkeit, die Daten gezielt nach Abgeordneten, Parteien oder Themen zu filtern und so ein differenziertes Bild des parlamentarischen Verhaltens zu erhalten. Um diese Hürde zu überwinden, wurde ein Projekt initiiert, das die komplette wöchentliche Berichterstattung automatisiert herunterladen und die darin enthaltenen Daten zuverlässig extrahieren kann. Die Basis stellt dabei der Download der Sitzungsberichte in HTML-Form dar. Mithilfe moderner Programmierwerkzeuge, speziell in der Programmiersprache Rust, wird ein Skript eingesetzt, das die URLs der Sitzungsberichte systematisch abruft. Dabei wird auf technische Herausforderungen wie die spezifische Zeichenkodierung der HTML-Dateien eingegangen.
Die Sitzungsdokumente sind im Windows-1252-Standard kodiert, was eine spezielle Behandlung bei der Umwandlung in lesbaren Text verlangt. Dank moderner Bibliotheken lässt sich dieses Problem effizient lösen. Der nächste Schritt ist die Strukturierung und Speicherung der Daten in einem einheitlichen, leicht abfragbaren Format. Dafür werden die extrahierten Informationen – zum Beispiel Fragen an Minister, Abstimmungen und Gesetzesvorschläge – in Parquet-Dateien geschrieben. Parquet ist ein spaltenorientiertes Speichersystem, das effiziente Abfragen und hohe Kompressionsraten ermöglicht – ideal für die Speicherung großer und komplexer Datensätze.
So können etwa alle Fragen mit ihren jeweiligen Fragestellern, Antwortenden und relevanten Themen sowie die Abstimmungen mit ihren Ergebnissen in einer lesbaren, maschinenfreundlichen Struktur vorgehalten werden. Die gewonnene Datenbasis ist jedoch erst der Anfang. Um sie der Öffentlichkeit sinnvoll zugänglich zu machen, wird daraus eine Website generiert, die es erlaubt, das parlamentarische Geschehen interaktiv zu erkunden. Hierfür wird eine statische Website mit dem Generator Eleventy aufgebaut. Das Besondere daran ist, dass alle Seiten nicht dynamisch bei jedem Aufruf neu berechnet werden, sondern bei der Erstellung der Website ein für alle Mal generiert werden.
Dies sorgt für schnelle Ladezeiten und eine hohe Zuverlässigkeit der Webseite. Die Anfragen an die Daten werden über DuckDB realisiert, eine in sich laufende SQL-Datenbank, die direkt Parquet-Dateien lesen und verarbeiten kann. So lässt sich auf einfache Weise komplexe Abfragen durchführen, die mehrere Datenquellen – wie Mitgliederlisten, Abstimmungsprotokolle und Themenzuordnungen – miteinander verknüpfen. Beispielsweise bekommt der Nutzer auf der Seite eines Abgeordneten einen vollständigen Überblick aller von ihm gestellten Fragen inklusive Antwortminister und Debattenverlauf. Dies schafft einen bisher unerreichten Grad an Transparenz im parlamentarischen Alltagsgeschehen.
Zusätzlich werden die Abstimmungsergebnisse übersichtlich dargestellt und können aus verschiedenen Perspektiven betrachtet werden. So lässt sich etwa nachvollziehen, wie eine ganze Partei abgestimmt hat und ob die Mitglieder innerhalb der Partei geschlossen oder individuell vorgegangen sind. Ebenso sind Detailansichten verfügbar, die das Abstimmungsverhalten eines einzelnen Abgeordneten zeigen. Durch diese differenzierte Darstellung werden politische Muster und Zusammenhänge für Bürger verständlich und nachvollziehbar. Ein weiteres Herzstück des Projekts ist die inhaltliche Kategorisierung der parlamentarischen Themen.
Um dies zu ermöglichen, wurde ein Schlüssel entwickelt, der jeder Frage, Abstimmung oder Gesetzesvorlage eine oder mehrere Themen zuordnet. Die Themen erstrecken sich über zentrale gesellschaftliche Bereiche wie Mobilität, Gesundheit, Klima, Wirtschaft, Sicherheit, internationale Politik, Technologie und Bildung. Jedes dieser Hauptthemen ist weiter in Unterthemen unterteilt, die über Schlüsselwörter aktiviert werden. So lassen sich automatisiert alle parlamentarischen Aktivitäten zu einem bestimmten Politikfeld zusammentragen und auswerten. Um komplexe oder sehr ähnliche Fragestellungen besser zu bündeln und für die Nutzer lesbarer zu machen, kommt ein fortschrittliches Sprachmodell zum Einsatz.
Dieses fasst thematisch verwandte Fragen in einem einzigen, verständlichen Titel zusammen, der prägnant und im Stil der Originalfragen gehalten ist. Diese in Niederländisch generierten Zusammenfassungen helfen besonders bei vielen gleichlautenden Anfragen, die in einem gemeinsamen Diskussionsstrang beantwortet werden, die Übersicht zu bewahren. Ergänzend zur parlamentarischen Tätigkeit wurde auch das Einkommen der Abgeordneten mit aufgenommen. Über die öffentliche Plattform regimand.be werden die von Politikern erklärten Einnahmen eingelesen und mit den bereits vorhandenen Mitgliederdaten verknüpft.
So entsteht für den Besuchenden der Webseite ein ganzheitliches Bild, das die politische Arbeit mit persönlichen Daten über Funktion und Einkommen verbindet. Dieses Merkmal ergänzt die Transparenzbemühungen und fördert das Vertrauen in die parlamentarische Arbeit. Nicht zuletzt bietet die Plattform auch die Möglichkeit für Nutzer, eigene Auswertungen und Diagramme zu erstellen. Zum Beispiel kann man sehen, welche Partei im Parlament die meisten Fragen pro Abgeordneten stellt oder welche Themen innerhalb der letzten Sitzungen besonders präsent waren. Interaktive Grafiken laden zum Erkunden ein und machen die Daten lebendig.
Die Kombination der eingesetzten Technologien fasst zusammen, wie moderne IT-Werkzeuge genutzt werden können, um Regierungsarbeit verständlich und nachvollziehbar zu machen. Rust ermöglicht das effektive Sammeln und Verarbeiten von Daten. Parquet sorgt für effiziente Speicherung und schnelle Auslese. DuckDB ermöglicht komplexe SQL-Abfragen direkt auf diesen Daten. Eleventy generiert eine performante und benutzerfreundliche Webseite.
Sprachmodelle bieten kreative Lösungen zur Textverdichtung und Lesbarkeit, während Visualisierungstools für eine attraktive Datenpräsentation sorgen. Das Endprodukt, abgebildet unter der Adresse zijwerkenvooru.be, zeigt eindrucksvoll, wie eine datengetriebene Transparenzplattform gestaltet werden kann, die das Verständnis und die Beteiligung der Bürger am politischen Geschehen fördert. Es ist ein bedeutender Schritt hin zu einer offeneren Demokratie, indem es die oft schwer zugänglichen Rohdaten in eine ansprechende und nutzerfreundliche Form bringt. Die Wichtigkeit solcher Projekte ist nicht zu unterschätzen.