Dick van Eijk – Auswertung von EU-Parlamentsprotokollen

Dick arbeitet bei NRC Handelsblad, einer niederländischen Abendzeitung, und bei NRC Next, einem neuen Ableger davon, der sich an jüngere Leser richtet.

Schon seit 1993 betreibt Dick CAR und für das Handelsblad viele kleiner und größere Projekte betreut. CAR ist für ihn ein Werkzeug, um journalistische Fragestellungen zu klären.

Ein Beispiel: Am 29. Mai 2005 meldete das Handelsblad: Niederlande stark im europäischen Parlament – mit einer Grafik zur „extra-Stimmkraft für die Niederlande“. Dick konnte zeigen, dass die Niederlande mehr Macht im EU-Parlament hat, als man anhand der Zahl der niederländischen Abgeordneten vermuten würde. Der Grund: die Abgeordneten nehmen häufiger an Abstimmungen und Ausschuss-Sitzungen teil.

Um zu diesem Ergebnis zu kommen, musste eine 5-jährige Sitzungsperiode ausgewertet werden mit

  • 626 Abgeordneten,
  • 314 Sitzungen,
  • 6118 namentlichen Abstimmungen (21 geheim) und
  • potenziell fast 4 Millionen Abstimmungsdatensätzen.

Fragen:

  • Wie oft sind Abgeordnete präsent?
  • Wie oft nehmen sie teil an namentlichen Abstimmungen?
  • Höchste und niedrigste Stimmkraft von Mitgliedsländern?
  • Abstimmung nach Parteilinien oder nationalen Linien?
  • Nationaler Einfluss von Abgeordneten?

Welche Daten wurden verwendet? Präsenzlisten und Verhandlungsprotokolle. Website des Europaparlaments: europarl.europa.eu. Dort sind die Daten aber nur sehr schwer zugänglich. Fünf Jahre zuvor hatte er dort noch die Daten auf einer CD bekommen. Bei der nationalen Vertretung des Europaparlaments kam Dick nicht weiter, hat aber so lange gebohrt, bis sie ihm angeboten haben, direkt dort auf das Intranet zuzugreifen und sich die Daten zu kopieren. Die Listen und Protokolle liegen vor als Word Perfect-, Word- und Excel-Dateien. Keiner dieser Datensätze ist vollständig, aber eine Kombination aller Formate ergab eine vollständige Abdeckung aller 314 Sitzungen. Es gab allerdings kein komplettes Dokument in einer Sprache. Die höchste Abdeckung liegt auf Französisch vor.

Diese Daten mussten zusammen gefügt, bereinigt und in Microsoft Access importiert werden. Dabei war eine besondere Hürde, dass die Schreibweisen der Namen von Abgeordneten unterschiedlich ist, d.h. es war viel Handarbeit nötig, die nicht von einem Robot/Agent übernommen werden kann. Essenz seines Vortrags: es ist unglaublich viel Handarbeit nötig. Vor allem ist auch die Computerpower viel größer geworden. Dick berichtet von einem Durchlauf, bei dem er mit „Suchen & Ersetzen“ eine Datei bereinigen wollte. Nachdem er um 20 Uhr abends dem PC den Auftrag gegeben hatte, ging er nach Hause und kam am nächsten Morgen um 8 Uhr wieder ins Büro. Der Computer war noch nicht fertig, um 10 Uhr war er kaputt. Heute braucht sein Notebook-PC für einen vergleichbaren Auftrag nicht länger als eine Minute.

Insgesamt war er überrascht davon, in welch schlechtem Zustand die Daten waren, die er von der EU bekam. Das ist seitdem nicht besser geworden.

Frage: Wie war die Unterstützung der Chefredaktion?

Dick: Am Beginn der Recherche stand der Tipp, dass die Daten vorhanden sind. Dann wurde in einer Brainstorming-Sitzung besprochen, was denn Fragen der Journalisten sein könnten, vorausgesetzt, man kann die Daten nutzen? Insgesamt waren etwa zwölf Personen an einem derartigen Projekt beteiligt, die Datenbereinigung hat Dick allein gemacht. Was das Budget angeht: Handelsblad leistet sich sechs bis sieben Redakteure, die nur mit investigativen Aufgaben betraut sind. Er ist einer davon, daher hat das Budget keine Rolle gespielt, denn es hat „nur“ seine Zeit gekostet. Die Ergebnisse, d.h. die Geschichten auf der Seite Eins, haben viel Aufmerksamkeit erregt und sind breit kommentiert und wahrgenommen worden, so dass alle mit dem Ertrag der Arbeit zufrieden sein konnten.

Wichtig sei es, die Daten besonders sorgfältig zu bereinigen, um nicht zu falschen Ergebnissen zu kommen.

Tags: , , , , , , , , , , ,

Comments are closed.