Journalismus & Recherche » Data Mining

Samstag, Dezember 30th, 2006

MaryJo Websters Teil des Seminars “Transparency Reporting and Computer-Assisted Reporting”, organisiert von Tagesspiegel und World Press Institute in Frankfurt/Oder, war sicher der Glanzpunkt der Veranstaltung.

Anhand schöner Beispiele aus der Praxis demonstrierte sie, wie CAR im journalistischen Alltag funktionieren kann. Ihre Präsentation und eine Linkliste der zitierten Artikel hat sie nun online gestellt. Viel Spaß beim Stöbern.

Mittwoch, August 9th, 2006

Klar, als AOL 500 MB an Suchdaten ins Netz stellte – absichtlich, als Fundus für Suchforscher -, war die Aufregung erstmal groß. AOL hatte die Suchdaten “anonymisiert”, wozu es nach Ansicht des Unternehmens ausreichte, Nutzerkennungen durch Nummern zu ersetzen. Die Kritik war heftig. Aber schnell war (mindestens) ein bekannter Suchexperte zur Stelle, um AOL in Schutz zu nehmen und die Vermutung, anhand der Suchanfragen selbst werde es ein leichtes sein, Nutzer zu identifizieren, als übertrieben abzutun:

Nevermind that no one actually has come up with an example where someone could be identified. Just the theoretical possibility is enough to create a privacy firestorm in some people’s minds.

Und nun das: Michael Barbaro und Tom Zeller Jr. von der New York Times haben fleißig recherchiert und der Nummer ein Gesicht gegeben: A Face Is Exposed for AOL Searcher No. 4417749.

Was jetzt, Herr Linden? Immer noch alle nur paranoid da draußen?

Also denkt dran: Immer schön Cookies löschen!

Montag, Juni 19th, 2006

Ein sehr zeitgemäßer Beitrag kommt gerade von Haiko Lietz, LeserInnen von Recherche-Info.de bekannt als Referent auf der CAR-Tagung in Hamburg zum Theme Social Network Analysis:

Netzwerkanalyse ist eine journalistische Recherchemethode, die in der Mathematik und Soziologie beheimatet ist. Während die Methode im US-Journalismus bereits anfangsweise angewendet wird, wird in Deutschland meist noch über wissenschaftliche Netzwerkanalysen berichtet. Zwei aktuelle Berichte drehen sich um Fußball. Für die österreichischen Analysten von FAS.research, deren Webseite immer einen Besuch wert ist, gehört die Analyse von Fußballspielen zur Öffentlichkeitsarbeit. Sie erhalten ihre Forschungsgelder von der Wirtschaft und dem Staat. Zum Spiel Argentinien gegen Elfenbeinküste fanden sie heraus:

Da wie dort fand sich eine klassische Spitze (Crespo bzw. Drogba) und eine hängende Spitze (Saviola bzw. Kalou), die stärker in die reziproken Spielaktionen aus dem Mittelfeld heraus eingebunden war und den letzten, entscheidenden Pass spielen sollte.“

Außerdem sei das Spiel der Argentinier robuster gewesen. Genaueres steht im österreichischen Standard. Im März bereits hatte das Handelsblatt unter dem Titel „Anpfiff zum Milliardenspiel“ über die Netzwerkanalyse des internationalen Fußballprofimarktes berichtet. Lothar Krempel vom Kölner Max-Planck-Institut für Gesellschaftsforschung kann in einem einzigen Graphen klarmachen, welche Länder ihre Nationalspieler eher im Ausland oder im Inland spielen hat. Die Netzwerkanalyse ist eine neue Perspektive für den recherchierenden Journalismus.

Dienstag, Juni 6th, 2006

Haiko Lietz hat jetzt die Folien seines Vortrags (PDF, Vorsicht: 4,4 MB) veröffentlicht, den er bei der CAR-Tagung an der Akademie für Publizisitk gehalten hat (siehe auch den Eintrag zu seinem Vortrag bei recherche-info.de).

Sonntag, Mai 21st, 2006

Henk demonstriert einige Methoden, mit deren Hilfe man einschätzen kann, wie zuverlässig die Informationen auf einer Website sind. Schönes Beispiel: Welchen biografischen Informationen über Martin Luther King kann man trauen? Er zeigt erstmal nur die Web-Adressen (URLs) der Seiten:

martinlutherking.org martinlutherking.tk 213.198.79.178/members9/~melski/martinlutherking.htm

www.psd267.wednet.edu/~kfranz/SocialStudies/MLKJr/martinlutherking.htm – die 213.198.79.178/etc.-Adrese ist unvollständig; wird nachgereicht, sobald Henk seine Präsentation schickt. (more…)

Freitag, Mai 19th, 2006

David, früher freier Journalist und heute Korrespondent des Wall Street Journal Europe, erzählt, dass er bei der Gesellschaft für Mathematik und Datenverarbeitung war, Kenntnisse hatte und gerne „gefummelt“ habe. CAR in seinem Verständnis praktiziert er seit den 80er Jahre. Als er dann etwa mit einer Stasi-Recherche begonnen hat, sei das sehr hilfreich gewesen.

(more…)

Freitag, Mai 19th, 2006

Dick arbeitet bei NRC Handelsblad, einer niederländischen Abendzeitung, und bei NRC Next, einem neuen Ableger davon, der sich an jüngere Leser richtet. Schon seit 1993 betreibt Dick CAR und für das Handelsblad viele kleiner und größere Projekte betreut. CAR ist für ihn ein Werkzeug, um journalistische Fragestellungen zu klären.

(more…)

Freitag, Mai 19th, 2006

Robots werden dann eingesetzt, wenn es darum geht, große Datenmengen zu erfassen. Man muss sich jedoch mit Datenformaten auseinandersetzen. Robots sind z.B. die Spider, Crawler etc. von Yahoo, MSN, Google usw. (more…)

Freitag, Mai 19th, 2006

Haiko Lietz hält den ersten Vortrag des Tages zum Thema Social Network Analysis.

Wichtig ist ihm die Unterscheidung von Umfrageforschung und Netzwerkanalyse, da die Umfrageforschung blind für Strukturen ist, die Netzwerkanalyse aber aber get davon aus: das Gesamte ist mehr als Summe der Einzelteile. (more…)

Sonntag, März 12th, 2006

Wie Spiegel Online berichtet, hat die Chicago Tribune mehr als 2600 CIA-Agenten und Tarnfirmen aufgedeckt, indem sie frei zugängliche (im Sinne von “für jeden zugänglich”, nicht im Sinne von kostenlos) Informationen miteinander verknüpft hat. Die Artikel sind (nach kostenloser Registrierung) bei der Tribune abrufbar. Das sollte jetzt jeder schnell machen, der sich für das Thema interessiert, denn bald werden sie ins kostenpflichtige Archiv wandern. Wie die Tribune-Reporter genau vorgegangen sind, verraten sie nicht. Falls einer von uns Zeit findet, legen wir eine Analyse nach. Falls einer unserer Leser eine beisteuern möchte: Wir sind offen für Gastbeiträge.