recherche-info

Kategorie: Allgemein

Termine – Journalismus & Recherche

Hier eine Übersicht der geplanten Webinare und Seminare mit Marcus Lindemann. Teilweise gibt es Zugangsbeschränkungen (nur Volontäre, nur Mitarbeiter eines Senders). Nicht aufgelistet sind geschlossene Veranstaltungen (inhouse, Journalistenschulen).

(wird in Kürze aktualisiert)

Daneben unterrichte ich inhouse (insbesondere Recherchetraining und Online-Recherche) sowie in Volontärskursen der Evangelischen Journalistenschule, der Akademie für Publizistik, , der Deutschen Journalistenschule, der Burda-Journalistenschule, der SWMH-Akademie, an der Hochschule Darmstadt (Campus Dieburg) und der Leipzig School of Media.

Anfragen für inhouse-Seminare bitte direkt an lindemann [at] autorenwerk.de.

7. Oktober 2024
Yahoo ab. Ask weg. Suchmaschinenmarkt wird enger – Journalismus & Recherche

Es wird enger auf dem Markt der großen Suchmaschinen. Yahoo tritt in Folge der „Search Alliance“ mit Microsoft faktisch ab. Die Suchmaschine wird Bing-Ergebnisse liefern. Sogar die Verzeichnisse werden, scheint’s, nicht überleben; gerade wurde das britisch-irische eingestellt. Wolfgang Bleh bringt es fein auf den Punkt: „Wenn man heute möglichst knapp beschreiben will, was Yahoo ist, dann heißt die Antwort: ‚Der größte ausländische Anteilseigner des chinesischen B2B-Handelsplatzes Alibaba‘.“
Jetzt meldet die Süddeutsche, dass auch Ask die Segel streicht.
Bedenklich ist das schon. An großen Universalsuchmaschinen bleiben Google, Bing und Exalead. Bing kann – nicht nur wegen des miserablen Interface für die Limitatoren der erweiterten Suche – nicht wirklich überzeugen, Google ist mit über 90% Marktanteil bei der Websuche faktisch Monopolist.
Dass das nicht so bleiben muss, darauf wies kürzlich Dr. Sander-Beuermann (SuMa e.V.) im DeutschlandRadio hin.
Hoffentlich begreifen findige Entwickler, dass in der Suchmaschinentechnik noch Luft nach oben ist.

7. Oktober 2024
Robots im journalistischen Einsatz – Sebastian Moericke – Journalismus & Recherche
Robots werden dann eingesetzt, wenn es darum geht, große Datenmengen zu erfassen. Man muss sich jedoch mit Datenformaten auseinandersetzen. Robots sind z.B. die Spider, Crawler etc. von Yahoo, MSN, Google usw.

Eine typische Datenerfassung läuft ab nach dem Schema:
- Fragestellung
- Quellen- und Formatanalyse
- Auswahl Erfassungswerkzeug (Robot, Survey, Script)
- Anpassung, Testlauf
- Erfassung und Ablage
- Verarbeitung und Analyse
- Story!
„Prozent is your friend“: % ist ein „Stemming“-Zeichen für Datenbankabfragen. Wenn der Programmierer gepennt hat, kann man mit der Einagbe des %-Zeichens den gesamten Datenbankinhalt auf einen Schlag abfragen. Beispiel: PISA Fragestellung: Langfristige Entwicklung der Schulen. Problem: Daten werden z.T. nicht so lange gespeichert oder sind unmöglich einzeln im Nachhinein zu erfassen. Normale Lösung: Vereinfachen, begrenzen. Das Problem daran ist die eingeschränkte Perspektive, also wenn man etwa die Rütli-Schule auswählt. CAR hilft hier bei der Langzeit-Datenextraktion und Speicherung: Welche Klassenstärke, wieviel Schüler etc. Die Daten sind auch kostenpflichitg zu bekommen, aber relativ teuer (700 Euro). Schwierigkeit: Länder haben Bildungshoheit, so dass die Daten in x Quellen und n Formaten vorliegen. Die CAR-Lösung ist, Datenadapter zu schreiben für verschiedene Bundesländer. Sebastian führt vor, wie er einen Server des NRW-Bildunsgministeriums abfragt, bekommt durch Einsatz des %-Zeichens alle Datensätze angezeigt: Schulform, Ort, Adresse etc. Die Idee dahinter: Analyse der Vorher-/Nachher-Versprechen zur Schulpoliitk. Sebastian speichert Quelltext der Seite, lässt ihn anzeigen und demonstriert, wie man in diesen Informationen Muster erkennen kann. Um die Daten zu extrahieren, kann man nun einen Robot einsetzen. Zur Demonstration ersetzt Sebastian bestimmte Teile eines Datenausschnitts durch Leerzeichen (mithilfe der „Suchen und Ersetzen“-Funktion des Texteditors). So kann man auf diese Art bestimmte Listen erstellen, etwa alle offenen Gesamtschulen, oder auch eine Aufschlüsselung der Kurse, die an diesem Gesamtschulen unterrichtet und belegt werden. Die Idee etwa für eine Geschichte, die man mit derartigen Daten unterstützen könnte: Wie verändern sich die Vorlieben von Schülern bei der Wahl der Sprachen, die sie lernen? Diese Daten bekäme man unter Umständen auch von der Pressestelle, aber nicht immer – und auch nicht kostenlos. Sebastian demonstriert eine Anwendung mit dem Mac-Robot „Anthrazite“, aber diese Präsentation ist zum Bloggen zu aufwändig. In mehreren Schritten extrahiert er die Daten aus den Webseiten der 614 Bundestagsabgeordneten, um sie dann in einer Tabelle sortieren zu lassen – nach Religions- oder Ausschusszugehörigkeit und vielem mehr. Das lässt sich „von Hand“ nur noch schwer erreichen. Man kann dabei systematische Fehler machen, aber z.B. keinen Fehler beim Abtippen. Kapau ist für derartige Analysen das beste Werkzeug, aber die Lizenz ist sehr teuer. Marcus Lindemann ergänzt, dass die dänische Organisation DICAR, mit der es eine Zusammenarbeit gibt, bei Bedarf ihr Programm zur Verfügung stellen würde, wenn es eine sinnvolle journalistische Anwendung dafür gibt.

Sebastian, der demnächst auch hier bloggen wird, wird bald eine Liste mit den Programmen hier ergänzen.
7. Oktober 2024
Studie – Journalismus & Recherche

Eigentlich wollte ich nur kurz auf die Studie von drei Forschern des MIT hinweisen: Inferring Social Network Structure using Mobile Phone Data.
Gefunden bei der Humanistischen Union via netzpolitik.org. Weitere Meldung beim VirDSB.
Vor dem Hintergrund der ~~Vorratsdatenspeicherung~~ elektronischen Totalüberwachung ist die Studie eine gute Argumentationshilfe:

7. Oktober 2024
Massiert Wang Xiwei in London? – Journalismus & Recherche

Ich wundere mich schon länger über den einen oder anderen Kommentar hier im Blog, der zwar augenscheinlich von realen Menschen und nicht von Bots gepostet wurde. Und zwar mehr oder minder auf das Posting einging, aber doch seltsam uninteressiert und inhaltsleer daherkam. Und hatte den leisen Verdacht, das wichtigste daran sei vielleicht die verlinkte Website des (vermeindlichen?) Absenders.
Jetz hat gerade „massage london“ ein Stück von mir kommentiert. Der Kommentar kommt mit einem Avatar daher, einem Winzbildchen mir folgender URL:

0.gravatar.com/avatar/e230a9dd061708910438c085ae127145?s=32&d=http%3A%2F%2F0.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D32&r=G

Daraus das ein größeres Bild zu zaubern, ist kein Problem. Da solche Winzbilder immer maschinell erzeugt sind, braucht es dazu nur etwas Meditation über die Adresse, wie ich kürzlich gezeigt habe. Et voila:
0.gravatar.com/avatar/e230a9dd061708910438c085ae127145
Damit bei Google Images gesucht: Es ist Wang Xiwei, ein chinesisches Sternchen. Dass die in London massiert, halte ich für wenig wahrscheinlich. Dass ich künftig aus zweifelhaften Kommentaren die Absender-URL löschen werde, ist hingegen sicher!

Nachtrag beim Löschen:

Der vielbeschäftigte Avatar versuchte sich auch bei einer Automobilwerkstatt in Hackney und in einer Wäscherei in Chelmford. Tüchtig tüchtig!

7. Oktober 2024
August 2009 – Seite 2 – Journalismus & Recherche

„My belief is that every single major magazine cover is retouched,“ so Scott Kelby, Präsidentin der Florida-based National Assn. of Photoshop Professionals. Das weiß eigentlich jeder, zur Demonstration reicht ein Blick in die Auslage eines beliebigen Kiosk, Abteilung Fernsehmagazine: Lächelnde, langhaarige, meist blonde Frauen mit e-normem Dekolleté und blendend weißen Zähnen vor blauem Hintergrund. Man muss immer erst nachlesen, wer diese steril dargestellte Person in echt denn sein soll.

7. Oktober 2024
David Schraven, Hannelore Kraft und archive.org – Journalismus & Recherche

Der Wächterpreisträger David Schraven hat im Blog Ruhrbarone, das er mit KollegInnen betreibt, einen Artikel darüber geschrieben, wie Hannelore Kraft, SPD-Vorsitzende in Nordrhein-Westfalen, ihren Lebenslauf geändert hat. Ein schönes Beispiel für den Einsatz der Wayback Machine von archive.org. Schraven hatte eine ältere Version der Kraftschen Website dort angeschaut und festgestellt, dass Informationen verändert worden waren. Wie wichtig das ist, darüber gibt es nun Streit. Aber das ist eine andere Geschichte.

7. Oktober 2024
Picasa erlaubt nun Suche nach Bildern unter Creative-Commons-Lizenz – Journalismus & Recherche

Weil die Frage auch in Seminaren immer mal wieder gestellt wird („Wo finde ich Bilder, die ich auf der eigenen Website verwenden kann?“), hier der Hinweis auf Picasa, Googles Konkurrenz-Angebot zu Flickr. Nun kann man auch dort nach CC-lizenzierten Bildern suchen (in der linken Menüspalte, die man nur sieht, wenn man Javascript eingeschaltet hat).

7. Oktober 2024
Online-Lexika der bpb – Journalismus & Recherche

Die Bundeszentrale für politische Bildung (bpb) ermöglicht auf ihrer Website die Suche in einigen Speziallexika.
Das sind:

– Pocket Politik. Demokratie im Klartext für Jugendliche.

– Pocket Europa. Europa verständlich.
– Politiklexikon. 1.300 Stichworte, kurz definiert. – Handwörterbuch Politik. 150 Kernbegriffe, gründlich erklärt. – Wirtschaft. Grundlagen und aktuelle Daten der Ökonomie.

– Islam. Geschichte, Alltag und Kultur in 400 Artikeln.

– Fischer Weltalmanach. Alle Staaten der Erde, Organisationen und Personen der Weltpolitik.

7. Oktober 2024
Die Ente aus dem Kuckucksei: Steve Jobs totgesagt – Journalismus & Recherche

Der arme Steve Jobs! Über seine Erscheinung und seinen Gesundheitszustand wurde öffentlich so stark spekuliert, dass es den Aktienkurs von Apple beeinflusste. Totgesagt wurde er auch schon mal, oder genauer: Bloomberg financial newswire hatte am 27.08.2008 einen augenscheinlich auf Vorrat verfassten Nachruf (immerhin 17 Seiten!) versehentlich online gestellt.
Und nun das: Auf der Site von Wired erschien am 22. Januar die Meldung, Jobs sei einem Herzinfarkt erlegen („Breaking: Steve Jobs in has had a Cardiac Arrest„)
Ein Hoax, eine Ente. Jemand hatte eine Schnittstelle zum Hochladen von Bildern (einen Online-Viewer) genutzt, um einen gefakten Artikel als Grafik auf die Site zu bringen, wo er dann unter dem Wired-Logo erschien. Den Link darauf verbreitete er bei Twitter. So leicht geht das also; scheint’s eine besondere Form des „user generated content“ – ein Kuckucksei. Viele Leser der Ente werden vermutlich nicht gemerkt haben, dass sie eine Grafik lesen, statt eines gerenderten Textes. Wohl auch, weil darüber das Logo eines bekannten Mediums prangte. Wired hat die Lücke mittlerweile geschlossen.

(gefunden bei intern.de)

7. Oktober 2024