Kategorie: Allgemein

  • Journalismus & Recherche » Blog Archive » Online-Suchstrategien (1): Suchbegriffe finden

    Der trivialste, mithin aber der schwierigste Schritt einer Online-Recherche, ist die Auswahl der Suchbegriffe. Damit steht und fällt die Effizienz der Recherche: Ist ein falscher Begriff dabei, der in den gesuchten Seiten nicht vorkommt, finde ich diese nicht; sind zu wenige oder zu wenig treffende Begriffe dabei, ertrinke ich in der Vielzahl von Treffern.

    Eine universelle Lösung für dieses Problem habe ich nicht, aber eine Reihe von Regeln und Tipps:

    1.) Möglichst viele Suchbegriffe verwenden, Anzahl der Treffer reduzieren. Solange ich damit keine gewünschten Treffer ausschließe, kann und sollte ich weitere Suchbegriff hinzufügen. Beispiel: Auf der Suche nach dem Originaltext aus Shakespeares Hamlet kann ich dem Kernzitat [„to be or not to be“] problemlos alle weiteren Wörter aus dem Hamlet-Monolog hinzufügen, also: [„to be or not to be – that ist he question“]

    Im Beispiel reduziert sich die Anzahl der Treffer von 1 777 000 auf 704 000.

    2.) Was sind gute Suchbegriffe? Eigennamen von Personen, Werken, Orten, Gebäuden, Organisationen sind sehr gute Suchbegriffe. Solange es sich sinnvoll vermeiden lässt, sollten diese allerdings nicht als Phrase in Anführungszeichen gesucht werden! Die Anführungszeichen verhindern eine Suche nach anderen Schreibweisen, eingeschobenen weiteren Begriffen und anderen Abweichungen. (Am Beispiel einer Personensuche habe ich das hier ausführlich an einem Beispiel erklärt.)

    Im Zweifelsfall kurz die Ergebnisse mit und ohne Anführungszeichen vergleichen!

    3.) Wo finde ich gute Suchbegriffe?

    a) in der Trefferumgebung
    Beispiel: Nach der Eingabe von „to be or not to be“ kann ich, noch bevor ich eine der Trefferseiten aufrufe, weitere Suchbegriffe in der Ergebnisliste der Suchmaschine finden und mit ihnen meine Suchbegriffe ergänzen. In meinem Beispiel etwa die Begriffe [shakespeare hamlet] und die Ergänzung des Zitats (siehe 1.)

    b) in der Wikipedia Zum Einlesen ist sie immer geeignet – vor allem, wenn ich mit dem Thema nicht vertraut bin oder aber in einer Fremdsprache recherchiere. Mit dem Wörterbuch einen Suchbegriff treffend zu übersetzen, gelingt in der Regel nicht.

    Beispiel: ich habe mal lange mit dem Suchbegriff [sects] für Sekten gesucht – die Übersetzung ist zwar treffend, aber aus Gründen der political correctness verwenden die Amerikaner statt [sects] lieber den neutraleren Begriff [religious groups]

    4.) Zwei Ansätze: Nehme ich Suchbegriffe aus der Überschrift oder aus dem Inhalt? Paul Myers (BBC) verwendet die nachfolgende Analogie, wenn er erklärt, wie man an die Auswahl der Suchbegriffe herangehen kann: Gute Sachbücher haben ein Inhaltsverzeichnis und einen Index: Während ich im Index alle relevanten Fundstellen für einen Begriff finde, taucht der Suchbegriff im Inhaltsverzeichnis vielleicht nur an einer Stelle auf, dafür führt er dort zu einem sehr relevanten Eintrag.

    Wer in unserem Beispiel nach [berühmte Zitate Shakespeare] sucht, mag fündig werden, schließt aber alle Treffer aus, die für [berühmt] oder [Zitat] einen anderen Begriff verwenden, etwa auf Englisch.

    Pauls Beispiel zeigt diesen Denkansatz noch besser. Wer nach einer Liste ermordeter Prominenter sucht, kann natürlich überlegen, was jemand, der eine solche Liste erstellt, in die Überschrift schreibt. Schon nach ersten Überlegungen und nur auf Deutsch kommt dabei eine komplexe aber unzureichende Suchanfrage zustande:

    [(Liste OR Verzeichnis OR Übersicht) (ermordet OR getötet OR umgebracht OR erschossen) (Prominenter OR Politiker OR Stars OR Künstler)]

    Eine solche Schnittmengensuche mit Hilfe des Operators OR kann sinnvoll sein (dazu in einer späteren Folge mehr), in diesem Fall ist sie es nicht, da es zu viele Synonyme gibt, und ich diese zudem in 3-4 Sprachen berücksichtigen sollte.

    Zielführender ist hier die Frage: Welche Namen sollten auf der Liste auftauchen?

    [John F. Kennedy] sollte dabei sein. Wer noch? Statt nun weitere ermordete amerikanischen Präsidenten hinzugefügt werden, sollte überlegt werden, welche Namen möglichst einen größeren Zugewinn für diese Suche bringen. Etwa: [John Lennon] gut, ein Künstler, kein Politiker, aber auch USA [Gandhi] gut, anderer Kontinent (und nebenbei gleich 3 Ermordungen: Mahatma Gandhi, sowie Nehrus Tochter Indira Gandhi und deren Sohn Rajiv Gandhi] [Benazir Bhutto] gleicher Kontinent wie Gandhi, aber eine Ermordung, die noch nicht solange zurück liegt, damit werden inaktuelle Listen ausgeschlossen; (damit könnte man Gandhi wieder als Suchbegriff entfernen)

    [Caesar] gute Ergänzung, wenn die Liste, denn auch die ältere Geschichte abdecken soll.

    5.) Aus dem Beispiel unter 4. folgt der allgemeine Rat:
    Stell Dir das Dokument vor, dass Du suchst! Was steht da drauf? Welche Begriffe werden für das, was ich suche, verwendet?
    Tückisch sind viele Behördenseiten. So wird z.B. in Gesetzen und Verordnungen nicht von Prozentsätzen gesprochen, sondern von „von Hundert-Sätzen“ (v.H.) – der Suchbegriff [„v.H.“] ist daher auf der Suche z.B. nach Steuersätzen ein guter und erklärt, warum der Suchbegriff [Prozent OR %] oft weniger gut geeignet ist. Aber Achtung, das Bundesfinanzministerium verwendet in Pressemitteilungen durchaus Prozentangaben. Lösung: [„v.H.“ OR Prozent OR %].

    6.) Und sonst noch: Über Suchbegriffe a) Reihenfolge matters: bei 2 oder 3 Suchbegriffen macht die Reihenfolge einen Unterschied im Ranking der Treffer (nicht in der Anzahl. Beispiel zum Ausprobieren und Merken: [Hilton Paris] vs. [Paris Hilton] b) Synonyme berücksichtigen und mit [OR] verbinden! c) Substantive sind besser als Verben! d) Solange ich kein [+] oder [„“] benutze findet Google auch andere Schreibeweisen und trunkiert meine Suchbegriffe!

    z.B. [photographie] findet sowohl „Fotografie“ als auch „fotografisch“ oder „photographischen“

  • Journalismus & Recherche » Blog Archive » Online-Trainer-Treffen am 8. Juli in Hamburg

    Am kommenden Donnerstag trifft sich ein Dutzend Online-Recherche-Trainer an der Akademie für Publizistik in Hamburg, darunter auch die Macher dieses Blogs.
    Die Anmeldung für Recherchetrainer ist noch möglich – dazu einfach kurz einen eigenen kurzen Programmvorschlag und ein paar Infos zur Person an lindemann [at] autorenwerk.de mailen!

    10.30 Uhr Begrüßung und Vorstellungsrunde

    11.00 Uhr Manfred Redelfs: Vorstellung Lehrmodul Online-Recherche Henri-Nannenschule
    anschl. Diskussion: Probleme bei Seminaren/Didaktik der Online-Recherche

    12.00 Uhr Didaktik der Online-Recherche: Übungen für Online-Seminare

    Könnt Ihr bitte jeder eine Übung mitbringen und vorstellen?

    13.00 Uhr Mittagspause

    Ab hier folgendes Format: 10 minütige Präsentationen mit jeweils 10 Minuten Zeit für Fragen/Anmerkungen:

    14:00 Uhr Marco Maas: Calvinisten-Recherche (http://www.wortfeld.de/2007/04/die_calvinisten_1/) und semantische Suche am Beispiel gopubmed.com (zwei Blöcke) Sebastian Mondial: Open-Source-Gis: Daten aus D & EU in zehn Minuten visualisieren und für das Web vorbereiten.

    Max Ruppert: Recherche in Polen (AT)

    15.00 Uhr Rund um Google Marcus Lindemann: Search-Makros und google-Ads in der Recherche (1 Block)

    Claus Hesseling: Firefox: „Ein Schlüsselwort für die Suche hinzufügen“ und yahoo pipes (1 Block)

    Austausch: Was tut sich bei Google? Über Ungereimtheiten und Neues in der Google-Suche (Input & Moderation: Marcus Lindemann)
    (Stichwörter: einzelne Wörter in Anführungszeichen, * als NEAR-Operator, falsche (?) Trefferzahlen in der OR-Suche, google caffeine).

    16.00 Uhr Tools & Plugins Claus Hesseling: Wikitrust & Default User Agent: der Abendblatt-Hack (1-2 Blöcke)

    Boris Karthäuser: htttrack und ggf. 1 weiterer Block nach Wahl

    Austausch: Was sind die wichtigsten Tools & Plugins?

    17.00 Social Networks Gottlob Schober: Twitter bei der Wahl des Bundespräsidenten (Case-Study)

    Matthias Spielkamp: Twitter in der Recherche (Clients und Listen sinnvoll verwenden, wie funktioniert Rivva Social)

    Austausch: Recherche in Sozialen Netzen (Input & Moderation: N.N. Matthias?)
    (Bitte bringt doch, so vorhanden, eigene Beispiele mit.)

    Ende gegen 18 Uhr

  • Journalismus & Recherche » Blog Archive » re:publica: Open Data and Open Government

    Rob McKinnon stellt vor: OffeneDaten – ein Portal für offene Daten in Deutschland

    McKinnon berichtet davon, dass in Großbritannien bereits drei Regierungsbehörden Open Hackdays veranstaltet haben, um von Hackern zu lernen, wie man Daten organisieren und zugänglich machen kann, die Hackern wiederum haben erfahren, welche Bedürfnisse Behörden haben.

    Er kritisiert allerdings die bisher sehr restriktive Politik der EU, wenn es darum geht, tatsächlich Daten zur Verfügung zu stellen.

    Kleine Linkliste zur Session mit Rob McKinnon über Open-Data-Projekte:

    • Free Risk: US-Site mit Informationen zur Kreditwürdigkeit (credit ratings)
    • Public Whip: Wahlverhalten der UK-Parlamentarier
    • Track Congress: Informationen über den US-Kongress
    • Meta-Seite: Wikipedia – Sammlung von Sites, die Gesetzgebungs- und andere Regierungsverfahren in vrschiebenen Ländern abbilden, indem sie relvante Dokumente zugänglich machen

    Anatomy of Britain – herrliches Beispiel für Datenjournalismus, bevor es das Internet gab.

    Morgen und übermorgen finden in Berlin die ersten deutschen Open Data Hackdays statt, bei der Projekte nicht nur vorgestellt, sondern auch entwickelt werden sollen.

    Am 9. und 10. Juli wird in Hamburg die Jahreskonferenz des Netzwerks Recherche stattfinden, bei der es ebenfalls einen Workshop zum Thema Open Government Data geben wird. Das Programm ist derzeit noch nicht veröffentlicht.

  • Journalismus & Recherche » Blog Archive » Massiert Wang Xiwei in London?

    Ich wundere mich schon länger über den einen oder anderen Kommentar hier im Blog, der zwar augenscheinlich von realen Menschen und nicht von Bots gepostet wurde. Und zwar mehr oder minder auf das Posting einging, aber doch seltsam uninteressiert und inhaltsleer daherkam. Und hatte den leisen Verdacht, das wichtigste daran sei vielleicht die verlinkte Website des (vermeindlichen?) Absenders.

    Jetz hat gerade „massage london“ ein Stück von mir kommentiert. Der Kommentar kommt mit einem Avatar daher, einem Winzbildchen mir folgender URL:

    0.gravatar.com/avatar/e230a9dd061708910438c085ae127145?s=32&d=http%3A%2F%2F0.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D32&r=G

    Daraus das ein größeres Bild zu zaubern, ist kein Problem. Da solche Winzbilder immer maschinell erzeugt sind, braucht es dazu nur etwas Meditation über die Adresse, wie ich kürzlich gezeigt habe. Et voila:
    0.gravatar.com/avatar/e230a9dd061708910438c085ae127145

    Damit bei Google Images gesucht:
    Es ist Wang Xiwei, ein chinesisches Sternchen. Dass die in London massiert, halte ich für wenig wahrscheinlich.

    Dass ich künftig aus zweifelhaften Kommentaren die Absender-URL löschen werde, ist hingegen sicher!

    Nachtrag beim Löschen:
    Der vielbeschäftigte Avatar versuchte sich auch bei einer Automobilwerkstatt in Hackney und in einer Wäscherei in Chelmford. Tüchtig tüchtig!

  • Journalismus & Recherche » Blog Archive » Wann lernen deutsche Medien, was Links sind und warum die gut sind?

    Das ist doch mal eine hübsche Rechercheaufgabe:
    Christine Mattauch schreibt auf Zeit Online in Sachen Wirtschaftspolitik über Die heimlichen Lobbyisten : Warum haben so viele Ökonomen in der Finanzkrise kläglich versagt? Ein Grund könnten die massiven Interessenkonflikte sein, wie eine US-Studie offenbart.
    von Christine Mattauch. – Zeit online, 01.03.2011

    Wohl aus schierem Zeitdruck (oder wie sollte man das sonst erklären?) hat sie vergessen, die Studie zu verlinken. Suchen Sie mal das Originaldokument. Die Auflösung gibt’s in der nächsten Ausgabe des Newsletter Netzwerk Recherche.

    (BTW: Ich habe mir Zeit gelassen und geschlagene fünf Minuten dafür gebraucht. Sei’s drum).

    Tags: Aufgabe, Netzwerk Recherche, Recherche, Wirtschaftspolitik

  • Journalismus & Recherche » Blog Archive » 39e8c8f7eeec9f73f7627154fb50f128 – Schäuble defaced

    Dass man mit sensiblen Daten anders umgehen muss, als mit einem beliebigen Christstollen, das sollte so langsam in dieser Republik bekannt sein – auch Telekom und Bahn sei dank. Gerade bei jenen, die „Sicherheit“ propagieren oder was sie dafür halten.

    Vor diesem Hintergrund ist das Defacement der Website von Bundesinnenminister Wolfgang Schäuble mehr als nur eine Marginale. Die derzeit zwischenzeitlich unerreichbare Site („Page is being generated. If this message does not disappear within 30 seconds, please reload.“) verlinkte zwischenzeitlich auf den AK Vorratsdatenspeicherung.

    Der Hintergrund: Jemand hatte unter Ausnutzung einer bekannten Lücke des auf der Site eingesetzen CMS Typo3 das als MD5-Hash abgelegte Password gefunden. Um den Hash-Wert dann aufzulösen, reicht eine simple Google-Abfrage. Das Passwort für www.wolfgang-schaeuble.de lautete „gewinner“ – man soll es nicht für möglich halten.

    Bedenkt man, welche Gesetze Herr Schäuble auf den Wehg bringt, ist dies Defacement blamabel – und beängstigend.

    Anm.:
    Wegen der Berichterstattung liefert die Google Suche nach dem Hash-Wert zunehmend irreführdende Ergebnisse. Interessant sind vor allem die Md5-Cracker www.md5decrypter.co.uk, milw0rm.org/cracker/insert.php und die Liste unter md5.paniert.org/md5/page1.php (nach kurzem Directoy Stemming: 3.512 pages) NB sollte man diese Liste als Ausschlußkriterium für Passwörter nehmen.

    Anm. 2:
    Für einen Journalisten auf Recherche ist es selbstverständlich nicht angängig, einen Md5-Hash zu cracken und das so gewonnene Passwort zu verwenden. Aber man sollte wissen, dass dergleichen geht.

    Tags: Defacement, Hacking, Md5-Hash, Sicherheit

  • Journalismus & Recherche » Telefonnummer

    Schöne Infoseite, die Nora Kraft in der FAZ am Sonntag (4. Mai, S. 53) präsentiert: Telefonnummern anzurufen, die mit 0180 beginnen, kostet Geld. Von 3,9 Cent bis 14 Cent pro Minute. Die Gröschlein kann man sich sparen, denn die meisten Firmen, die diese Nummern angeben, haben auch „normale“ Festnetznummern. Welche das sind, zeigt das 0180-Telefonbuch von teltarif.de.

    Suchen kann man man nach dem Firmennamen, der 0180er-Nummer und der „Ersatznummer“. Außerdem gibt’s einen alphabetischen Index nach Firmennamen. Letzter verzeichnet allein unter „A“ über 1500 Einträge.

  • Journalismus & Recherche » FAS

    Schöne Infoseite, die Nora Kraft in der FAZ am Sonntag (4. Mai, S. 53) präsentiert: Telefonnummern anzurufen, die mit 0180 beginnen, kostet Geld. Von 3,9 Cent bis 14 Cent pro Minute. Die Gröschlein kann man sich sparen, denn die meisten Firmen, die diese Nummern angeben, haben auch „normale“ Festnetznummern. Welche das sind, zeigt das 0180-Telefonbuch von teltarif.de.

    Suchen kann man man nach dem Firmennamen, der 0180er-Nummer und der „Ersatznummer“. Außerdem gibt’s einen alphabetischen Index nach Firmennamen. Letzter verzeichnet allein unter „A“ über 1500 Einträge.

  • Journalismus & Recherche » Blog Archive » Geburtsdaten kostenlos recherchieren (Kostenloses aus kostenpflichtigen Datenbanken (2))

    Kostenpflichtige Datenbanken haben ihre Berechtigung, ich gebe selbst auch jeden Monat Geld dafür aus … ABER: Oft braucht man die Infos, für die man bezahlen soll, gar nicht, sondern hat schon mit der Trefferliste und/oder der Trefferumgebung genug. Ein paar Beispiele hatte ich schon vor Jahren hier veröffentlicht.

    Nachtragen möchte ich heute, dass sich mit dieser Methode auch kostenlos Geburtsdaten von Prominenten rechercheiren lassen, die nämlich gehören zur Trefferumgebung der Personensuche bei gbi.de – dahinter steht u.a. der Munzinger. (Auf dessen Website es keine Trefferumgebung gibt.)

    Zur Erinnerung: Das Geburtsdatum ist die Information, die man benötigt, um das Alter einer Person anzugeben – mit einer nicht tagesaktuellen Angabe des Alters muss man ansonsten eine Abweichung um ein Jahr in Kauf nehmen.

    Das Thema hat sicherlich noch zahlreiche Variationen – her mit den Beispielen!

  • Journalismus & Recherche » Blog Archive » US Airways 1549: Wie zu einem Flugzeugabsturz recherchieren?

    Ein Flugzeug stürzt in den Hudson River. Alarm in allen Nachrichtenredaktionen. Woher Informationen nehmen, die über das hinaus gehen, was Augenzeugen und Rettungskräfte zu sagen haben?

    Investigative Reporters & Editors hat auf einer Webseite die Ressourcen zusammen gefasst, die in den USA dafür zur Verfügung stehen. Vorbildlich.

    Tags: Flugzeugsabsturz, IRE, US Airways 1549