Archive for January, 2011

Online-Suchstrategien (1): Suchbegriffe finden

Friday, January 21st, 2011

Der trivialste, mithin aber der schwierigste Schritt einer Online-Recherche, ist die Auswahl der Suchbegriffe. Damit steht und fällt die Effizienz der Recherche: Ist ein falscher Begriff dabei, der in den gesuchten Seiten nicht vorkommt, finde ich diese nicht; sind zu wenige oder zu wenig treffende Begriffe dabei, ertrinke ich in der Vielzahl von Treffern.

Eine universelle Lösung für dieses Problem habe ich nicht, aber eine Reihe von Regeln und Tipps:

1.) Möglichst viele Suchbegriffe verwenden, Anzahl der Treffer reduzieren.
Solange ich damit keine gewünschten Treffer ausschließe, kann und sollte ich weitere Suchbegriff hinzufügen. Beispiel: Auf der Suche nach dem Originaltext aus Shakespeares Hamlet kann ich dem Kernzitat [„to be or not to be“] problemlos alle weiteren Wörter aus dem Hamlet-Monolog hinzufügen, also: [„to be or not to be – that ist he question“]
Im Beispiel reduziert sich die Anzahl der Treffer von 1 777 000 auf 704 000.

2.) Was sind gute Suchbegriffe?
Eigennamen von Personen, Werken, Orten, Gebäuden, Organisationen sind sehr gute Suchbegriffe.
Solange es sich sinnvoll vermeiden lässt, sollten diese allerdings nicht als Phrase in Anführungszeichen gesucht werden! Die Anführungszeichen verhindern eine Suche nach anderen Schreibweisen, eingeschobenen weiteren Begriffen und anderen Abweichungen. (Am Beispiel einer Personensuche habe ich das hier ausführlich an einem Beispiel erklärt.)
Im Zweifelsfall kurz die Ergebnisse mit und ohne Anführungszeichen vergleichen!

3.) Wo finde ich gute Suchbegriffe?

a) in der Trefferumgebung
Beispiel: Nach der Eingabe von „to be or not to be“ kann ich, noch bevor ich eine der Trefferseiten aufrufe, weitere Suchbegriffe in der Ergebnisliste der Suchmaschine finden und mit ihnen meine Suchbegriffe ergänzen. In meinem Beispiel etwa die Begriffe [shakespeare hamlet] und die Ergänzung des Zitats (siehe 1.)

b) in der Wikipedia
Zum Einlesen ist sie immer geeignet – vor allem, wenn ich mit dem Thema nicht vertraut bin oder aber in einer Fremdsprache recherchiere. Mit dem Wörterbuch einen Suchbegriff treffend zu übersetzen, gelingt in der Regel nicht.
Beispiel: ich habe mal lange mit dem Suchbegriff [sects] für Sekten gesucht – die Übersetzung ist zwar treffend, aber aus Gründen der political correctness verwenden die Amerikaner statt [sects] lieber den neutraleren Begriff [religious groups]

4.) Zwei Ansätze: Nehme ich Suchbegriffe aus der Überschrift oder aus dem Inhalt?
Paul Myers (BBC) verwendet die nachfolgende Analogie, wenn er erklärt, wie man an die Auswahl der Suchbegriffe herangehen kann: Gute Sachbücher haben ein Inhaltsverzeichnis und einen Index: Während ich im Index alle relevanten Fundstellen für einen Begriff finde, taucht der Suchbegriff im Inhaltsverzeichnis vielleicht nur an einer Stelle auf, dafür führt er dort zu einem sehr relevanten Eintrag.
Wer in unserem Beispiel nach [berühmte Zitate Shakespeare] sucht, mag fündig werden, schließt aber alle Treffer aus, die für [berühmt] oder [Zitat] einen anderen Begriff verwenden, etwa auf Englisch.

Pauls Beispiel zeigt diesen Denkansatz noch besser. Wer nach einer Liste ermordeter Prominenter sucht, kann natürlich überlegen, was jemand, der eine solche Liste erstellt, in die Überschrift schreibt. Schon nach ersten Überlegungen und nur auf Deutsch kommt dabei eine komplexe aber unzureichende Suchanfrage zustande:

[(Liste OR Verzeichnis OR Übersicht) (ermordet OR getötet OR umgebracht OR erschossen) (Prominenter OR Politiker OR Stars OR Künstler)]

Eine solche Schnittmengensuche mit Hilfe des Operators OR kann sinnvoll sein (dazu in einer späteren Folge mehr), in diesem Fall ist sie es nicht, da es zu viele Synonyme gibt, und ich diese zudem in 3-4 Sprachen berücksichtigen sollte.

Zielführender ist hier die Frage: Welche Namen sollten auf der Liste auftauchen?

[John F. Kennedy] sollte dabei sein. Wer noch? Statt nun weitere ermordete amerikanischen Präsidenten hinzugefügt werden, sollte überlegt werden, welche Namen möglichst einen größeren Zugewinn für diese Suche bringen. Etwa:
[John Lennon] gut, ein Künstler, kein Politiker, aber auch USA
[Gandhi] gut, anderer Kontinent (und nebenbei gleich 3 Ermordungen: Mahatma Gandhi, sowie Nehrus Tochter Indira Gandhi und deren Sohn Rajiv Gandhi]
[Benazir Bhutto] gleicher Kontinent wie Gandhi, aber eine Ermordung, die noch nicht solange zurück liegt, damit werden inaktuelle Listen ausgeschlossen; (damit könnte man Gandhi wieder als Suchbegriff entfernen)
[Caesar] gute Ergänzung, wenn die Liste, denn auch die ältere Geschichte abdecken soll.

5.) Aus dem Beispiel unter 4. folgt der allgemeine Rat:
Stell Dir das Dokument vor, dass Du suchst! Was steht da drauf? Welche Begriffe werden für das, was ich suche, verwendet?
Tückisch sind viele Behördenseiten. So wird z.B. in Gesetzen und Verordnungen nicht von Prozentsätzen gesprochen, sondern von „von Hundert-Sätzen“ (v.H.) – der Suchbegriff [„v.H.“] ist daher auf der Suche z.B. nach Steuersätzen ein guter und erklärt, warum der Suchbegriff [Prozent OR %] oft weniger gut geeignet ist. Aber Achtung, das Bundesfinanzministerium verwendet in Pressemitteilungen durchaus Prozentangaben. Lösung: [„v.H.“ OR Prozent OR %].

6.) Und sonst noch: Über Suchbegriffe
a) Reihenfolge matters: bei 2 oder 3 Suchbegriffen macht die Reihenfolge einen Unterschied im Ranking der Treffer (nicht in der Anzahl. Beispiel zum Ausprobieren und Merken: [Hilton Paris] vs. [Paris Hilton]
b) Synonyme berücksichtigen und mit [OR] verbinden!
c) Substantive sind besser als Verben!
d) Solange ich kein [+] oder [„“] benutze findet Google auch andere Schreibeweisen und trunkiert meine Suchbegriffe!
z.B. [photographie] findet sowohl „Fotografie“ als auch „fotografisch“ oder „photographischen“

Suchmaschinen zwischen Informationsfreiheit und Wissensmacht

Tuesday, January 18th, 2011

Drastische Veränderungen im Internet: zunehmend bestimmen die ‘Global Player’ die Regeln. Wie können oder müssen Rechtssysteme darauf reagieren? Wer definiert neue Spielregeln? Wie müssen solche Regeln aussehen, ohne die Kreativität im Netz zu behindern?

Diese Fragen thematisiert eine Fachkonferenz an der Uni Göttingen am 28.01.2011, dem Europäischen Datenschutztag 2011. Nach einer grundlegenden Erörterung von Funktionsweise und Geschäftsmodell von Suchmaschinen werden marken-, datenschutz- und medienrechtliche Aspekte erörtert und von Wissenschaftlern, Datenschutzbeauftragten und Vertretern des Unternehmens Google diskutiert. Die Veranstaltung findet in der Paulinerkirche, Papendiek 14 in Göttingen statt und dauert von 9.00 bis 16.30 Uhr.

Bereits am 27.1. erörtern die Veranstalter in ihren öffentlichen Antrittsvorlesungen ab 16.15 Uhr in der Aula am Wilhelmsplatz in Göttingen die Themen “Internet-Suchmaschinen im Fokus des Kartellrechts” (Prof. Körber) bzw. “Vertrauensschutz und geistiges Eigentum am Beispiel der Suchmaschinen” (Prof. Wiebe).

Veranstaltet wird die Tagung von den Professoren Torsten Körber und Andreas Wiebe an der Georg-August-Universität Göttingen. Sie wird durch den Universitätsbund gefördert.

Anmeldungen bis bis zum 20.01. erbeten:
http://www.uni-goettingen.de/de/198986.html

Online-Recherche: Suchmaschinen-Syntax (2/4)

Friday, January 7th, 2011

Heute nun Teil zwei der Suchmaschinen-Syntax: die Funktionen, die über die erweiterte Suche nicht zur Verfügung stehen bzw. zum Teil auch gar nicht dokumentiert sind sowie die beiden Funktionen von Google (related und link), die nicht mit anderen Operatoren kombinierbar sind.

Beim Ausprobieren ist mir klar geworden, dass (bis auf einen) all diese Operatoren bei Google, nicht aber bei Bing funktionieren. Die Ausnahme ist der schöne Operator [ip:] mit dem sich alle Seiten auf einem Server mit der angegebenen IP-Adresse finden lassen - das funktioniert aber nur bei Bing und nicht bei Yahoo.

Die Übersicht habe ich im gleichen Layout wie den ersten Teil gestern erstellt und sie findet sich jetzt hier (pdf).

Am Wochenende gibt es dann den Rest zu den erweiterten Suchen und eine Sammlung der bis dahin vergessenen Hinweise zur Suchmaschinen-Handhabung. Ab Montag startet dann eine Reihe über Suchstrategien - erstmal für eine Woche.

Ergänzungen, Fehlerhinweise etc gerne!

Online-Recherche: Suchmaschinen-Syntax (1/4)

Thursday, January 6th, 2011

Ab heute stelle ich - hoffentlich täglich - Teile meines Buchkapitels (Grundsätzliches dazu hier) über Recherche hier online. Beginnen will ich mit dem Teil, der unstrittig ins Buch gehört: Die Frage wie man vernünftig online recherchiert.
Dazu will ich zunächst die Suchmaschinen-Syntax und dann eine Reihe von komplexeren Suchstrategien präsentieren: Search-Makros, gezielte Befragung einer Online-Quelle, Suchbegriffe suchen und finden (Wie heißt das was ich suche? Inhalte oder Überschriften suchen?), Personensuche, Datenbanken und andere DeepWeb Quellen erschließen. Grundlage ist mein Vortrag Suchstrategien, den ich auf der #nr10 gehalten habe - ergänzt um das, was ich seither dazu gelernt habe.

Zu meiner Darstellungs-Syntax: Ich schreibe Suchbegriffe in eckige Klammern [christian jakubetz], wenn ich nach dem Herausgeber des Buches ohne Anführungszeichen suche (Warum das eine gute Idee ist, erkläre ich in der Folge über Personensuche!) bzw. [„Christian Jakubetz“], wenn ich ihn in Anführungszeichen suche.

Weil es übersichtlicher ist, habe ich die Syntax hier in einem pdf in einer Tabelle dargestellt.

Morgen folgt Teil zwei mit der Syntax, die nicht dokumentiert ist und der, die nicht mit der Syntax aus diesem Teil kombiniert werden kann. Teil 3 dann mit den übrigen Funktionen der erweiterten Suche(n) und Teil 4 mit allem, was sonst noch Grundlegendes über Google, Bing und Co vergessen wurde.

All das ist work in progress für das Buch: Daher freue ich mich über bessere Beispiele, Korrekturen, Ergänzungen!

Recherche heute: Thesen für einen handwerklichen Buchbeitrag

Tuesday, January 4th, 2011

Nach vielen anderen Kollegen, die sich mit der Frage beschäftigen, wie sich der Journalismus nach 1995 (mit dem Wachstum des Internets) verändert hat und was man in Zukunft wissen muss, bin ich kurz vor Weihnachten gefragt worden, zu dem Buchprojekt unter Leitung von Christian Jakubetz ein Kapitel über Recherche beizusteuern.
Meine ersten Gedanken hierzu will ich gerne hier diskutieren. Wichtig ist der Auftrag: Die Aufgabe des Buchs soll die Vermittlung von Handwerkszeug sein, nicht das Verbreiten von Thesen über die Bedeutung der Recherche etc. Dass ich nachfolgend dennoch mit Thesen arbeite, soll der Diskussion helfen; im Buchkapitel dann steht das Handwerk dann im Vordergrund.
Abgesehen von exemplarischen Suchmaschinen-Anfragen (mit den universellen Operatoren von Google/Bing/Yahoo) möchte ich allerdings darauf verzichten, einzelne Tools, etwas Programme oder Websites vorzustellen.

Wie verändert sich das Recherche-Handwerk durch die Digitalisierung?

1.) Recherche folgt den althergebrachten methodischen Prinzipien und muss ethischen, journalistischen und
juristischen Ansprüchen genügen – egal ob sie online oder offline stattfindet.

a) Prinzipien: Zwei-Quellen-Regel/Quellenlage transparent machen, von außen nach innen (mit
Einschränkung), Vollständigkeit, Plausibilität, Gegenseite hören.

b) Ansprüche: juristisch zulässig, journalistisch sorgfältig und angemessen, ethisch begründbar, d.h.
nach erfolgter Abwägung öffentliches Interesse vs. Einzelinteressen.

2.) Die Unterscheidung zwischen online und offline Recherche ist daher sinnlos und führt zu mehr Problemen
als Lösungen. Eine reine online-Recherche ist methodisch ebenso ungenügend oder zumindest ineffizient
wie eine reine offline-Recherche. (Bei einigen Themen sind Ausnahmen denkbar.)
Journalisten heute müssen permanent abwägen, welche Tools on- wie offline, am effizientesten sind.

3.) Zum Minimalkanon der Internetrecherche gehört ein Grundverständnis der Funktionsweise von
Suchmaschine, der zugehörigen Suchoperatoren und der Quellenprüfung. (ausführlicher Minimalkanon im
Kapitel)
Soll man hier auch einen Minimalkanon der offline-Recherche formulieren oder auch den Minimalkanon
„Presserecht für Rechercheure“?

4.) Das unter 3. beschriebene Handwerkszeug muss dann kreativ, strategisch, sinnvoll eingesetzt werden.
Beispiele für Online-Strategien: Finden von Suchbegriffen, gezieltes Befragen einer Quelle, kostenlose
Nutzung kostenpflichtiger Datenbanken.
Beispiel für Offline-Strategien: Factchecking, Pendeln, Informanten finden, sich selbst zum Protagonist
machen…

5.) Die Welt verändert sich, online wie offline. (Offline sei nur an die Informationsfreiheitsgesetze erinnert.)
Journalistische Bildung braucht kontinuierliche Updates. Redaktionsmanager müssen dies ebenso wie das
redaktionsinterne Wissensmanagement organisieren.

Das Buchkapitel könnte dann folgende Gliederung haben:
I. Was schon immer galt: Prinzipien und Anforderungen an Recherche
II. Minimalkanon der Offline-Recherche
III. Minimalkanon der Online-Recherche
IV. Minimalkanon Presserecht und Recherche
V. Recherche ist immer unter Zeit- und Rechtfertigungsdruck: Wie gehe ich damit um?
(Was macht Recherche effizienter, wie gehe ich mit unklaren Quellen um etc.)
VI. Exemplarische Strategien für (on- und offline) Recherche
VII. Ausblick mit Beispielen: Computer Assisted Reporting

Ich freue mich über Widerspruch, Ergänzungen, Anmerkungen!