Archive for the ‘Google-Basics’ Category

Besser online recherchieren: Kann man eigentlich Google-Ergebnisse nach Datum sortieren?

Tuesday, September 16th, 2014

Ja.

Und das geht so:

Google sortiert prinzipiell nach seinen eigenen Relevanz-Kriterien.
(Nebenbei: Der genau Alogrythmus hierzu ist so geheim wie die Coca-Cola-Formel, aber die Hauptkritierien sind genauso bekannt wie die Zutaten von Coca-Cola.)

Aber: Die Suchoption „Zeitraum festlegen“ erlaubt, die Treffer auf beliebige Zeiträume einzuschränken. Und jetzt kommt der Trick: Ein solcher Zeitraum kann auch lauten „vor 31.12.2014“ (oder bis zum heutigen Datum), also alle aktuell bekannten Treffer enthalten. Sobald diese Suchoption eingestellt wurde, lässt sich dann auch die Sortierung ändern (siehe screenshot) und man erhält die Treffer in absteigener Sortierung. Durch eine Veränderung des festgelegten Zeitraums kann man dann auch gezielt zu älteren Treffern springen, ohne sich durch die Trefferlisten klicken zu müssen.

Datumsortierung mit Google

Das Ganze funktioniert (natürlich) nur so gut wie die Datumssortierung bei Google funktioniert - und die hat ihre Macken. Schwierigkeiten bereiten oftmals Inhalte auf Nachrichtenseiten, den neben älteren Inhalten auch akutelle Schlagzeilen enthalten (und umgekehrt).

Trés chic: Richtig gugeln als Infografik

Tuesday, November 29th, 2011

Trés chic: Richtig gugeln als Infografik. Leider nur auf Englisch.

UND ODER wie jetzt bei Google? Ist der AND-Operator weg?

Thursday, November 3rd, 2011

Google hat den AND-Operator abgeschafft und durch Mist OR ersetzt. Naja, fast. Darüber schreibt z.B. Wolfgang Bleh auf intern.de. Ein Selbsttest:

(more…)

Kurz notiert: Google Alerts verbessert

Monday, February 28th, 2011

Google Alerts bietet seit kurzem eine zusätzliche Auswahl an - nämlich, ob man „alle Ergebnisse“ oder aber nur die „relvantesten“ haben möchte.
Bislang habe ich an der Alerts ja bemängelt, dass eben nicht alle Treffer aus dem Index gezeigt werden, sondern nur die - gefühlt - top 200 bis 250. Bei einer Google-Suche zu einem vorhandenen Alert konnte man bislang noch nicht von Google per Alert gemeldete Seiten finden.

Wichtig: Für alle vorhandenen Alerts muss man die Einstellung auf „alle“ ändern, sonst hat man nicht von dieser Verbesserung.

Die New York Times über Google und SEO: Die schmutzigen kleinen Suchtricks

Sunday, February 13th, 2011

In dem fantastischen Artikel The Dirty Little Secrets of Search beschreibt David Segal, wie die Firma für Suchmaschinen-Optimierung (SEO) SearchDex, offenbar im Auftrag der US-Kaufhauskette J.C. Penny, erfolgreich Googles Relevanz-Algorithmus hereingelegt hat. Die Geschichte ist ein Recherche-Lehrstück und zugleich spannende Aufklärung darüber, wie Googles Suche funktioniert.

Online-Suchstrategien (1): Suchbegriffe finden

Friday, January 21st, 2011

Der trivialste, mithin aber der schwierigste Schritt einer Online-Recherche, ist die Auswahl der Suchbegriffe. Damit steht und fällt die Effizienz der Recherche: Ist ein falscher Begriff dabei, der in den gesuchten Seiten nicht vorkommt, finde ich diese nicht; sind zu wenige oder zu wenig treffende Begriffe dabei, ertrinke ich in der Vielzahl von Treffern.

Eine universelle Lösung für dieses Problem habe ich nicht, aber eine Reihe von Regeln und Tipps:

1.) Möglichst viele Suchbegriffe verwenden, Anzahl der Treffer reduzieren.
Solange ich damit keine gewünschten Treffer ausschließe, kann und sollte ich weitere Suchbegriff hinzufügen. Beispiel: Auf der Suche nach dem Originaltext aus Shakespeares Hamlet kann ich dem Kernzitat [„to be or not to be“] problemlos alle weiteren Wörter aus dem Hamlet-Monolog hinzufügen, also: [„to be or not to be – that ist he question“]
Im Beispiel reduziert sich die Anzahl der Treffer von 1 777 000 auf 704 000.

2.) Was sind gute Suchbegriffe?
Eigennamen von Personen, Werken, Orten, Gebäuden, Organisationen sind sehr gute Suchbegriffe.
Solange es sich sinnvoll vermeiden lässt, sollten diese allerdings nicht als Phrase in Anführungszeichen gesucht werden! Die Anführungszeichen verhindern eine Suche nach anderen Schreibweisen, eingeschobenen weiteren Begriffen und anderen Abweichungen. (Am Beispiel einer Personensuche habe ich das hier ausführlich an einem Beispiel erklärt.)
Im Zweifelsfall kurz die Ergebnisse mit und ohne Anführungszeichen vergleichen!

3.) Wo finde ich gute Suchbegriffe?

a) in der Trefferumgebung
Beispiel: Nach der Eingabe von „to be or not to be“ kann ich, noch bevor ich eine der Trefferseiten aufrufe, weitere Suchbegriffe in der Ergebnisliste der Suchmaschine finden und mit ihnen meine Suchbegriffe ergänzen. In meinem Beispiel etwa die Begriffe [shakespeare hamlet] und die Ergänzung des Zitats (siehe 1.)

b) in der Wikipedia
Zum Einlesen ist sie immer geeignet – vor allem, wenn ich mit dem Thema nicht vertraut bin oder aber in einer Fremdsprache recherchiere. Mit dem Wörterbuch einen Suchbegriff treffend zu übersetzen, gelingt in der Regel nicht.
Beispiel: ich habe mal lange mit dem Suchbegriff [sects] für Sekten gesucht – die Übersetzung ist zwar treffend, aber aus Gründen der political correctness verwenden die Amerikaner statt [sects] lieber den neutraleren Begriff [religious groups]

4.) Zwei Ansätze: Nehme ich Suchbegriffe aus der Überschrift oder aus dem Inhalt?
Paul Myers (BBC) verwendet die nachfolgende Analogie, wenn er erklärt, wie man an die Auswahl der Suchbegriffe herangehen kann: Gute Sachbücher haben ein Inhaltsverzeichnis und einen Index: Während ich im Index alle relevanten Fundstellen für einen Begriff finde, taucht der Suchbegriff im Inhaltsverzeichnis vielleicht nur an einer Stelle auf, dafür führt er dort zu einem sehr relevanten Eintrag.
Wer in unserem Beispiel nach [berühmte Zitate Shakespeare] sucht, mag fündig werden, schließt aber alle Treffer aus, die für [berühmt] oder [Zitat] einen anderen Begriff verwenden, etwa auf Englisch.

Pauls Beispiel zeigt diesen Denkansatz noch besser. Wer nach einer Liste ermordeter Prominenter sucht, kann natürlich überlegen, was jemand, der eine solche Liste erstellt, in die Überschrift schreibt. Schon nach ersten Überlegungen und nur auf Deutsch kommt dabei eine komplexe aber unzureichende Suchanfrage zustande:

[(Liste OR Verzeichnis OR Übersicht) (ermordet OR getötet OR umgebracht OR erschossen) (Prominenter OR Politiker OR Stars OR Künstler)]

Eine solche Schnittmengensuche mit Hilfe des Operators OR kann sinnvoll sein (dazu in einer späteren Folge mehr), in diesem Fall ist sie es nicht, da es zu viele Synonyme gibt, und ich diese zudem in 3-4 Sprachen berücksichtigen sollte.

Zielführender ist hier die Frage: Welche Namen sollten auf der Liste auftauchen?

[John F. Kennedy] sollte dabei sein. Wer noch? Statt nun weitere ermordete amerikanischen Präsidenten hinzugefügt werden, sollte überlegt werden, welche Namen möglichst einen größeren Zugewinn für diese Suche bringen. Etwa:
[John Lennon] gut, ein Künstler, kein Politiker, aber auch USA
[Gandhi] gut, anderer Kontinent (und nebenbei gleich 3 Ermordungen: Mahatma Gandhi, sowie Nehrus Tochter Indira Gandhi und deren Sohn Rajiv Gandhi]
[Benazir Bhutto] gleicher Kontinent wie Gandhi, aber eine Ermordung, die noch nicht solange zurück liegt, damit werden inaktuelle Listen ausgeschlossen; (damit könnte man Gandhi wieder als Suchbegriff entfernen)
[Caesar] gute Ergänzung, wenn die Liste, denn auch die ältere Geschichte abdecken soll.

5.) Aus dem Beispiel unter 4. folgt der allgemeine Rat:
Stell Dir das Dokument vor, dass Du suchst! Was steht da drauf? Welche Begriffe werden für das, was ich suche, verwendet?
Tückisch sind viele Behördenseiten. So wird z.B. in Gesetzen und Verordnungen nicht von Prozentsätzen gesprochen, sondern von „von Hundert-Sätzen“ (v.H.) – der Suchbegriff [„v.H.“] ist daher auf der Suche z.B. nach Steuersätzen ein guter und erklärt, warum der Suchbegriff [Prozent OR %] oft weniger gut geeignet ist. Aber Achtung, das Bundesfinanzministerium verwendet in Pressemitteilungen durchaus Prozentangaben. Lösung: [„v.H.“ OR Prozent OR %].

6.) Und sonst noch: Über Suchbegriffe
a) Reihenfolge matters: bei 2 oder 3 Suchbegriffen macht die Reihenfolge einen Unterschied im Ranking der Treffer (nicht in der Anzahl. Beispiel zum Ausprobieren und Merken: [Hilton Paris] vs. [Paris Hilton]
b) Synonyme berücksichtigen und mit [OR] verbinden!
c) Substantive sind besser als Verben!
d) Solange ich kein [+] oder [„“] benutze findet Google auch andere Schreibeweisen und trunkiert meine Suchbegriffe!
z.B. [photographie] findet sowohl „Fotografie“ als auch „fotografisch“ oder „photographischen“

Online-Recherche: Suchmaschinen-Syntax (1/4)

Thursday, January 6th, 2011

Ab heute stelle ich - hoffentlich täglich - Teile meines Buchkapitels (Grundsätzliches dazu hier) über Recherche hier online. Beginnen will ich mit dem Teil, der unstrittig ins Buch gehört: Die Frage wie man vernünftig online recherchiert.
Dazu will ich zunächst die Suchmaschinen-Syntax und dann eine Reihe von komplexeren Suchstrategien präsentieren: Search-Makros, gezielte Befragung einer Online-Quelle, Suchbegriffe suchen und finden (Wie heißt das was ich suche? Inhalte oder Überschriften suchen?), Personensuche, Datenbanken und andere DeepWeb Quellen erschließen. Grundlage ist mein Vortrag Suchstrategien, den ich auf der #nr10 gehalten habe - ergänzt um das, was ich seither dazu gelernt habe.

Zu meiner Darstellungs-Syntax: Ich schreibe Suchbegriffe in eckige Klammern [christian jakubetz], wenn ich nach dem Herausgeber des Buches ohne Anführungszeichen suche (Warum das eine gute Idee ist, erkläre ich in der Folge über Personensuche!) bzw. [„Christian Jakubetz“], wenn ich ihn in Anführungszeichen suche.

Weil es übersichtlicher ist, habe ich die Syntax hier in einem pdf in einer Tabelle dargestellt.

Morgen folgt Teil zwei mit der Syntax, die nicht dokumentiert ist und der, die nicht mit der Syntax aus diesem Teil kombiniert werden kann. Teil 3 dann mit den übrigen Funktionen der erweiterten Suche(n) und Teil 4 mit allem, was sonst noch Grundlegendes über Google, Bing und Co vergessen wurde.

All das ist work in progress für das Buch: Daher freue ich mich über bessere Beispiele, Korrekturen, Ergänzungen!

Digitale Zeitungsarchive

Sunday, November 1st, 2009

Die FAZ hat eine Linkliste zu digitalen Zeitungsarchiven veröffentlicht, denn:

Alte Zeitungen sind das beste Archiv des Alltags, das wir haben. In vielen Blättern, die zum Teil mehr als 200 Jahre alt sind, kann man online stöbern. Unsere Linksammlung zeigt die besten Adressen im Netz.

Eine dankenswerte Aufgabe. Ergänzen möchte ich zwei Informationen, weil ich oft genug in Seminaren erfahre, dass sie nicht bekannt sind: Das Archiv des Spiegels ist inzwischen im Volltext bis zurück zur ersten Ausgabe durchsuchbar - kostenlos. Und wenn man mal auf einen Artikel in der FAZ stößt, der angeblich nur im kostenpflichtigen Archiv vorhanden ist (man suche z.B. nach „Reto Hilty“), sollte man erstmal mit Googles Site-Funktion suchen, bevor man’s glaubt (geht auch bei Yahoo über die erweiterte Suche oder bei Bing mit der Site-Funktion).

Googles OR-Operator kaputt?

Wednesday, January 21st, 2009

Habe ich was verpasst? Warum funktioniert Googles boolscher Operator OR nicht mehr, oder zumindest im Moment nicht?

Wenn ich nach „albrecht ude“ suche, bekomme ich 1.730 Treffer, suche ich nach „albrecht ude“ OR „ude albrecht“, bekomme ich 1.820 Treffer - so weit, so gut.

Suche ich aber nach iRights.info, gibt’s 31.700 Treffer, bei irights.info OR irights.de aber nur 30.200. Das hat nichts mit der Unschärfe bei hohen Trefferzahlen zu tun, man kann das auch reproduzieren mit z.B.  „hermann spielkamp“ (170 Treffer) und „hermann spielkamp“OR „spielkamp hermann“ (107 Treffer).

Die URLs sehen auch nicht gerade so aus, als würden die Suchanfrage „richtig übersetzt“: http://www.google.de/search?hl=de&q=“hermann+spielkamp“OR+“spielkamp+hermann“. Was machen die Plus-Zeichen an den Stellen, an denen sie nichts zu suchen haben?

Es ändert sich auch nichts, wenn man es über die erweiterte Suche probiert, oder auch advanced search in der .com-Version, wo das Menue ja überarbeitet worden ist, um genau diese ODER-Funktion etwas einfacher verständlich zu machen.

Sehr seltsam. Hat jemand etwas darüber gehört, dass/warum da geschraubt wird?

whitehouse.gov/robots.txt – change has come

Wednesday, January 21st, 2009

Noch ist Obama keine 24 Stunden im Amt, schon wird an allen Ecken und Enden der USA etwas geändert. Mit dem Hochladen der neuen Inhalte auf www.whitehouse.gov ist auch die längste mir bekannte robots.txt Datei Geschichte, sie hatte gefühlte 89 Bildschirmseiten und ich habe sie nie abgespeichert, das google cache ist schon leer und archive.org hat Server-Problme :-( Sobald ich was habe, trage ich das hier nach.
Im MSN live Cache bin ich nun fündig geworden, deren robot war am 9.1. das letzte mal auf der Site:
http://cc.msnscache.com/cache.aspx?q=%22www+whitehouse+gov+robots+txt%22&d=75320168942549&mkt=de-DE&setlang=de-DE&w=4be343d6,5a788843

Warum die alte robots.txt überhaupt so lang war, konnte nie jemand erklären - bei Stichproben waren alle Inhalte aus den für Suchmaschinen gesperrten Seiten auch über google auffindbar.