Google Basics: Alles was man (mindestens) wissen muss

Hinweis: Hier fehlen noch etliche Verlinkungen. Sie werden im Laufe des Tages ergänzt. Ich bitte um Verständnis. Gute Nacht ;-)

Screenshot Google-Suchbox im Firefox-WebbrowserGoogle hat laut „heise online“-Newsticker in Deutschland im September 2006 die 90-Prozent-Hürde beim Marktanteil in Deutschland genommen. Das heißt, mehr als 90 Prozent der Web-Suchanfragen in Deutschland werden bei Google gestellt – und von Google beantwortet. Wie es dazu kam? Google hat sich mit seiner Pagerank-Suchtechnologie und einer einfachen Bedienung die Marktführerschaft erobert und gilt seither als Suchmaschine Nr. 1 im Web. In vielen Browsern ist Google seit Jahren als Standardsuchmaschine voreingestellt.

Wir können zwar damit unzufrieden sein, dass Google so marktbeherrschend ist. Fakt ist allerdings: Google ist neben oder vielleicht sogar vor Yahoo und MSN nach wie vor die beste Allround-Suchmaschine. Aus Recherche-Sicht ist es sicher klug, viele Suchmaschinen, vor allem auch Spezialsuchmaschinen, zu kennen. Aber wenigstens den Marktführer Google sollte man nicht nur kennen, sondern auch gut beherrschen. Daher hier die Basics zum Platzhirschen aus Mountain View (Kalifornien).

PageRank: Wie Google das Web ordnet

Eine Web-Suche auf Google gibt praktisch unendlich viele Suchergebnisse aus. Diese sind in gewisser Weise nach Relevanz sortiert. Die Einstufung der Relevanz geschieht vor allem auf Basis des so genannten Pagerank-Algorithmus. Das heißt vereinfacht: Seiten werden nach dem Kriterium Linkpopularität gerankt. Zeigen viele Links auf eine Seite gilt sie als wichtiger als eine wenig verlinkte Seite. Googles Pagerank-Algorithmus schaut dabei allerdings auch, ob schon ein Link ein relevantes Wort enthält, an welcher Stelle im Text das Wort oder Text-Stück steht, zum Beispiel ob in der Haupt-Überschrift oder im Fließtext. Mit dem geheim gehaltenen Pagerank-Algorithmus rechnen die Google-Rechenzentren dann aus, als wie relevant eine Seite im Vergleich zu anderen gilt. Linkt eine relevante Seite auf eine weniger relevante, geht mit dem Link etwas von der Relevanz der einen auf die andere über, es fließt „Google Juice“.

So kommt es also zu den Ergebnissen bei einer Google-Suche. Doch trotzdem finden wir oft nicht das Gesuchte. Vielleicht weil die Stecknadel im Heuhafen für Google nicht die selbe Relevanz hat, wie sie für unsere Story hat. Vielleicht aber auch, weil Google uns genau für solche Spezialfälle bestimmte Methoden bietet, um die Suche im Heuhaufen einzugrenzen. Einige dieser Methoden wollen wir uns anschauen.

Der Google-Suchschlitz

Ein Teil des Erfolgs von Google beruht auf dem einfachen Interface, dem Suchschlitz (fast) ohne jegliches sonstiges „Gedöns“ und ohne störende Werbung. Doch hier gibt es schon Feinheiten zu beachten.

  1. Die Sprach- bzw. Landesversion: Unterschiedliche Landesversionen bringen mehr oder weniger stark unterschiedliche Ergebnisse. Probieren Sie es aus: Suche nach Hamburg bei google.de mit der zusätzlichen „Query“ „hl=de“ (hl steht für Home Language, de für deutsch), bei google.com mit „hl=en“ (englisch), bei google.com mit „hl=de“ und zuletzt bei google.de mit „hl=en“. Verwirrt? Ich auch.

    Also aufpassen dabei, welche „Version“ von Google wir gerade benutzen und ob etwa per so genanntem Safemode auch noch Google missfallende Inhalte bei der Ergebnisausgabe ausgefiltert werden, zum Beispiel Ergebnisse zu für Google vermeintlich pornografischen Inhalten, aber auch zu in Deutschland illegalen Nazi-Websites, die ja gerade Objekt der journalistischen Recherche – ganz legal – sein könnten. Schauen Sie dazu in die Adresszeile: Erscheint im Laufe der langen Adresse der Ausdruck „safe=off“, verläuft die Suche ungefiltert, erscheint dort „safe=active“, werden verdächtige Treffer ausgefiltert. Probieren Sie es aus.

  2. Schauen wir uns noch kurz die Umgebung des Suchschlitzes an: Je nach Spracheinstellung zeigt Google die Auswahl-Knöpfe an, mit denen man die Suche auf Seiten in der voreingestellten Sprache oder aus dem voreingestellten Land beschränken kann. Nicht immer zuverlässig, aber manchmal hilfreich. Wir lernen das nachher auf elegantere Art anzuwenden. Außerdem gibt es je einen Link zur Bilder-Suche (englisch „Images“), zur Groups-Suche im weltweiten, aber der breiten Öffentlichkeit weitgehend unbekannten Usenet mit zahllosen Diskussionsforen zu noch zahlloseren Themen, zur News-Suche nach Nachrichten aus Deutschland und aller Welt – einstellbar auf eigene Interessen –, zu einer Suche nach Produkten – ich habe die ehrlich gesagt noch nie probiert und kaufe meine Milch nach wie vor im Bioladen um die Ecke und Computer bei Apple, obwohl die noch nicht so ganz bio sind – sowie unter anderem Links zur „Erweiterten Suche“ und zu „Einstellungen“. Sind Sie denen schon mal gefolgt und haben geschaut, was sich dahinter verbirgt? Nein? Dann tun Sie es.
  3. Last but not least kann man sich bei Google über den Link in der Ecke oben rechts seit einiger Zeit einen Account anlegen und damit die Suchmaschine personalisieren. Manchmal praktisch, aber seien Sie sich bewusst, dass Google damit noch mehr Daten über Ihr Nutzerverhalten sammeln kann – bis hin zum kompletten Suchprotokoll. Außerdem führen am Ende der Google-Seiten Links zu verschiedenen Informationen des Unternehmens.

Web-Suche mit Operatoren

Jetzt kommen wir endlich zu den praktischen Tricks und Kniffen für die effiziente Benutzung von Google. Sorry, es hat etwas gedauert, aber das Vorwissen hilft hoffentlich beim Verständnis.

Haben Sie sich mal gefragt, wie Sie Google sagen können, dass Sie alles über Begriff X finden wollen, zum Beispiel „Kohl“, aber ohne störende Treffer über Begriff „Y X“, zum Beispiel “Helmut Kohl“? Wie also Begriffe von einer Suche ausschließen? Ganz einfach: Mit der erweiterten Suche. Dort kann man in einem Feld eingeben, dass Ergebnisse „ohne die Wörter …“ gefunden werden sollen. Es geht aber noch einfacher. Probieren Sie mal die Funktion in der erweiterten Suche am Beispiel „‚Kohl’ ohne die Wörter ‚Helmut’“ und schauen Sie dann ins Adressfeld. Dort findet sich jetzt ein Minus-Zeichen vor „Helmut“. Das Minus ist ein so genannter Operator. Den können Sie auch einfach manuell in den Google-Schlitz eingeben – und schon erhalten Sie auf direktem Wege Treffer zu „Kohl ohne Helmut“. Übrigens: Google sagt zwar, dass der Operator „AND“ oder das Plus-Zeichen nicht angegeben werden müssen, denn es würden alle Suchbegriffe automatisch mit einbezogen – allerdings filtert Google manche sehr häufigen Wörter, zum Beispiel solche, die es für Artikel oder Hilfsverben hält. Wenn Sie also das Wörtchen „der“ in allen Treffern bei der Suche nach „der spiegel“ (Suche vorerst ohne Anführungszeichen) enthalten haben wollen, setzen Sie ein Plus davor: „+der spiegel“.

Es gibt weitere solcher Operatoren:

Der Operator „OR“ oder „|“ sorgt dafür, dass Ergebnisse angezeigt werden, die entweder Begriff X oder Begriff Y oder beide zusammen enthalten. Beispiel: „Journalismus OR Recherche“ bringt Seiten zu „Journalismus“, zu „Recherche“ und Seiten, die beides enthalten.

Der Operator „~“ sorgt sogar dafür, dass auch nach Synonymen zu darauf folgenden Wörter gesucht wird. Eine Suche nach „travel ~guide“ bringt etwa auch Treffer zu „travel tips“.

Der Operator „..“ zwischen zwei Zahlenwerten eingesetzt führt dazu, dass alle Werte zwischen diesen Zahlen gesucht werden. Beispiel (mit Dollar-Zahlenwert): „ticket $250..$1000“ bringt Ergebnisse mit „ticket“ und einer Dollar-Angabe zwischen 250 und 1000.

Und einer der wichtigsten Operatoren überhaupt: Gänsefüßchen bzw. Anführungszeichen. Mehrere Ausdrücke in Anführungszeichen zu setzen führt dazu, dass Google nur noch nach genau dieser exakten Phrase sucht. Die Suche nach „“Helmut Kohl““ bringt eben wirklich nur noch Seiten mit dem Ausdruck „Helmut Kohl“, und findet etwa nicht „Der kleine Helmut isst gern Kohl“ oder „Vater kocht Kohl für Helmut“.

Eingrenzen mit Google-Syntax

Die Google-Syntax bietet noch mehr Möglichkeiten der Eingrenzung und Filterung ansonsten ellenlanger Ergebnislisten. Das Kürzel „site:“ beispielsweise. Daran lässt sich ein Domainname (recherche-info.de) oder auch nur eine so genannte Top-Level-Domain (.de, .com, .org usw.) anhängen, um die Suche auf genau diesen Domainraum einzuengen. Das ist etwa besonders praktisch bei „taz online“. Dort sind die Archivinhalte bisher über die taz.de-Startseite selbst nicht zu finden. Sucht man hingegen mit „site:taz.de suchwort“ nach Inhalten, kann man ganz einfach und völlig kostenlos das gesamte taz-Archiv der letzten Jahre einsehen – wofür der taz-eigene Recherchedienst sonst Geld verlangt. Dieser kleine Trick mit Google ist übrigens völlig legal. Er funktioniert nur, weil das taz-Archiv nicht passwortgeschützt ist, sondern eigentlich ganz offen im Web liegt – bloß ist es eben von der taz.de-Startseite nicht verlinkt, so dass Unwissende nicht an die alten Artikel herankommen. Sie können es nun. Vorschlag: Die jährliche Ersparnis überweisen Sie einfach an recherche-info.de, Stichwort: Referentenförderung …

Dann gibt es noch mehr im selben Stil. Mit der filetype-Attribut lassen sich Ergebnisse auf bestimmte Dateitypen beschränken, z. B. PDF-Dateien, Word-DOC-, RTF- oder sogar Flash-SWF-Dateien. Dazu tippt man in die Suchleiste einfach „filetype:pdf“, „filetype:doc“, „filetype:swf“ und so weiter, dazu natürlich das eigentliche Suchwort bzw. die gesuchte Zeichenkette, denn alle Google-Syntaxtechniken lassen sich natürlich weitgehend miteinander kombinieren. Die Suchanfrage „“thomas leif“ filetype:pdf site:netzwerkrecherche.de“ liefert etwa alle Fundstellen des Namens „Thomas Leif“ in PDF-Dokumenten auf dem Webserver netzwerkrecherche.de.

Das ist noch lange nicht alles, womit man die Google-Suche schneller und effektiver machen kann. In der nächsten Folge schauen wir uns unter anderem die Möglichkeiten an, mit Trunkierung, also Sternchen (*), die Suche noch flexibler und gezielter zu gestalten. Und wir schauen, wie man Google dazu bringt, ganz oft Paris Hilton’s Gesicht auszugeben – aber auch wirklich nur ihr Gesicht.

Tags: , , , , , , , , , , , , , , , , , , , ,

One Response to “Google Basics: Alles was man (mindestens) wissen muss”

  1. Basiswissen Journalismus: Recherche für Blogger Says:

    […] des Browsers eingeben. Wer dies vertiefen möchte, sollte sich unter anderem den Beitrag “Google Basics: Alles was man (mindestens) wissen muss” auf dem ausgezeichneten Blog Recherche-Info durchlesen oder es mit diesem 150-seitigen, […]