CAR-Tagung in HH: Google für Experten – Henk van Ess

Henk van Ess vom Search Bistro, bekannt für seine Geschichte zu Googles „geheimem Suchlabor“, zeigt Beispiele dafür, wie man mit Google in der Tiefe recherchiert.
Henk erklärt zuerst, wie man mit Google Notebook vollständige Webseiten speichern kann. Frage aus dem Publikum: wird das auf dem eigenen Rechner gespeichert oder bei Google? Henk: bei Google - was Nach- und Vorteile hat: Nachteil: (fehlender) Datenschutz. Vorteil: von überall her abrufbar. Man kann das eigene Google-Notizbuch für andere öffnen, so dass eine Community daraus entstehen kann.

Google Trends: Was suchen Nutzer eigentlich? Grafisch aufbereitete Search-Patterns, auch nach Orten. Ein Beispiel: in Erfurt wird am häufigsten nach dem Begriff „Kinderporno“ gesucht. Einschränkung: erstens „rät“ Google den Ort, weil ja nur die IP-Adresse zur Verfügung steht. Zweitens gibt es viele Einschränkungen, was den Informationswert angeht - wird etwa in Erfurt nur deshalb so oft nach „Kinderporno“ gesucht, weil dort eine Sondrkommission der Polizei danach sucht? (Meine Anmerkung: Wenn die Sonderkommission bei ihrer Suche tatsächlich „Kinderporno“ eingeben würde, könnte man sie auch gleich schließen.)

Google Translate: Wichtig, dass man Übersetzungen nur verwenden kann, wenn man sie von einem Profi hat überprüfen lassen, die Google-Übersetzung, die auch Arabisch und Chinesisch „beherrscht“, dürfe nur als Indikator genutzt werden.
Librarain Center: Spezielle Tipps, die man sich unbedingt anschauen sollte.

Henks Aussage: Google sieht nur 28 Prozent des Webs. Etwas seltsam, dass er nicht erwähnt, wie unzuverlässig derartige Schätzungen sind und stattdessen eine derart exakte Zahl nennt.

Neue Tricks bei Google: „iraq civilians killed 10000…40000“ wäre die Suchanfrage, die man Google stellen kann, um einen Bereich einzugrenzen und so zu Suchergebnissen mit genauen Zahlen zu gelangen.

Geo-Targeting: für jedes Land existiert ein eigenes Google (z.B. andere Suchergebnisse bei google.de als bei goolge.com).

„Google ist keine Maschine“: Das ist Henks große Geschichte, mit der er berühmt geworden ist: Er fand heraus, dass Google die Gewichtung der Suchergebnisse von Menschen hat „nacharbeiten“ lassen. Das ist deshalb wichtig, weil sich Google häufig bei Beschwerden darauf zurück zieht, dass das Ranking der Suchergebnisse einzig von einem Algoritmus vorgenommen wird. Ergänzung von Sebastian Moericke, der selber für Google als „Qualitätskontrolleur“ gearbeitet hat: in Deutschland gibt es etwa 50 Leute, die das machen, Google sagt offiziell, dass diese Mitarbeiter nur für interne Zwecke verwendet werden um herauszufinden, wie gut der Suchalgoritmus tatsächlich arbeitet. Insofern wird nur der Algoritmus verbessert, nicht die Suchergebnisse selbst.
Google-Zensur: Auch in Deutschland wird zensiert, z.B. werden viele Suchergebnisse rechtsextremer Organisationen nicht angezeigt. Einwurf: Das liegt nicht an Google, sondern an den Gesetzen des jeweiligen Landes. Henk: Stimmt, aber im Grunde genommen ist es doch die Firma Google, die entscheidet. Wichtig sei, dass man sich nicht auf die Suchergebnisse der landestypischen Googles vertraut, sondern Google.com verwendet.
Beispiel: Verwendet man den Suchbegriff „voice wav“ bei Google (ohne Anführungszeichen), bekommt man von Google gesagt, dass man einen Virus auf dem Rechner habe. Die Erklärung, warum das passiert ist, habe ich nicht verstanden; wird nachgereicht. Heute funktioniert das Beispiel nicht mehr.

Sebastian Moericke: Google hat große und kleine Cluster, die über unterschiedliche IP-Adressen angesteuert werden können. Die Ergebnisse auf der Liste unterscheiden sich teilweise. Sebastian wird eine Liste der Cluster-IP-Adressen zur Verfügung stellen.

Tags:

One Response to “CAR-Tagung in HH: Google für Experten – Henk van Ess”

  1. Henk van Ess Says:

    Lieber Matthias,

    Danke für dein Artikel.

    Die aussage ‘Google sieht 28 prozent von web’ ist unbedingt nicht tagesfrisch gemeint. Denn allein heute sind weltweit einige zehntausenden neue site dazu gekommen. Tagesfrische Ziffern gibt es nicht. Es ist eine Studie von 2005. Die einzige wirklich wissenschaftliche Studie ist in Nature publiziert, http://www.voelspriet.nl/zoekmachine.pdf

    VOice wav: ist jetzt nicht mehr so. Die Grund? Sehe http://www.voelspriet2.nl/forum/index.php/topic,5301.0.html (NL) oder http://forums.seochat.com/google-news-46/google-virus-message-29036.html (ENG)