Archive for the ‘Suchmaschinen’ Category

Die New York Times über Google und SEO: Die schmutzigen kleinen Suchtricks

Sunday, February 13th, 2011

In dem fantastischen Artikel The Dirty Little Secrets of Search beschreibt David Segal, wie die Firma für Suchmaschinen-Optimierung (SEO) SearchDex, offenbar im Auftrag der US-Kaufhauskette J.C. Penny, erfolgreich Googles Relevanz-Algorithmus hereingelegt hat. Die Geschichte ist ein Recherche-Lehrstück und zugleich spannende Aufklärung darüber, wie Googles Suche funktioniert.

Online-Suchstrategien (1): Suchbegriffe finden

Friday, January 21st, 2011

Der trivialste, mithin aber der schwierigste Schritt einer Online-Recherche, ist die Auswahl der Suchbegriffe. Damit steht und fällt die Effizienz der Recherche: Ist ein falscher Begriff dabei, der in den gesuchten Seiten nicht vorkommt, finde ich diese nicht; sind zu wenige oder zu wenig treffende Begriffe dabei, ertrinke ich in der Vielzahl von Treffern.

Eine universelle Lösung für dieses Problem habe ich nicht, aber eine Reihe von Regeln und Tipps:

1.) Möglichst viele Suchbegriffe verwenden, Anzahl der Treffer reduzieren.
Solange ich damit keine gewünschten Treffer ausschließe, kann und sollte ich weitere Suchbegriff hinzufügen. Beispiel: Auf der Suche nach dem Originaltext aus Shakespeares Hamlet kann ich dem Kernzitat [„to be or not to be“] problemlos alle weiteren Wörter aus dem Hamlet-Monolog hinzufügen, also: [„to be or not to be – that ist he question“]
Im Beispiel reduziert sich die Anzahl der Treffer von 1 777 000 auf 704 000.

2.) Was sind gute Suchbegriffe?
Eigennamen von Personen, Werken, Orten, Gebäuden, Organisationen sind sehr gute Suchbegriffe.
Solange es sich sinnvoll vermeiden lässt, sollten diese allerdings nicht als Phrase in Anführungszeichen gesucht werden! Die Anführungszeichen verhindern eine Suche nach anderen Schreibweisen, eingeschobenen weiteren Begriffen und anderen Abweichungen. (Am Beispiel einer Personensuche habe ich das hier ausführlich an einem Beispiel erklärt.)
Im Zweifelsfall kurz die Ergebnisse mit und ohne Anführungszeichen vergleichen!

3.) Wo finde ich gute Suchbegriffe?

a) in der Trefferumgebung
Beispiel: Nach der Eingabe von „to be or not to be“ kann ich, noch bevor ich eine der Trefferseiten aufrufe, weitere Suchbegriffe in der Ergebnisliste der Suchmaschine finden und mit ihnen meine Suchbegriffe ergänzen. In meinem Beispiel etwa die Begriffe [shakespeare hamlet] und die Ergänzung des Zitats (siehe 1.)

b) in der Wikipedia
Zum Einlesen ist sie immer geeignet – vor allem, wenn ich mit dem Thema nicht vertraut bin oder aber in einer Fremdsprache recherchiere. Mit dem Wörterbuch einen Suchbegriff treffend zu übersetzen, gelingt in der Regel nicht.
Beispiel: ich habe mal lange mit dem Suchbegriff [sects] für Sekten gesucht – die Übersetzung ist zwar treffend, aber aus Gründen der political correctness verwenden die Amerikaner statt [sects] lieber den neutraleren Begriff [religious groups]

4.) Zwei Ansätze: Nehme ich Suchbegriffe aus der Überschrift oder aus dem Inhalt?
Paul Myers (BBC) verwendet die nachfolgende Analogie, wenn er erklärt, wie man an die Auswahl der Suchbegriffe herangehen kann: Gute Sachbücher haben ein Inhaltsverzeichnis und einen Index: Während ich im Index alle relevanten Fundstellen für einen Begriff finde, taucht der Suchbegriff im Inhaltsverzeichnis vielleicht nur an einer Stelle auf, dafür führt er dort zu einem sehr relevanten Eintrag.
Wer in unserem Beispiel nach [berühmte Zitate Shakespeare] sucht, mag fündig werden, schließt aber alle Treffer aus, die für [berühmt] oder [Zitat] einen anderen Begriff verwenden, etwa auf Englisch.

Pauls Beispiel zeigt diesen Denkansatz noch besser. Wer nach einer Liste ermordeter Prominenter sucht, kann natürlich überlegen, was jemand, der eine solche Liste erstellt, in die Überschrift schreibt. Schon nach ersten Überlegungen und nur auf Deutsch kommt dabei eine komplexe aber unzureichende Suchanfrage zustande:

[(Liste OR Verzeichnis OR Übersicht) (ermordet OR getötet OR umgebracht OR erschossen) (Prominenter OR Politiker OR Stars OR Künstler)]

Eine solche Schnittmengensuche mit Hilfe des Operators OR kann sinnvoll sein (dazu in einer späteren Folge mehr), in diesem Fall ist sie es nicht, da es zu viele Synonyme gibt, und ich diese zudem in 3-4 Sprachen berücksichtigen sollte.

Zielführender ist hier die Frage: Welche Namen sollten auf der Liste auftauchen?

[John F. Kennedy] sollte dabei sein. Wer noch? Statt nun weitere ermordete amerikanischen Präsidenten hinzugefügt werden, sollte überlegt werden, welche Namen möglichst einen größeren Zugewinn für diese Suche bringen. Etwa:
[John Lennon] gut, ein Künstler, kein Politiker, aber auch USA
[Gandhi] gut, anderer Kontinent (und nebenbei gleich 3 Ermordungen: Mahatma Gandhi, sowie Nehrus Tochter Indira Gandhi und deren Sohn Rajiv Gandhi]
[Benazir Bhutto] gleicher Kontinent wie Gandhi, aber eine Ermordung, die noch nicht solange zurück liegt, damit werden inaktuelle Listen ausgeschlossen; (damit könnte man Gandhi wieder als Suchbegriff entfernen)
[Caesar] gute Ergänzung, wenn die Liste, denn auch die ältere Geschichte abdecken soll.

5.) Aus dem Beispiel unter 4. folgt der allgemeine Rat:
Stell Dir das Dokument vor, dass Du suchst! Was steht da drauf? Welche Begriffe werden für das, was ich suche, verwendet?
Tückisch sind viele Behördenseiten. So wird z.B. in Gesetzen und Verordnungen nicht von Prozentsätzen gesprochen, sondern von „von Hundert-Sätzen“ (v.H.) – der Suchbegriff [„v.H.“] ist daher auf der Suche z.B. nach Steuersätzen ein guter und erklärt, warum der Suchbegriff [Prozent OR %] oft weniger gut geeignet ist. Aber Achtung, das Bundesfinanzministerium verwendet in Pressemitteilungen durchaus Prozentangaben. Lösung: [„v.H.“ OR Prozent OR %].

6.) Und sonst noch: Über Suchbegriffe
a) Reihenfolge matters: bei 2 oder 3 Suchbegriffen macht die Reihenfolge einen Unterschied im Ranking der Treffer (nicht in der Anzahl. Beispiel zum Ausprobieren und Merken: [Hilton Paris] vs. [Paris Hilton]
b) Synonyme berücksichtigen und mit [OR] verbinden!
c) Substantive sind besser als Verben!
d) Solange ich kein [+] oder [„“] benutze findet Google auch andere Schreibeweisen und trunkiert meine Suchbegriffe!
z.B. [photographie] findet sowohl „Fotografie“ als auch „fotografisch“ oder „photographischen“

Suchmaschinen zwischen Informationsfreiheit und Wissensmacht

Tuesday, January 18th, 2011

Drastische Veränderungen im Internet: zunehmend bestimmen die ‘Global Player’ die Regeln. Wie können oder müssen Rechtssysteme darauf reagieren? Wer definiert neue Spielregeln? Wie müssen solche Regeln aussehen, ohne die Kreativität im Netz zu behindern?

Diese Fragen thematisiert eine Fachkonferenz an der Uni Göttingen am 28.01.2011, dem Europäischen Datenschutztag 2011. Nach einer grundlegenden Erörterung von Funktionsweise und Geschäftsmodell von Suchmaschinen werden marken-, datenschutz- und medienrechtliche Aspekte erörtert und von Wissenschaftlern, Datenschutzbeauftragten und Vertretern des Unternehmens Google diskutiert. Die Veranstaltung findet in der Paulinerkirche, Papendiek 14 in Göttingen statt und dauert von 9.00 bis 16.30 Uhr.

Bereits am 27.1. erörtern die Veranstalter in ihren öffentlichen Antrittsvorlesungen ab 16.15 Uhr in der Aula am Wilhelmsplatz in Göttingen die Themen “Internet-Suchmaschinen im Fokus des Kartellrechts” (Prof. Körber) bzw. “Vertrauensschutz und geistiges Eigentum am Beispiel der Suchmaschinen” (Prof. Wiebe).

Veranstaltet wird die Tagung von den Professoren Torsten Körber und Andreas Wiebe an der Georg-August-Universität Göttingen. Sie wird durch den Universitätsbund gefördert.

Anmeldungen bis bis zum 20.01. erbeten:
http://www.uni-goettingen.de/de/198986.html

Online-Recherche: Suchmaschinen-Syntax (1/4)

Thursday, January 6th, 2011

Ab heute stelle ich - hoffentlich täglich - Teile meines Buchkapitels (Grundsätzliches dazu hier) über Recherche hier online. Beginnen will ich mit dem Teil, der unstrittig ins Buch gehört: Die Frage wie man vernünftig online recherchiert.
Dazu will ich zunächst die Suchmaschinen-Syntax und dann eine Reihe von komplexeren Suchstrategien präsentieren: Search-Makros, gezielte Befragung einer Online-Quelle, Suchbegriffe suchen und finden (Wie heißt das was ich suche? Inhalte oder Überschriften suchen?), Personensuche, Datenbanken und andere DeepWeb Quellen erschließen. Grundlage ist mein Vortrag Suchstrategien, den ich auf der #nr10 gehalten habe - ergänzt um das, was ich seither dazu gelernt habe.

Zu meiner Darstellungs-Syntax: Ich schreibe Suchbegriffe in eckige Klammern [christian jakubetz], wenn ich nach dem Herausgeber des Buches ohne Anführungszeichen suche (Warum das eine gute Idee ist, erkläre ich in der Folge über Personensuche!) bzw. [„Christian Jakubetz“], wenn ich ihn in Anführungszeichen suche.

Weil es übersichtlicher ist, habe ich die Syntax hier in einem pdf in einer Tabelle dargestellt.

Morgen folgt Teil zwei mit der Syntax, die nicht dokumentiert ist und der, die nicht mit der Syntax aus diesem Teil kombiniert werden kann. Teil 3 dann mit den übrigen Funktionen der erweiterten Suche(n) und Teil 4 mit allem, was sonst noch Grundlegendes über Google, Bing und Co vergessen wurde.

All das ist work in progress für das Buch: Daher freue ich mich über bessere Beispiele, Korrekturen, Ergänzungen!

Yahoo ab. Ask weg. Suchmaschinenmarkt wird enger

Saturday, November 20th, 2010

Es wird enger auf dem Markt der großen Suchmaschinen. Yahoo tritt in Folge der „Search Alliance“ mit Microsoft faktisch ab. Die Suchmaschine wird Bing-Ergebnisse liefern. Sogar die Verzeichnisse werden, scheint’s, nicht überleben; gerade wurde das britisch-irische eingestellt. Wolfgang Bleh bringt es fein auf den Punkt: „Wenn man heute möglichst knapp beschreiben will, was Yahoo ist, dann heißt die Antwort: ‘Der größte ausländische Anteilseigner des chinesischen B2B-Handelsplatzes Alibaba’.
Jetzt meldet die Süddeutsche, dass auch Ask die Segel streicht.
Bedenklich ist das schon. An großen Universalsuchmaschinen bleiben Google, Bing und Exalead. Bing kann - nicht nur wegen des miserablen Interface für die Limitatoren der erweiterten Suche - nicht wirklich überzeugen, Google ist mit über 90% Marktanteil bei der Websuche faktisch Monopolist.
Dass das nicht so bleiben muss, darauf wies kürzlich Dr. Sander-Beuermann (SuMa e.V.) im DeutschlandRadio hin.
Hoffentlich begreifen findige Entwickler, dass in der Suchmaschinentechnik noch Luft nach oben ist.

“Deep Search” - Politik des Suchens jenseits von Google

Tuesday, April 6th, 2010
Das Buch liegt bereits seit Monaten auf dem Tisch, aber wie es eben leider oft so ist - mir ist etwas dazwischen gekommen auf dem Weg zur Rezension. Die hat aber inzwischen zum Glück Philipp Albers für die Sendung Breitband in Deutschlandradio Berlin geliefert (auch schon wieder mehr als eine Woche her…):
Die digitale Explosion konfrontiert uns seit Jahren mit einem regelrechten Daten-Tsunami. Die Suchmaschinen sind es, die uns helfen, diesen Tsunami zu beherrschen. Das Verheerende: Was wir über die Welt wissen, erfahren wir fast immer durch Google. Anders gesagt: Was Google nicht findet, existiert für viele Menschen nicht. Mit dieser Situation und ihren Implikationen beschöftigen sich Medientheoretiker, Kulturwissenschaftler, Soziologen und Politologen im Sammelband “Deep Search – Politik des Suchens jenseits von Google”.
  • Konrad Becker / Felix Stalder (Hrsg.): “Deep Search: The Politics of Search beyond Google”, StudienVerlag & Transaction Publishers, Wien 2009. 216 Seiten, 24,90 €
deutsche Ausgabe:
  • Konrad Becker/ Felix Stalder (Hrsg.): “Deep Search: Die Politik des Suchens jenseits von Google”, Studienverlag & Transaction Publishers, Wien 2009. ca. 220 Seiten, 24,90 €
Hier der Beitrag zum Anhören:

Die MP3 zum Runterladen (3,4 MB)

Digitale Zeitungsarchive

Sunday, November 1st, 2009

Die FAZ hat eine Linkliste zu digitalen Zeitungsarchiven veröffentlicht, denn:

Alte Zeitungen sind das beste Archiv des Alltags, das wir haben. In vielen Blättern, die zum Teil mehr als 200 Jahre alt sind, kann man online stöbern. Unsere Linksammlung zeigt die besten Adressen im Netz.

Eine dankenswerte Aufgabe. Ergänzen möchte ich zwei Informationen, weil ich oft genug in Seminaren erfahre, dass sie nicht bekannt sind: Das Archiv des Spiegels ist inzwischen im Volltext bis zurück zur ersten Ausgabe durchsuchbar - kostenlos. Und wenn man mal auf einen Artikel in der FAZ stößt, der angeblich nur im kostenpflichtigen Archiv vorhanden ist (man suche z.B. nach „Reto Hilty“), sollte man erstmal mit Googles Site-Funktion suchen, bevor man’s glaubt (geht auch bei Yahoo über die erweiterte Suche oder bei Bing mit der Site-Funktion).

Yahooglebing

Saturday, June 13th, 2009

Bing, Microsofts neue Suchmaschine, die Live ersetzt hat, genießt derzeit viel Aufmerksamkeit. Ob Bing Google ernsthaft Konkurrenz machen kann, wird die Zukunft zeigen. Wer mag, kann die Ergebnisse beider Suchmaschinen miteinander vergleichen:

Compare Search Engines Google and Bing
www.blackdog.ie/google-bing

Schon länger gibt es ein ähnliches Angebot, mit dem sich die Ergebnismengen von Yahoo und Google vergleichen lassen:

Yahoogle
www.yahooglesearch.com

Bei beiden Sites werden die Ergebnisse in zwei Frames nebeneinander angezeigt.

Paul Myers’ Tipps & Tricks

Sunday, June 7th, 2009

Um ehrlich zu sein: die beiden Workshops von Paul Myers haben erfahrenen Internet-Rechercheuren nicht viel Neues gebracht. Dennoch konnte man hören, wie begeistert viele Teilnehmer waren, die sich nicht so intensiv mit dem Thema beschäftigt hatten. Insofern waren seine Präsentationen ein großer Erfolg.

Auf drei Beispiele möchte ich aufmerksam machen, die auch für mich sehr interessant waren:

  • Domaintools bietet eine WHOIS-Historie an. Das wusste ich nicht, kann es auch nicht oft nutzen, weil es sehr teuer ist - aber wenn man es wirklich mal braucht, ist es sehr gut, das zu kennen.
  • Man kann das Verzeichnis des Open Directory Projects mit der Way Back Machine durchsuchen. Das ist eigentlich selbstverstädnlich, nur muss man auch darauf kommen. Myers hat es am Beispiel der Website Saddam Husseins gezeigt, indem er erst die Seite zum Irak im aktuellen Verzeichnis herausgesucht, dann die Adresse in die Way Back Machine eingegeben hat (die ja noch immer keine Volltextsuche besitzt), um zum alten Verzeichnis zu kommen - und sich dann Saddams Website aufzurufen (die im Unterverzeichnis Government liegt). Clever.
  • Was für Nerds ist die Seite zu „Google dorks“. Dazu gibt’s keine Erklärung, weil es erstens zu lange dauern würde und ich zweitens den größten Teil selber nicht verstehe. :-( Aber ich arbeite dran.

Danny Sullivan testet Wolfram Alpha

Monday, May 4th, 2009

Danny „Suchmaschine“ Sullivan, Oberauskenner bei Suchmaschinen seit 15 Jahren, hat Wolfram Alpha getestet (soll im Mai online gehen):

Will it be as important as Google has become? Perhaps! A new search paradigm? Yes! Or at least a new way of gathering information. A Google-killer? Nope! But when the service launches, it should become an essential in anyone’s search tool kit.