Archive for the ‘Bing’ Category

Hilfe erbeten: Ein Suchmaschinen-Problem

Saturday, July 16th, 2011

Wie viel finden Suchmaschinen?

Dass keine Suchmaschine „das ganze“ Internet kennt, ist trivial. Man sucht immer in einem Index, der nur einen Teil des (für SEs auffindbaren) Netzes abbildet. Aber wie viel finden Suchmaschinen?

Wikipedia ist eine ziemlich gute Site, was Suchmaschinenoptimierung angeht (s. z.B. Report on dangers and opportunities posed by large search engines, particularly Google, September 30, 2007, vor allem „Section 1: Data Knowledge in the Google Galaxy- and Empirical Evidence of the Google-Wikipedia Connection“)
Ich habe einfach mal verglichen, wie viel „kohle“ Google in der deutschen Wikipedia findet:
http://www.google.de/search?sclient=psy&hl=de&site=&source=hp&q=kohle+site%3Ade.wikipedia.org&btnG=Suche

Ungefähr 7.870 Ergebnisse

Und wieviel kennt Wikipedia selbst?
http://de.wikipedia.org/w/index.php?title=Spezial%3ASuche&redirs=0&search=kohle&fulltext=Search&ns0=1
Ergebnisse 1-20 von 15.340 für kohle
Also deutlich mehr.

Ich wollte schon „Triumpf“ schreien, habe aber vorher noch Yahoo und Bing geprüft, die den Site-Operator auch haben:
Yahoo: 41.900 Ergebnisse für kohle site:de.wikipedia.org
Bing: 1-10 von 16.100 Ergebnisse für kohle site:de.wikipedia.org

Und da bin ich jetzt ein bischen blank, wie ich das einschätzen soll.
Für hilfreiche Erläuterungen bin ich sehr dankbar.

Online-Suchstrategien (1): Suchbegriffe finden

Friday, January 21st, 2011

Der trivialste, mithin aber der schwierigste Schritt einer Online-Recherche, ist die Auswahl der Suchbegriffe. Damit steht und fällt die Effizienz der Recherche: Ist ein falscher Begriff dabei, der in den gesuchten Seiten nicht vorkommt, finde ich diese nicht; sind zu wenige oder zu wenig treffende Begriffe dabei, ertrinke ich in der Vielzahl von Treffern.

Eine universelle Lösung für dieses Problem habe ich nicht, aber eine Reihe von Regeln und Tipps:

1.) Möglichst viele Suchbegriffe verwenden, Anzahl der Treffer reduzieren.
Solange ich damit keine gewünschten Treffer ausschließe, kann und sollte ich weitere Suchbegriff hinzufügen. Beispiel: Auf der Suche nach dem Originaltext aus Shakespeares Hamlet kann ich dem Kernzitat [„to be or not to be“] problemlos alle weiteren Wörter aus dem Hamlet-Monolog hinzufügen, also: [„to be or not to be – that ist he question“]
Im Beispiel reduziert sich die Anzahl der Treffer von 1 777 000 auf 704 000.

2.) Was sind gute Suchbegriffe?
Eigennamen von Personen, Werken, Orten, Gebäuden, Organisationen sind sehr gute Suchbegriffe.
Solange es sich sinnvoll vermeiden lässt, sollten diese allerdings nicht als Phrase in Anführungszeichen gesucht werden! Die Anführungszeichen verhindern eine Suche nach anderen Schreibweisen, eingeschobenen weiteren Begriffen und anderen Abweichungen. (Am Beispiel einer Personensuche habe ich das hier ausführlich an einem Beispiel erklärt.)
Im Zweifelsfall kurz die Ergebnisse mit und ohne Anführungszeichen vergleichen!

3.) Wo finde ich gute Suchbegriffe?

a) in der Trefferumgebung
Beispiel: Nach der Eingabe von „to be or not to be“ kann ich, noch bevor ich eine der Trefferseiten aufrufe, weitere Suchbegriffe in der Ergebnisliste der Suchmaschine finden und mit ihnen meine Suchbegriffe ergänzen. In meinem Beispiel etwa die Begriffe [shakespeare hamlet] und die Ergänzung des Zitats (siehe 1.)

b) in der Wikipedia
Zum Einlesen ist sie immer geeignet – vor allem, wenn ich mit dem Thema nicht vertraut bin oder aber in einer Fremdsprache recherchiere. Mit dem Wörterbuch einen Suchbegriff treffend zu übersetzen, gelingt in der Regel nicht.
Beispiel: ich habe mal lange mit dem Suchbegriff [sects] für Sekten gesucht – die Übersetzung ist zwar treffend, aber aus Gründen der political correctness verwenden die Amerikaner statt [sects] lieber den neutraleren Begriff [religious groups]

4.) Zwei Ansätze: Nehme ich Suchbegriffe aus der Überschrift oder aus dem Inhalt?
Paul Myers (BBC) verwendet die nachfolgende Analogie, wenn er erklärt, wie man an die Auswahl der Suchbegriffe herangehen kann: Gute Sachbücher haben ein Inhaltsverzeichnis und einen Index: Während ich im Index alle relevanten Fundstellen für einen Begriff finde, taucht der Suchbegriff im Inhaltsverzeichnis vielleicht nur an einer Stelle auf, dafür führt er dort zu einem sehr relevanten Eintrag.
Wer in unserem Beispiel nach [berühmte Zitate Shakespeare] sucht, mag fündig werden, schließt aber alle Treffer aus, die für [berühmt] oder [Zitat] einen anderen Begriff verwenden, etwa auf Englisch.

Pauls Beispiel zeigt diesen Denkansatz noch besser. Wer nach einer Liste ermordeter Prominenter sucht, kann natürlich überlegen, was jemand, der eine solche Liste erstellt, in die Überschrift schreibt. Schon nach ersten Überlegungen und nur auf Deutsch kommt dabei eine komplexe aber unzureichende Suchanfrage zustande:

[(Liste OR Verzeichnis OR Übersicht) (ermordet OR getötet OR umgebracht OR erschossen) (Prominenter OR Politiker OR Stars OR Künstler)]

Eine solche Schnittmengensuche mit Hilfe des Operators OR kann sinnvoll sein (dazu in einer späteren Folge mehr), in diesem Fall ist sie es nicht, da es zu viele Synonyme gibt, und ich diese zudem in 3-4 Sprachen berücksichtigen sollte.

Zielführender ist hier die Frage: Welche Namen sollten auf der Liste auftauchen?

[John F. Kennedy] sollte dabei sein. Wer noch? Statt nun weitere ermordete amerikanischen Präsidenten hinzugefügt werden, sollte überlegt werden, welche Namen möglichst einen größeren Zugewinn für diese Suche bringen. Etwa:
[John Lennon] gut, ein Künstler, kein Politiker, aber auch USA
[Gandhi] gut, anderer Kontinent (und nebenbei gleich 3 Ermordungen: Mahatma Gandhi, sowie Nehrus Tochter Indira Gandhi und deren Sohn Rajiv Gandhi]
[Benazir Bhutto] gleicher Kontinent wie Gandhi, aber eine Ermordung, die noch nicht solange zurück liegt, damit werden inaktuelle Listen ausgeschlossen; (damit könnte man Gandhi wieder als Suchbegriff entfernen)
[Caesar] gute Ergänzung, wenn die Liste, denn auch die ältere Geschichte abdecken soll.

5.) Aus dem Beispiel unter 4. folgt der allgemeine Rat:
Stell Dir das Dokument vor, dass Du suchst! Was steht da drauf? Welche Begriffe werden für das, was ich suche, verwendet?
Tückisch sind viele Behördenseiten. So wird z.B. in Gesetzen und Verordnungen nicht von Prozentsätzen gesprochen, sondern von „von Hundert-Sätzen“ (v.H.) – der Suchbegriff [„v.H.“] ist daher auf der Suche z.B. nach Steuersätzen ein guter und erklärt, warum der Suchbegriff [Prozent OR %] oft weniger gut geeignet ist. Aber Achtung, das Bundesfinanzministerium verwendet in Pressemitteilungen durchaus Prozentangaben. Lösung: [„v.H.“ OR Prozent OR %].

6.) Und sonst noch: Über Suchbegriffe
a) Reihenfolge matters: bei 2 oder 3 Suchbegriffen macht die Reihenfolge einen Unterschied im Ranking der Treffer (nicht in der Anzahl. Beispiel zum Ausprobieren und Merken: [Hilton Paris] vs. [Paris Hilton]
b) Synonyme berücksichtigen und mit [OR] verbinden!
c) Substantive sind besser als Verben!
d) Solange ich kein [+] oder [„“] benutze findet Google auch andere Schreibeweisen und trunkiert meine Suchbegriffe!
z.B. [photographie] findet sowohl „Fotografie“ als auch „fotografisch“ oder „photographischen“

Yahooglebing

Saturday, June 13th, 2009

Bing, Microsofts neue Suchmaschine, die Live ersetzt hat, genießt derzeit viel Aufmerksamkeit. Ob Bing Google ernsthaft Konkurrenz machen kann, wird die Zukunft zeigen. Wer mag, kann die Ergebnisse beider Suchmaschinen miteinander vergleichen:

Compare Search Engines Google and Bing
www.blackdog.ie/google-bing

Schon länger gibt es ein ähnliches Angebot, mit dem sich die Ergebnismengen von Yahoo und Google vergleichen lassen:

Yahoogle
www.yahooglesearch.com

Bei beiden Sites werden die Ergebnisse in zwei Frames nebeneinander angezeigt.