Archive for the ‘Suchmaschinen’ Category

Massiert Wang Xiwei in London?

Thursday, December 29th, 2011

Wang Xiweiauch Wang XiweiIch wundere mich schon länger über den einen oder anderen Kommentar hier im Blog, der zwar augenscheinlich von realen Menschen und nicht von Bots gepostet wurde. Und zwar mehr oder minder auf das Posting einging, aber doch seltsam uninteressiert und inhaltsleer daherkam. Und hatte den leisen Verdacht, das wichtigste daran sei vielleicht die verlinkte Website des (vermeindlichen?) Absenders.

(more…)

Trés chic: Richtig gugeln als Infografik

Tuesday, November 29th, 2011

Trés chic: Richtig gugeln als Infografik. Leider nur auf Englisch.

UND ODER wie jetzt bei Google? Ist der AND-Operator weg?

Thursday, November 3rd, 2011

Google hat den AND-Operator abgeschafft und durch Mist OR ersetzt. Naja, fast. Darüber schreibt z.B. Wolfgang Bleh auf intern.de. Ein Selbsttest:

(more…)

Vom Thumbnail zum Image zum Namen - Personensuche mit Bildern

Tuesday, November 1st, 2011

Vor zwei Wochen hat jemand mein Xing-Profil aufgerufen. Da war ich gerade auf der GIJC in Kiew, hatte an dem Tag einen Workshop zur Personenrecherche und war sehr dankbar für das schöne Beispiel, wie Personenrecherche mittlerweile klappen kann.
(more…)

Hilfe erbeten: Ein Suchmaschinen-Problem

Saturday, July 16th, 2011

Wie viel finden Suchmaschinen?

Dass keine Suchmaschine „das ganze“ Internet kennt, ist trivial. Man sucht immer in einem Index, der nur einen Teil des (für SEs auffindbaren) Netzes abbildet. Aber wie viel finden Suchmaschinen?

Wikipedia ist eine ziemlich gute Site, was Suchmaschinenoptimierung angeht (s. z.B. Report on dangers and opportunities posed by large search engines, particularly Google, September 30, 2007, vor allem „Section 1: Data Knowledge in the Google Galaxy- and Empirical Evidence of the Google-Wikipedia Connection“)
Ich habe einfach mal verglichen, wie viel „kohle“ Google in der deutschen Wikipedia findet:
http://www.google.de/search?sclient=psy&hl=de&site=&source=hp&q=kohle+site%3Ade.wikipedia.org&btnG=Suche

Ungefähr 7.870 Ergebnisse

Und wieviel kennt Wikipedia selbst?
http://de.wikipedia.org/w/index.php?title=Spezial%3ASuche&redirs=0&search=kohle&fulltext=Search&ns0=1
Ergebnisse 1-20 von 15.340 für kohle
Also deutlich mehr.

Ich wollte schon „Triumpf“ schreien, habe aber vorher noch Yahoo und Bing geprüft, die den Site-Operator auch haben:
Yahoo: 41.900 Ergebnisse für kohle site:de.wikipedia.org
Bing: 1-10 von 16.100 Ergebnisse für kohle site:de.wikipedia.org

Und da bin ich jetzt ein bischen blank, wie ich das einschätzen soll.
Für hilfreiche Erläuterungen bin ich sehr dankbar.

2. Band des „Handbuch Internet-Suchmaschinen“

Monday, March 21st, 2011

Das von Dirk Lewandowski herausgegebene „Handbuch Internet-Suchmaschinen“ bekommt einen zweiten Band: Neue Entwicklungen in der Web-Suche.
(more…)

Kurz notiert: Google Alerts verbessert

Monday, February 28th, 2011

Google Alerts bietet seit kurzem eine zusätzliche Auswahl an - nämlich, ob man „alle Ergebnisse“ oder aber nur die „relvantesten“ haben möchte.
Bislang habe ich an der Alerts ja bemängelt, dass eben nicht alle Treffer aus dem Index gezeigt werden, sondern nur die - gefühlt - top 200 bis 250. Bei einer Google-Suche zu einem vorhandenen Alert konnte man bislang noch nicht von Google per Alert gemeldete Seiten finden.

Wichtig: Für alle vorhandenen Alerts muss man die Einstellung auf „alle“ ändern, sonst hat man nicht von dieser Verbesserung.

Die New York Times über Google und SEO: Die schmutzigen kleinen Suchtricks

Sunday, February 13th, 2011

In dem fantastischen Artikel The Dirty Little Secrets of Search beschreibt David Segal, wie die Firma für Suchmaschinen-Optimierung (SEO) SearchDex, offenbar im Auftrag der US-Kaufhauskette J.C. Penny, erfolgreich Googles Relevanz-Algorithmus hereingelegt hat. Die Geschichte ist ein Recherche-Lehrstück und zugleich spannende Aufklärung darüber, wie Googles Suche funktioniert.

Online-Suchstrategien (1): Suchbegriffe finden

Friday, January 21st, 2011

Der trivialste, mithin aber der schwierigste Schritt einer Online-Recherche, ist die Auswahl der Suchbegriffe. Damit steht und fällt die Effizienz der Recherche: Ist ein falscher Begriff dabei, der in den gesuchten Seiten nicht vorkommt, finde ich diese nicht; sind zu wenige oder zu wenig treffende Begriffe dabei, ertrinke ich in der Vielzahl von Treffern.

Eine universelle Lösung für dieses Problem habe ich nicht, aber eine Reihe von Regeln und Tipps:

1.) Möglichst viele Suchbegriffe verwenden, Anzahl der Treffer reduzieren.
Solange ich damit keine gewünschten Treffer ausschließe, kann und sollte ich weitere Suchbegriff hinzufügen. Beispiel: Auf der Suche nach dem Originaltext aus Shakespeares Hamlet kann ich dem Kernzitat [„to be or not to be“] problemlos alle weiteren Wörter aus dem Hamlet-Monolog hinzufügen, also: [„to be or not to be – that ist he question“]
Im Beispiel reduziert sich die Anzahl der Treffer von 1 777 000 auf 704 000.

2.) Was sind gute Suchbegriffe?
Eigennamen von Personen, Werken, Orten, Gebäuden, Organisationen sind sehr gute Suchbegriffe.
Solange es sich sinnvoll vermeiden lässt, sollten diese allerdings nicht als Phrase in Anführungszeichen gesucht werden! Die Anführungszeichen verhindern eine Suche nach anderen Schreibweisen, eingeschobenen weiteren Begriffen und anderen Abweichungen. (Am Beispiel einer Personensuche habe ich das hier ausführlich an einem Beispiel erklärt.)
Im Zweifelsfall kurz die Ergebnisse mit und ohne Anführungszeichen vergleichen!

3.) Wo finde ich gute Suchbegriffe?

a) in der Trefferumgebung
Beispiel: Nach der Eingabe von „to be or not to be“ kann ich, noch bevor ich eine der Trefferseiten aufrufe, weitere Suchbegriffe in der Ergebnisliste der Suchmaschine finden und mit ihnen meine Suchbegriffe ergänzen. In meinem Beispiel etwa die Begriffe [shakespeare hamlet] und die Ergänzung des Zitats (siehe 1.)

b) in der Wikipedia
Zum Einlesen ist sie immer geeignet – vor allem, wenn ich mit dem Thema nicht vertraut bin oder aber in einer Fremdsprache recherchiere. Mit dem Wörterbuch einen Suchbegriff treffend zu übersetzen, gelingt in der Regel nicht.
Beispiel: ich habe mal lange mit dem Suchbegriff [sects] für Sekten gesucht – die Übersetzung ist zwar treffend, aber aus Gründen der political correctness verwenden die Amerikaner statt [sects] lieber den neutraleren Begriff [religious groups]

4.) Zwei Ansätze: Nehme ich Suchbegriffe aus der Überschrift oder aus dem Inhalt?
Paul Myers (BBC) verwendet die nachfolgende Analogie, wenn er erklärt, wie man an die Auswahl der Suchbegriffe herangehen kann: Gute Sachbücher haben ein Inhaltsverzeichnis und einen Index: Während ich im Index alle relevanten Fundstellen für einen Begriff finde, taucht der Suchbegriff im Inhaltsverzeichnis vielleicht nur an einer Stelle auf, dafür führt er dort zu einem sehr relevanten Eintrag.
Wer in unserem Beispiel nach [berühmte Zitate Shakespeare] sucht, mag fündig werden, schließt aber alle Treffer aus, die für [berühmt] oder [Zitat] einen anderen Begriff verwenden, etwa auf Englisch.

Pauls Beispiel zeigt diesen Denkansatz noch besser. Wer nach einer Liste ermordeter Prominenter sucht, kann natürlich überlegen, was jemand, der eine solche Liste erstellt, in die Überschrift schreibt. Schon nach ersten Überlegungen und nur auf Deutsch kommt dabei eine komplexe aber unzureichende Suchanfrage zustande:

[(Liste OR Verzeichnis OR Übersicht) (ermordet OR getötet OR umgebracht OR erschossen) (Prominenter OR Politiker OR Stars OR Künstler)]

Eine solche Schnittmengensuche mit Hilfe des Operators OR kann sinnvoll sein (dazu in einer späteren Folge mehr), in diesem Fall ist sie es nicht, da es zu viele Synonyme gibt, und ich diese zudem in 3-4 Sprachen berücksichtigen sollte.

Zielführender ist hier die Frage: Welche Namen sollten auf der Liste auftauchen?

[John F. Kennedy] sollte dabei sein. Wer noch? Statt nun weitere ermordete amerikanischen Präsidenten hinzugefügt werden, sollte überlegt werden, welche Namen möglichst einen größeren Zugewinn für diese Suche bringen. Etwa:
[John Lennon] gut, ein Künstler, kein Politiker, aber auch USA
[Gandhi] gut, anderer Kontinent (und nebenbei gleich 3 Ermordungen: Mahatma Gandhi, sowie Nehrus Tochter Indira Gandhi und deren Sohn Rajiv Gandhi]
[Benazir Bhutto] gleicher Kontinent wie Gandhi, aber eine Ermordung, die noch nicht solange zurück liegt, damit werden inaktuelle Listen ausgeschlossen; (damit könnte man Gandhi wieder als Suchbegriff entfernen)
[Caesar] gute Ergänzung, wenn die Liste, denn auch die ältere Geschichte abdecken soll.

5.) Aus dem Beispiel unter 4. folgt der allgemeine Rat:
Stell Dir das Dokument vor, dass Du suchst! Was steht da drauf? Welche Begriffe werden für das, was ich suche, verwendet?
Tückisch sind viele Behördenseiten. So wird z.B. in Gesetzen und Verordnungen nicht von Prozentsätzen gesprochen, sondern von „von Hundert-Sätzen“ (v.H.) – der Suchbegriff [„v.H.“] ist daher auf der Suche z.B. nach Steuersätzen ein guter und erklärt, warum der Suchbegriff [Prozent OR %] oft weniger gut geeignet ist. Aber Achtung, das Bundesfinanzministerium verwendet in Pressemitteilungen durchaus Prozentangaben. Lösung: [„v.H.“ OR Prozent OR %].

6.) Und sonst noch: Über Suchbegriffe
a) Reihenfolge matters: bei 2 oder 3 Suchbegriffen macht die Reihenfolge einen Unterschied im Ranking der Treffer (nicht in der Anzahl. Beispiel zum Ausprobieren und Merken: [Hilton Paris] vs. [Paris Hilton]
b) Synonyme berücksichtigen und mit [OR] verbinden!
c) Substantive sind besser als Verben!
d) Solange ich kein [+] oder [„“] benutze findet Google auch andere Schreibeweisen und trunkiert meine Suchbegriffe!
z.B. [photographie] findet sowohl „Fotografie“ als auch „fotografisch“ oder „photographischen“

Suchmaschinen zwischen Informationsfreiheit und Wissensmacht

Tuesday, January 18th, 2011

Drastische Veränderungen im Internet: zunehmend bestimmen die ‘Global Player’ die Regeln. Wie können oder müssen Rechtssysteme darauf reagieren? Wer definiert neue Spielregeln? Wie müssen solche Regeln aussehen, ohne die Kreativität im Netz zu behindern?

Diese Fragen thematisiert eine Fachkonferenz an der Uni Göttingen am 28.01.2011, dem Europäischen Datenschutztag 2011. Nach einer grundlegenden Erörterung von Funktionsweise und Geschäftsmodell von Suchmaschinen werden marken-, datenschutz- und medienrechtliche Aspekte erörtert und von Wissenschaftlern, Datenschutzbeauftragten und Vertretern des Unternehmens Google diskutiert. Die Veranstaltung findet in der Paulinerkirche, Papendiek 14 in Göttingen statt und dauert von 9.00 bis 16.30 Uhr.

Bereits am 27.1. erörtern die Veranstalter in ihren öffentlichen Antrittsvorlesungen ab 16.15 Uhr in der Aula am Wilhelmsplatz in Göttingen die Themen “Internet-Suchmaschinen im Fokus des Kartellrechts” (Prof. Körber) bzw. “Vertrauensschutz und geistiges Eigentum am Beispiel der Suchmaschinen” (Prof. Wiebe).

Veranstaltet wird die Tagung von den Professoren Torsten Körber und Andreas Wiebe an der Georg-August-Universität Göttingen. Sie wird durch den Universitätsbund gefördert.

Anmeldungen bis bis zum 20.01. erbeten:
http://www.uni-goettingen.de/de/198986.html