Wie viel finden Suchmaschinen?
Dass keine Suchmaschine „das ganze“ Internet kennt, ist trivial. Man sucht immer in einem Index, der nur einen Teil des (für SEs auffindbaren) Netzes abbildet. Aber wie viel finden Suchmaschinen?
Wikipedia ist eine ziemlich gute Site, was Suchmaschinenoptimierung angeht (s. z.B. Report on dangers and opportunities posed by large search engines, particularly Google, September 30, 2007, vor allem „Section 1: Data Knowledge in the Google Galaxy- and Empirical Evidence of the Google-Wikipedia Connection“)
Ich habe einfach mal verglichen, wie viel „kohle“ Google in der deutschen Wikipedia findet:
http://www.google.de/search?sclient=psy&hl=de&site=&source=hp&q=kohle+site%3Ade.wikipedia.org&btnG=Suche

Ungefähr 7.870 Ergebnisse
Und wieviel kennt Wikipedia selbst?
http://de.wikipedia.org/w/index.php?title=Spezial%3ASuche&redirs=0&search=kohle&fulltext=Search&ns0=1
Ergebnisse 1-20 von 15.340 für kohle
Also deutlich mehr.
Ich wollte schon „Triumpf“ schreien, habe aber vorher noch Yahoo und Bing geprüft, die den Site-Operator auch haben:
Yahoo: 41.900 Ergebnisse für kohle site:de.wikipedia.org
Bing: 1-10 von 16.100 Ergebnisse für kohle site:de.wikipedia.org
Und da bin ich jetzt ein bischen blank, wie ich das einschätzen soll.
Für hilfreiche Erläuterungen bin ich sehr dankbar.

7 Comments

  1. „Triumpf“ schreien oder nicht eher „Triumph“ schreien? Oder habe ich schon wieder eine Schreibreform verpaßt?

  2. Eine andere Frage ist doch auch was diese Zahlen denn bedeuten. Wie schon ein paar Vorredner gesagt haben denke ich macht es auch wenig Sinn noch ab etwa 1000 gefundenen Seiten weiter zu suchen. Wenn man es mal so ausdrückt, selbst nach den ersten 100 sucht doch kein Mensch. Wenn überhaupt so weit. Diese grossen Zahlen sind doch eher was für Statistiken als die wirklich einen Sinn ergeben. Ausser vielleicht für einige Webseitenbetreiber die sich damit rühmen auf Platz eins von 1 Million Suchergebnissen zu stehen. Was aber evtl. gar nichts aussagt.

  3. google indexiert nach verschiedenen Punkte. Ladezeit der Seite, Backlinks und natürlich nach dem Namen der Domain (Content). Ich finde Google ist eine Wissenschaft für sich, so komplex und ständig in Bewegung 🙂
    gruß
    sabi

  4. Japp, Google Inexiert fast alles. Ich habe aber vielleicht eine Erklärung für das Problem. Google zeigt oft nicht alle Unterseiten, dass liegt daran das diese nicht so relevant für den Suchbegriff sind. Das macht auch Sinn, denn andere Seiten wollen ja auch gefunden werden ;).

  5. Ich bin mir ziemlich sicher, dass die großen Suchmaschinenen nahezu alles indexiert haben, was irgendwie indexierbar ist. Warum sich die unterschiedlichen Ergebnisse bei den Suchanfragen ergeben liegt weniger daran, weil die Suchmaschinen nicht alles kennen, sondern weil die Algorithmen die relevante Anzahl an Treffern berechnen. Beispielweise wäre es möglich mit dem Ankertext Kohle auf eine Webseite zu verlinken, auf welcher weder das Thema Kohle behandelt wird oder überhaupt das Wort dort vorkommt. Dennoch könnte die Suchmaschine den Link als Empfehlung zu diesem Thema interpretieren – was ja in der Regel auch der Sinn eines Links ist. Die Algorithmen sind äußerst komplex und für außenstehende nicht wirklich nachvollziehbar. Da man aber bei Recherchen mit den Suchmaschinen meistens auf das stößt, was man sucht, können diese Algorithmen nicht ganz schlecht sein, auch wenn sie eine völlig unterschiedliche Anzahl an Treffern für einen Suchbegriff angeben. Und mal ehrlich: Wen interressiert das 2476te Ergebnis zum Thema Kohle?

  6. Leute, traut nie den Suchergebniszahlen beo Google, die liegen teilweise sowas von daneben. Meine Erfahrung: Je kleiner die Nische, desto falscher die Zahlen.

  7. Google.com sagt „about 8,030 results“ – erfahrungsgemäß gibt Google doch nur ungefähre Schätzwerte an, die oft ziemlich daneben liegen können.
    Zu den Gründen, warum Wikipedia selbst weniger findet als z.B. Yahoo: Der oben angegebene Link sucht nur im Namespace 0, also nur in den Artikeln, und z.B. nicht auf den Diskussionsseiten. Wenn man in allen Namespaces sucht [1], bekommt man 23.642 Treffer. Dies erklärt zumindest einen Teil der Diskrepanz.
    [1] http://de.wikipedia.org/w/index.php?title=Spezial%3ASuche&redirs=1&search=kohle&fulltext=Search&ns0=1&ns1=1&ns2=1&ns3=1&ns4=1&ns5=1&ns6=1&ns7=1&ns8=1&ns9=1&ns10=1&ns11=1&ns12=1&ns13=1&ns14=1&ns15=1&ns100=1&ns101=1&title=Spezial%3ASuche&advanced=1&fulltext=Advanced+search

Leave a Reply

Your email address will not be published. Required fields are marked *