Suchindex-Studie: Yahoo lügt
Drei Forscher des “Center for Supercomputing Applications” (NCSA) trauten Yahoos Behauptung, über 20 Milliarden “Items” in ihrem Suchindex zu verwalten, nicht so recht. In einer Studie prüften sie die Behauptungen der Suchmaschinen-Anbieter.
Zunächst überprüften sie die Angaben der Suchmaschinen. Yahoo etwa behauptet, 19,2 Millionen Dokumente in seinem Index zu erfassen, Google gibt seit mehreren Monaten an, 8.1 Millionen Dokumente im Index zu haben. Weil ein direkter Vergleich nicht möglich war, mussten die Supercomputer der Wissenschaftler zahlreiche Probesuchen durchführen und die Ergebnisse auswerten.
Die These der Forscher ist einleuchtend: Ein doppelt so großer Suchindex müsste eigentlich doppelt so viele brauchbare Ergebnisse liefern. Im Test durften dazu nur Suchbegriffe verwendet werden, die in beiden Suchmaschinen weniger als 1000 Treffer liefern – denn auch, wenn die Zahl der gefundenen Ergebnisse oft viel höher liegt, spucken beide Suchmaschinen höchstens 1000 Ergebnisse aus.
Mit einem Script sendeten die Forscher die Suchbegriffe an Google und Yahoo, verglichen dann die Anzahl der von den Suchmaschinen angegebenen Ergebnisse (wie in “Ergebnisse 1 – 10 von ungefähr x”). Gefunden wird offenbar die selbe Zahl – Duplikate werden bei beiden Such-Engines herausgerechnet. Doch was dann wirklich angezeigt wird, unterscheidet sich: Bei 10 000 Suchen lieferte Yahoo 146 330 und damit nur etwa 34,5 Prozent der von Google gefundenen 390.595.
Was dann von den Suchmaschinen nicht nur gezeigt, sondern auch geliefert wird, unterscheidet sich stark: Selbst Google zeigt nur 54,7 Prozent der Ergebnisse dann wirklich an, bei Yahoo aber sind es nur 21,4 Prozent der ursprünglich angekündigten Ergebnisse.
Die Studie nimmt auch weitere Unstimmigkeiten der Behauptungen beider Konkurrenten unter die Lupe – Ergebnis: Glaube nur Statistiken, die du selbst gefälscht hast. (mk)