Pressemitteilung 57/05 – 29. April 2005
Universität Kassel auf Forellenjagd bei Google
Kassel. Wo findet man am schnellsten Informationen über die Hommingberger Gepardenforelle? Diese Frage stellte die Computerzeitschrift c't und rief zu einem Wettbewerb auf:
Welche Webseite wird bei der Eingabe von "Hommingberger Gepardenforelle" in Google an den Stichtagen 15. Mai und 15. Dezember am höchsten gerankt
Am 15. April, einen Tag vor der Veröffentlichung, verzeichnete Google keinen Treffer - kein Wunder, denn es gibt weder den Ort Hommingberg noch eine Gepardenforelle. Drei Tage später waren es bereits 104.000 Treffer. Der Wettbewerb hat viele Teilnehmer angelockt. "Unter ihnen sind viele Werbefirmen, die sich darauf spezialisiert haben, ihre Kunden in Suchmaschinen möglichst weit oben zu platzieren" erklärt Prof. Dr. Gerd Stumme, Hertie-Stiftungsprofessur für Wissensverarbeitung an der Universität Kassel. "Ein beliebter Trick sind Linkfarmen, d.h. große Ansammlungen von scheinbar unabhängigen Websites, die aufeinander verweisen und damit gegenseitig die Relevanz erhöhen."
Das Fachgebiet Wissensverarbeitung veranstaltet gegenwärtig ein Seminar zum Thema Suchmaschinen. "Der Wettbewerb der c't kam für uns zum richtigen Zeitpunkt. Wir können so unseren Studierenden deutlich machen, welche Relevanz die von uns vermittelte Theorie in der Praxis hat", stellt Dipl.-Inform. Christoph Schmitz fest. Die Studierenden lernen, welche Datenstrukturen und Algorithmen in Suchmaschinen angewandt werden. Um festzustellen, welche Seiten überhaupt angezeigt werden, wird zunächst ein Index erstellt- wie das Schlagwortverzeichnis eines Buches, nur mit dem Unterschied, dass der Index für das ganze WWW Millionen von Einträgen hat. Im Seminar werden hierzu effiziente Datenstrukturen diskutiert.
Das Ranking der gefundenen Treffer in Google wird dann von dem so genannten Page Rank Algorithmus vorgenommen. Er realisiert das Prinzip, dass die Relevanz einer Webseite davon abhängt, wie viele - möglichst relevante - Seiten einen Hyperlink auf diese Seite richten. Der Algorithmus berechnet, wie sich Relevanz durch das WWW hindurch vererbt. "Wissenschaftler sind im Internet sehr gut miteinander vernetzt, beobachtet Dr. Andreas Hotho. "Von daher glauben wir, dass wir - auch mit bescheidenen Mitteln - eine gute Chance in dem Wettbewerb haben. Durch jeden Link auf unsere Seite wird unsere Chance vergrößert." Das Fachgebiet Wissensverarbeitung konnte sich in der letzten Woche von Platz 132 auf Platz 36 von 825.000 vorarbeiten. Es ruft unter https://www.kde.cs.uni-kassel.de/lehre/ss2005/googlespam zu Linkspenden auf.