Informationsbeschaffung im Internet
Puzzle-Steine eines Informationssystems
Für den effektiven und effizienten Informationszugriff ist es wichtig, die Funktionsweise des verwendeten Werkzeugs zu kennen. Im Grunde bestehen die meisten Informationssysteme aus fünf wichtigen Komponenten, die wir einzeln und grösstenteils voneinander losgelöst betrachten können. Je nachdem wie die Komponenten dann kombiniert werden, entsteht ein Such-, ein Katalog- oder ein Push-System.
- Die Benutzerschnittstelle ist
das Einzige, was ein Benutzer vom Informationsdienst zu sehen bekommt. Sie
ermöglicht die Kommunikation zwischen Dienst und Anwendern.
- Der Web-Roboter besucht regelmässig den
ihm zugewiesenen Teil des WWW auf der Suche nach neuen oder geänderten
Dokumenten, die er dann dem Informationsdienst zuspielen kann.
- Während der Indexierung werden Dokumente
oder auch Anfragen untersucht und darin vorkommende Begriffe identifiziert.
Das Vorgehen ist also ähnlich wie in einem Sachbuch: Nachdem der Buchinhalt
geschrieben ist, identifiziert man im Text die wichtigen Begriffe und fügt
diese im Stichwortverzeichnis des Buchs ein. Zu jedem Eintrag im
Stichwortverzeichnis wird die entsprechende Seite vermerkt. Eine
vergleichbare Funktion übernimmt der Index des Informationsdienstes.
- Der Index ist eine Datenstruktur, die das
schnelle Vergleichen von Anfragen mit Dokumenten erlaubt. Ein
Suchsystem benützt den Index, um zu einem Begriff alle Webseiten zu
finden, in denen das Wort auftaucht.
- Beim Vergleich von
Anfragen mit Dokumenten wird ermittelt, inwiefern ein Dokument eine
Anfrage befriedigt.
Als Beispiel sind in der unten stehenden Grafik die fünf Komponenten zu einem Suchsystem zusammengestellt. Ein kurzer Überblick über das Geschehen: Der Web-Roboter durchpflügt das Internet. Alle gefundenen Dokumente werden zunächst indexiert und anschliessend im Index des Suchsystems abgelegt. Sobald eine Benutzerin mit Hilfe der Benutzerschnittstelle eine Anfrage an das System schickt, wird die Anfrage in einem ersten Schritt ebenfalls indexiert. Daraufhin wird die Anfrage mit den im Index in geeigneter Form gespeicherten Dokumenten verglichen. Zum Schluss erhält die Benutzerin eine Liste mit Verweisen auf die gefundenen Dokumente.
Viel mehr soll an dieser Stelle noch nicht verraten werden. Wir werden in den folgenden Kapiteln die einzelnen Komponenten genauer unter die Lupe nehmen. Dabei konzentrieren wir uns vorerst auf die Suchdienste. Später werden wir die Komponenten auf andere Weise kombinieren und uns mit Katalog- und Push-Diensten auseinander setzen.
Schauen wir nun, was es aus praktischer Sicht zu berichten gibt ...