Universität Bonn  
[deutsch][english]

Zurück Index Vor

Informatik Abt. I BibRelEx: Stand der Forschung


BibRelEx: Erschließung Bibliographischer Datenbanken durch Visualisierung von inhaltsbasierten Beziehungen


Stand der Forschung

Angesichts der rapide wachsenden Zahl wissenschaftlicher Publikationen in der Informatik und anderen Wissenschaften werden effiziente Methoden zur Literaturrecherche immer wichtiger. Gleichzeitig entsteht der Bedarf, das in den Publikationen enthaltene Wissen in geeigneter Weise zu repräsentieren. In klassischen Bibliothekssystemen ist dieses Wissen entweder nicht direkt sichtbar oder nicht leicht nachzuverfolgen. Lediglich der Science Citation Index [SCI] nennt zu jedem Dokument alle Literaturhinweise. Er enthält Literaturangaben aus allen Gebieten der Naturwissenschaften, Technik und Biomedizin. Die Zeitschriften, die vom SCI ausgewertet werden, sind zum Teil erfolgsorientiert ausgesucht, d.h. je häufiger die Artikel einer Zeitschrift zitiert werden, desto größer ist ihre Chance, in den SCI aufgenommen zu werden. Ergänzend zu den üblichen Literaturdatenbanken bietet der SCI zusätzliche Suchvarianten. Es gibt ein Register der zitierten Autoren (Zitierindex), das eine Art vorwärtsgerichtete Recherche ermöglicht: Man kann fragen, in welchen Arbeiten ein ausgewählter Autor zitiert wird. Neben den bibliographischen Angaben einer Arbeit wird auch die vom Autor verfaßte Literaturliste wiedergegeben. Damit ist auch eine Rückwärtssuche möglich.

Daß den Beziehungen zwischen wissenschaftlichen Dokumenten bei der Literaturrecherche bislang nur wenig Beachtung geschenkt wurde, mag am Mangel geeigneter Darstellungswerkzeuge liegen. Erst durch das Aufkommen von Hypertext wurde es möglich, Beziehungen zwischen Objekten physisch zu realisieren und für den Zugriff zu verwenden. Im erweiterten Konzept von Hyper-G [DalHey95,hyperg] werden sowohl die Meta-Informationen zu den Dokumenten als auch ihre Beziehungen untereinander jeweils in einer objektorientierten Datenbank verwaltet. Darüberhinaus erlaubt Hyper-G eine hierarchische Gliederung des Bestandes. Damit steht eine interessante Alternative zu einer reinen Datenbanklösung zur Verfügung.

Ein Projekt, daß sich mit dem Aufbau eines WWW-Zitiernetzwerk befaßt ist das Hypertext Bibliography Project. Zu jedem Dokument wird eine Web-Seite mit Links auf Arbeiten, die dieses Dokument zitieren, angelegt. Jones [Jon95] hat damit begonnen, die Zitierverweise für einige zentrale Publikationen der theoretischen Informatik zu erfassen. Derzeit wird nur die Suche nach Autoren und Worten im Titel und Abstract unterstützt.

Im Zusammenhang mit diesem Projekt ist auch die Trierer Informatik-Bibliographie DBLP zu nennen. Zur Verbreiterung der Datenbasis hat Ley [Ley97] Teile der Datenbestände mit dem Hypertext Bibliography Project ausgetauscht. In der DBLP wurden bisher Verweislisten für die Tagungen PODS, SIGMOND, VLDB, für die Zeitschrift The Data Engeneering Bulletin und teilweise für die Zeitschrift TODS erfaßt.

Cameron [Cam97] schlägt vor, eine internet-basierte Universal Citation Database aufzubauen, die alle jemals geschriebenen Veröffentlichungen und alle Verweise zwischen ihnen enthält. Er diskutiert ein verteiltes Modell für eine solche Datenbank, bei dem Dokumente aus verschiedenen Quellen wie Zeitschriften, Tagungsbänden und Technischen Berichten auf verschiedenen Servern verwaltet werden, die jeweils den Quellen zugeordnet sind. Um eine möglichst effiziente Suche über das Internet zu ermöglichen, soll jeder Server sowohl die bibliographischen Daten als auch die Zitierverweise von und zu den gespeicherten Veröffentlichungen verwalten.

Unseres Wissens nach gibt es zur Zeit nur ein System, das eine globale, auf Literaturverweisen beruhende Übersicht ermöglicht. Bei VxInsight von Sandia [DHJ+98] werden Wissensgebiete als Landschaften dargestellt, über die der Benutzer hinwegfliegen kann. Je tiefer man fliegt, um so mehr Teilgebiete werden sichtbar. Auf unterster Ebene sind die Titel der einzelnen Arbeiten dargestellt. Die Darstellung basiert auf einer Clusterung nach Zitierhäufigkeit. Die Zitierdaten sind gegen eine hohe Lizenzgebühr aus dem oben erwähnten Science Citation Index übernommen worden.

In letzter Zeit gewinnt auch immer mehr kooperatives Arbeiten an Bedeutung (CSCW). Ergänzend zu öffentlchen bibliographischen Datenbanken sind die Benutzer daran interessiert, ihre eigenen privaten Sammlungen von Bibliographien aufzubauen und Informationen mit Kollegen über Annotationen auszutauschen. Systeme, die Annotationen in der von uns geplanten Form verwenden, gibt es unseres Wissens derzeit nicht. In Zusammenhang mit Literaturverweisen finden sich lediglich feste Literatursammlungen einzelner Personen mit persönlichen Annotationen, die von ihnen als Referenzseiten im Web angeboten werden. Der Haupteinsatzort von Annotationssystemen ist gegenwärtig das WWW und UsenetNews mit dem Ziel der Diskussion. Die Arbeiten in diesem Gebiet beschäftigen sich neben dem Verwalten der Annotationen vor allem mit dem Problem der Skalierbarkeit.

Schließlich wurden in letzter Zeit interessante Tools zur Visualisierung großer Informationsbestände entwickelt, mit denen sich die Beziehungen zwischen Objekten im Dreidimensionalen, manchmal sogar interaktiv, darstellen lassen.

Hier finden Sie eine Sammlung von weiteren Systemen und Projekten, die in ihrer Vielfalt den Stand der Technik repräsentieren. Aufgrund der Breite des Themas und der Vielzahl an Arbeiten in diesem Bereich beabsichtigen wir mit dieser Liste keine vollständige Aufzählung, sondern versuchen vielmehr mit ihr einen guten Überblick über den Stand der Forschung zu geben.

Zusammenfassend muß festgestellt werden, daß die Erschließung durch Beziehungsgeflechten derzeit weder inhaltlich -- das heißt: auf der Datenbankseite -- noch durch hinreichend flexible Visualisierungstechniken ausreichend unterstützt wird. Zwar existieren eine Reihe von interessanten Visualisierungstools, aber diese sind meist auf einen besonderen Zweck hin konstruiert. So eignet sich etwa der Cone Tree gut zur Visualisierung dichter Hierarchien, während die Butterfly-Struktur gut für die Darstellung der ein- und ausgehenden Verweise einzelner Dokumente geeignet ist. Typischerweise ist aber die Struktur des Informationsraums fest vorgegeben.


Zusammenfassung Einleitung Stand der Forschung Datenbasis BibConsist & BibManage Visualisierung Literaturverzeichnis


[ Informatik Abt. I ] [ Forschung ] [ Lehre ] [ Publikationen ] [ Mitarbeiter ] [ Universität Bonn ]


© Universität Bonn, Informatik Abt. I - webmaster - Letzte Änderung: Mon Oct 15 19:16:00 2001