LISard – Prototyp eines Fachinformationsportals für die Bibliotheks- und Informationswissenschaft

Veröffentlicht am von in der Kategorie Fachportale, Technik.

In diesem Gastbeitrag stellt Oliver Pohl (Humboldt-Universität zu Berlin, Institut für Bibliotheks- und Informationswissenschaft) seine Bachelorarbeit «Konzept und prototypische Erstellung eines Informationssystems auf VuFind-Basis für die Bibliotheks- und Informationswissenschaft» (PDF, 70 S.) vor. Reaktionen und Fragen gerne hier in den Kommentaren, oder per E-Mail an den Autor: oliverpohl -at- ibi.hu-berlin.de.


Vor der Jahrtausendwende orientierten sich Internet-Suchmaschinen noch an Information-Retrieval-Systemen (Jansen u. a. 1998). Der Vorsprung von professionellen Retrieval-Systemen wurde jedoch mittlerweile verspielt.

Während sich Nutzer heutiger Suchmaschinen an eine einfache Benutzung mit schnellem und simplen Zugriff auf die gefundenen Treffer gewöhnt haben (Sadeh 2007), wird ihnen im Fachinformationsbereich das Gegenteil geboten.

Die virtuelle Fachbibliothek für Bibliotheks- und Informationswissenschaft b2i unterliegt nicht dem simplen Suchmaschinen-Konzept. Alltägliche Features wie die Autovervollständigung von Suchanfragen oder Anfragetermhervorhebung in der Trefferliste fehlen bei diesem Portal. Der größte Unterschied zwischen gängigen Suchmaschinen und b2i ist jedoch die Aufteilung der Suchtreffer nach Informationsressourcen. Neue Nutzer erwarten bei der Benutzung ihnen unbekannter Sucheinstiege ein Suchmaschinen-Bedienkonzept (Novotny 2004) und geben sich mit einer vereinten Trefferliste zufrieden, da sie kein „Detailwissen über […] den Ablageort bestimmter Daten besitzen [müssen]“ (Dietz u. a. 2007). b2i bietet zwar eine vereinte Trefferliste an, allerdings ist es nötig über mehrere Bildschirme herunter zu scrollen, bis die gewünschte Option in den Facetten zum Vorschein kommt.

Anfragetermvervollständigung bei LISard In meiner Bachelorarbeit habe ich einen Prototyp eines Fachinformationssystems für die Bibliotheks- und Informationswissenschaft geschaffen, der die bei b2i vermissten Features integriert. Ziel des Prototyps war es, genauso wie bei b2i, mehrere für die Bibliotheks- und Informationswissenschaft relevante Ressourcen über einen zentralen Einstieg durchsuchbar zu machen. Dabei sollen die Suchergebnisse standardmäßig in einer einheitlichen Trefferliste angezeigt werden.

Zu diesem Zweck wurden Datensätze von vier verschiedenen Angeboten heruntergeladen und lokal indexiert. Der Beispielkorpus besteht aus einem Open Access Repositorium (E-LIS), einer Bibliographie (Katalog der deutschen Nationalbibliothek, DDC=02*), einem Bibliothekskatalog (Katalog der Universitätsbibliothek der Humboldt-Universität zu Berlin, RVK=AN*) sowie dem Angebot eines kommerziellen Verlags (SpringerLink, eBooks, Zeitschriftenartikel und Konferenzbeiträge).

Da nicht alle Daten über eine kostenfreie oder offene Schnittstelle heruntergeladen werden konnten, wurden Programme geschrieben, welche Datensätze der DNB (in Marc21XML), HU-Berlin (Primo Normalized XML) und von SpringerLink (XML aus HTML-Quelltext-Scraper) harvesteten. Im begrenzten Rahmen der Arbeit war es jedoch nicht möglich, Prozesse für den regelmäßigen, automatisierten Harvest neuer Datensätze zu implementieren.
Am Ende standen insgesamt knapp 39.000 Datensätze aus vier verschiedenen Ressourcen für die Indexierung zur Verfügung. Nach Anpassung des Indexierungsverfahrens (Mapping, Stemming, Stoppwortlisten, Relevance Boosting) wurden der gesammelte Datenkorpus in den Index des Prototyps eingespeist.

Der Prototyp wurde „LISard – Library and Information Science: all relevant documents“ getauft und die VuFind-Webseitentemplates angepasst. Zusätzlich wurden Features wie eine Autovervollständigung von Suchanfragen (siehe Abb. 1 oben) und Kataloganreicherung (Buchcover einblenden, Links zu GoogleBooks) aktiviert.

LISard-Trefferliste Die Open-Source-OPAC-Software VuFind arbeitet standardmäßig mit einem vereinten Index und rankt aufgrund des SOLR/Lucene-Unterbaus heterogene Dokumente in einer einheitlichen Liste. Die Facetten in der Trefferanzeige wurden so optimiert, dass sie ohne zu scrollen überblickt werden können. Ramdeen und Hemminger (2011) haben gezeigt, dass Nutzer von OPACs lediglich drei Facetten genauer betrachten: „subject, format and author“. Bei LISard werden insgesamt nur sechs Facetten angezeigt: Institution, Format, Verfasser, Sprache, Schlagwort und Erscheinungsjahr.

Mit der Implementierung LISards konnte gezeigt werden, dass es mit einfachen Mitteln möglich ist, Fachinformationssysteme mit Suchmaschinentechnologie und Suchmaschinenbenutzerführung zu erstellen.

Derzeit ist LISard noch nicht online zugreifbar, jedoch ist geplant, eine Instanz auf den Servern des Instituts für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu implementieren.

Literaturverzeichnis

  • Dietz, Gunnar, Martin Juhrisch, Dirk Kußmann, Frank Schumacher, Stanislav Stoychev, und Martin Stracke. 2007. „Integriertes Informationsmanagement an einer großen Universität“. In Integriertes Informationsmanagement an Hochschulen, herausgegeben von Martin Gaedke und Rolf Borgeest, 57–74. Karlsruhe: Universitätsverlag Karlsruhe. http://digbib.ubka.uni-karlsruhe.de/volltexte/documents/3263.
  • Jansen, Bernard J, Amanda Spink, Judy Bateman, und Tefko Saracevic. 1998. „Real life information retrieval: a study of user queries on the Web“. SIGIR Forum 32 (1) (April): 5–17. doi:10.1145/281250.281253.
  • Novotny, Eric. 2004. „I don’t think I click: A protocol analysis study of use of a library online catalog in the Internet age“. College & Research Libraries 65 (6): 525–537.
  • Ramdeen, Sarah, und Bradley M Hemminger. 2011. „A tale of two interfaces: How facets affect the library catalog search“. Journal of the American Society for Information Science and Technology 63 (4): 702–715.
  • Sadeh, Tamar. 2007. „Time for a change: new approaches for a new generation of library users“. New Library World 108 (7/8): 307–316. doi:10.1108/03074800710763608.

1 Kommentar

Kommentieren

Sie können diese XHTML-Tags verwenden: <a href="" title="" rel=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>