Nutzungsstatistiken als alternative Impact-Messung – das Projekt „Open-Access-Statistik“

Veröffentlicht am von in der Kategorie Projekte, Technik.

Ein Gastbeitrag von Daniel Metje und Tobias Schäfer, SUB Göttingen

OASWer in der Wissenschaft publiziert, will gelesen und viel lieber noch zitiert werden. Denn der Impact einer Publikation oder der eines Wissenschaftlers wird oft allein durch einen zitationsbasierten Indikator angegeben, meist durch den Journal Impact Factor (JIF) oder den Hirsch-Index (h-Index). Die Erfolgsmessung sowohl von Einrichtungen als auch von Einzelpersonen hängt sehr stark von diesen Maßzahlen ab. Die Methoden, die den Impact wissenschaftlicher Publikationen erfassen, weisen jedoch einige Unzulänglichkeiten auf:

  • Die indizierten Dokumente der Datenbanken, mit deren Hilfe zitationsbasierte Metriken erstellt werden, wie das Web of Science (WoS), der Journal Citation Reports (JCR) oder Scopus, ist vom Umfang her begrenzt und wird mehr oder weniger willkürlich festgelegt.
  • JIF und h-Index weisen verschiedene fächerspezifische Verzerrungen auf, so werden beispielsweise viele Dokumentenarten von vornherein ausgeschlossen oder es wird stets ein festes Zeitfenster von zwei Jahren betrachtet (JIF).
  • Sowohl JIF als auch h-Index begünstigen Veröffentlichungen in englischer Sprache.

Obwohl zitationsbasierte Metriken prinzipiell Argumente für Open Access liefern können, benachteiligen sie gleichzeitig Open-Access-Publikationen, wodurch die Attraktivität von Open Access für Wissenschaftler gemindert wird. Besonders Dokumente, die auf Open-Access-Repositorien selbstarchiviert und in keiner Open-Access-Zeitschrift veröffentlicht werden, sind von den für die Berechnung von JIF und h-Index relevanten Datenbanken ausgeschlossen.

Zwar gibt es für viele Open-Access-Zeitschriften JIF-Kennzahlen, einige haben gar einen beachtlichen Impact Factor; dennoch werden sie durch die Berechnungsregeln des JIF und den Betrachtungsrahmen des JCR benachteiligt. Da viele Open-Access-Zeitschriften neu am Markt sind, können sie beispielsweise keine umfangreiche Zitationsgeschichte vorweisen. Genau diese ist für die Indexierung in JCR und für das Erreichen eines attraktiven JIF-Wertes aber nötig.

Vermutlich würde mehr Open Access veröffentlicht werden, wenn dies der Reputation der Wissenschaftler dienlich wäre. Um alternative, auf der Nutzung von Dokumenten beruhende Indikatoren zu prüfen, zu bewerten und zu entwickeln, wird eine ausgereifte Infrastruktur benötigt. Dadurch können auch in einem heterogenen Netzwerk aus verschiedenen Servern standardisierte Nutzungsdaten erzeugt und ausgetauscht werden, besonders wenn diese Daten Kontextinformationen über die Dokumentnutzung beinhalten.

Das Projekt Open-Access-Statistik (OAS) wird von der Deutschen Forschungsgemeinschaft (DFG) gefördert und wurde von der Arbeitsgruppe Elektronisches Publizieren der DINI (Deutsche Initiative für Netzwerkinformation) initiiert. Vier Projektpartner [1] arbeiten gemeinsam auf folgende Ziele hin:

  1. die Entwicklung eines gemeinsamen Standards für den Austausch von Nutzungsdaten zwischen verschiedenen Diensten und
  2. den Aufbau einer Infrastruktur, um Nutzungsinformationen zwischen verschiedenen Diensten zu sammeln, zu verarbeiten und wieder zur Verfügung zu stellen, um vergleichbare Messzahlen zu erhalten.

Die OAS-Infrastruktur besteht aus zwei Schichten:

  1. Data-Provider (z. B. Open-Access-Repositorium, Lizenzserver oder Linkresolver) erfassen die Dokumentennutzung in Logdateien und pseudonymisieren Nutzerinformationen (z. B. IP-Adressen). Sie verarbeiten diese Nutzungsinformationen, wobei eindeutige Dokumenten-IDs hinzugefügt und die Daten in OpenURL-ContextObjects überführt werden. Schließlich werden diese Informationen mittels OAI-PMH bereitgestellt. (Demo-Data-Provider)
  2. Der zentrale Service-Provider sammelt die Nutzungsereignisse von jedem Data-Provider und verarbeitet diese Daten. Dabei werden Dokumente dedupliziert, also die Zugriffe auf Dokumente gleichen Inhalts, die sich auf verschiedenen Servern befinden, aufsummiert. Genauso erfolgt eine Nutzerdeduplizierung, so dass Downloadgraphen erstellt und eine Clickstream-Analyse durchgeführt werden können. Weiterhin werden die Daten gemäß der Standards von COUNTER, LogEc und IFABC aggregiert, wodurch die Zugriffe von verschiedenen Diensten vergleichbar werden. Dabei werden auch nicht-menschliche Zugriffe sowie Mehrfachzugriffe herausgefiltert.

Nach der Berechnung der Nutzungsdaten werden diese wieder den verteilten Diensten, also den Data-Providern, und zudem dem Projekt OA-Netzwerk bereitgestellt. (Eine mögliche Visualisierung findet sich auf der Demo-Webseite)

Um an der OAS-Infrastruktur als Data-Provider teilzunehmen, müssen die Betreiber von Repositorien, Lizenzservern und Linkresolvern nur geringe technische Anforderungen erfüllen. Für Repositorien, die auf DSpace oder OPUS basieren, stehen bereits fertige Module von OAS bereit, so dass sich die Implementierung noch weiter vereinfacht. Andere Systeme können mit wenig Aufwand für OAS konfiguriert werden.

Zurzeit plant OA-Statistik eine zweite Förderphase. Einige der Kernpunkte von OAS‑2 sind es,

  • neue Dienste wie Zeitschriften und weitere Repositorien für die Teilnahme an OAS zu gewinnen,
  • neue, komplexere Indikatoren als reine Nutzungszahlen unter Nutzung von Methoden der Netzwerkanalyse zu entwickeln und
  • die Internationalisierung des Projektes.

Kontakt:

Daniel Metje
Elektronisches Publizieren (EPU)
Niedersächsische Staats- und Universitätsbibliothek Göttingen
E-Mail: metje@sub.uni-goettingen.de

Tobias Schäfer
Elektronisches Publizieren (EPU)
Niedersächsische Staats- und Universitätsbibliothek Göttingen
E-Mail: tobias.schaefer@sub.uni-goettingen.de

[1]: Die Niedersächsische Staats- und Universitätsbibliothek Göttingen (SUB Göttingen), der Computer und Medien Service (CMS) der Humboldt-Universität zu Berlin (HU Berlin), die Saarländische Universitäts- und Landesbibliothek Saarbrücken (SULB Saarbrücken) und die Universitätsbibliothek Stuttgart (UB Stuttgart).

5 Kommentare

  1. Stevan Harnad

    Warum?

    Der Autor veröffentlicht seine Artikel in einer konventionellen (Abonnement) Zeitschrift, und zusätzlich selbstarchiviert er auch seinen artikel. So erhält er alle Downloads und alle Zitaten die er von der Veröffentlichung erhalten würde wenn er nur in den konventionellen Zeitschrift veröffentlichen hätte, und darüber hinaus, erhält er auch alle zusätzliche Downloads und Zitaten, die wegen die Open Access selbstarchivierung ermöglicht werden.

    Wo ist der Nachteil oder Verlust?

    Antworten
  2. Stevan Harnad

    Ich habe vergessen, hinzuzufügen: Mein Kommentar (oben) wurde als Reaktion auf den folgenden Text:

    „Obwohl zitationsbasierte Metriken prinzipiell Argumente für Open Access liefern können, benachteiligen sie gleichzeitig Open-Access-Publikationen, wodurch die Attraktivität von Open Access für Wissenschaftler gemindert wird. Besonders Dokumente, die auf Open-Access-Repositorien selbstarchiviert und in keiner Open-Access-Zeitschrift veröffentlicht werden, sind von den für die Berechnung von JIF und h-Index relevanten Datenbanken ausgeschlossen.“

    Antworten
  3. Herb

    1) weil nicht alle Dokumente auf Repositories korrekt unter Verwendung der bibliographischen Daten der formalen Publikation im Journal zitiert werden
    2) weil der Scope der Datenbanken begrenzt ist nicht alle Journal in Wok etc. indiziert sind.

    Antworten
  4. Stevan Harnad

    (1) Zitierung: Zitierung ist eine wissenschaftliche Frage. Es hat nichts damit zu tun, ob die Publikation auch selbst-archiviert ist. Man zitiert die kanonische Arbeit wie sie veröffentlicht ist.

    (2) Anwendungsbereich: Alle veröffentlichten Artikel können und sollten selbst-archiviert.

    Antworten
  5. Herb

    1) theoretisch ja, faktisch: mal so, mal so
    2) ja, aber nicht alle sind aus Journals, die in Thomsons Datenbanken oder Scopus indiziert sind – und die haben dann keinen wie auch immer gearteten Impact-Wert.

    Antworten

Kommentieren

Sie können diese XHTML-Tags verwenden: <a href="" title="" rel=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>