Sie sind hier: Startseite / Produkte & Lösungen / Langzeitverfügbarkeit / Langzeitverfügbarkeit für Hochschulen
  • Wissen digital erhalten

Langzeitverfügbarkeit für Hochschulen

Mehr als Langzeitarchivierung: Mit der digitalen Langzeitverfügbarkeit landesweit den nachhaltigen Umgang mit Wissenschaftsressourcen gestalten.

Die Langzeitverfügbarkeit (LZV) von digitalen Materialien spielt in Hochschulen eine zunehmend wichtige Rolle. Im Sinne eines verstetigten Forschungsdatenmanagements stellt Langzeitverfügbarkeit neben der dauerhaften Archivierung die Auffindbarkeit, Nachnutzung und Erweiterbarkeit von forschungsrelevanten Materialien sicher. Auch für den administrativen Bereich gewinnt die langfristige Verfügbarkeit von Daten an Bedeutung.

Mit der Rosetta-Infrastruktur unterstützt das hbz die Hochschulen des Landes Nordrhein-Westfalen bei ihrer Aufgabe, digitale Materialien langfristig für die Nutzung bereitzustellen. Digitale Forschungsergebnisse, Forschungsdaten und andere Materialien entstehen in Wissenschaft und Verwaltung in großen Mengen und müssen langfristig verfügbar bleiben. Um die Informationen auch dann noch nutzen zu können, wenn sich Dateiformate, Anwendungssoftware oder digitale Infrastruktur verändern, bedarf es vielfältiger Erhaltungsaktivitäten. Hierbei bietet das hbz den Verantwortlichen an Hochschulen praktische Unterstützung in Theorie und Praxis an.

Infrastruktur zur Sicherung digitaler Langzeitverfügbarkeit (LZV)

Initiiert vom Wissenschaftsministerium des Landes Nordrhein-Westfalen und begleitet von verschiedenen Fachgremien, wird seit 2016 eine Infrastruktur zur Sicherung digitaler Langzeitverfügbarkeit aufgebaut, die aktuelle und künftige Anforderungen im Hochschulbereich erfüllt. Die Partner an der RWTH Aachen und der Universität zu Köln unterstützen den Aufbau der Infrastruktur bereits in der Pilotphase. Seit 2018 steht die Infrastruktur allen Hochschulen des Landes NRW offen.

Langzeitverfügbarkeit - Warum?

Forschung basiert auch im digitalen Zeitalter auf Zugang, Wiederverwendung und Re-Analyse wissenschaftlicher Daten. Digitale Wissensressourcen, Forschungsergebnisse und zugrunde liegende Primärdaten müssen langfristig nutzbar bleiben. Hierbei ist die Sicherung der Authentizität von zentraler Bedeutung. Weil modernes Forschungsdatenmanagement von verschiedenen Akteuren an Hochschulen getragen wird, müssen dort involvierte Bibliotheken und Verwaltungen digitale Materialien langfristig erhalten. Langfristig heißt in diesem Zusammenhang: dauerhaft und über Technologiewechsel hinweg. Die Grundsteine einer langfristigen Verfügbarkeit liegen neben der reinen Datensicherung in der koordinierten Zusammenarbeit der Beteiligten. Die Beschreibung der Daten auf inhaltlicher, technischer und administrativer Ebene ist durch geeignete Metadaten sicherzustellen. Um den Nachweis der Daten auch über sehr lange Zeiträume hinweg zu sichern, müssen Erhaltungsplanung und Erhaltungsaktivitäten im Rahmen eines Preservation Planning konzipiert und dokumentiert werden.

Was bietet Rosetta?

Die Software Rosetta der Firma Ex Libris ist konform zum OAIS-Modell und arbeitet mit verbreiteten Preservation Standards. Sie bietet unter anderem:

  • Format Identification – Dateiformate werden anhand einer globalen Formatdatenbank (basierend auf PRONOM) erkannt und registriert
  • Format Validation – Prüfung des Datenformats
  • Risk Management – automatisierte Erkennung bestimmter Risiken
  • Format Migration – Konvertierung gefährdeter Datenformate in langzeitstabile Formate
  • Exit Strategy – Datenhaltung unabhängig von den Spezifika des Langzeit-Repositorys
  • Einbindung von bedarfsgerechten Plug-Ins

Merkmale der Landeslösung

Derzeit wird Rosetta in der Version 5.5 beim hbz produktiv eingesetzt. Die Software ermöglicht die kunden- und materialspezifische Einlieferung in einen Speicher, der entweder an eine

  • zentral im hbz betriebene oder
  • lokal installierte Rosetta-Infrastruktur angebunden ist.

Die spezifische Erhaltungsplanung für die Daten nutzt das Know-How einer globalen Community, das in international vernetzten Rosetta Working Groups gebündelt ist. Die Landeslösung des hbz verfügt über folgende Infrastrukturmerkmale:

hbz Sandbox: Zentrale Rosetta-Installation zur Einrichtung und zum Testen von Einlieferungen. Drei virtuelle Server (Red Hat Enterprise Linux 7), davon zwei für Rosetta und einer für eine Oracle Datenbank.

hbz Produktionsumgebung: Skalierbares Cluster von neun virtuellen Servern auf vier Host-Maschinen, 80 Terabyte Operational Storage, mindestens 1,5 Petabyte Speicher als Hierarchical Storage Management System (HSM) mit Festplatten und Magnetbändern.

Die lokale Rosetta-Infrastruktur ist jeweils abhängig von lokalen Bedarfen, die im Zuge einer Kooperation zusammen mit der teilnehmenden Einrichtung ermittelt werden.

Zeitplan

  • Vorbereitung: Use Case Definition, Hardware-Bereitstellung - Ende 2016 bis Mitte 2017
  • Implementierung: Wissenstransfer, Praxiserfahrung - bis Ende 2017
  • Ausweitung ins Land: Umsetzung landesweiter Projekte - ab 2018

Partner-Hochschule werden - Wie geht das?

Das Angebot steht seit 2018 allen Hochschulen des Landes offen. Es kann die zentrale, beim hbz betriebene Rosetta-Infrastruktur genutzt werden. Alternativ wird der Aufbau einer lokalen Instanz im Datenhoheitsbereich der eigenen Hochschule unterstützt.

Was müssen Sie wissen?

Die Sicherung der Langzeitverfügbarkeit erfordert Vorbereitung und Planung, bei folgenden Aspekten:

  • Auswahl und Vorbereitung der einzuliefernden Ressourcen
  • Spezifikation des Einlieferungswegs/der Einlieferungswege
  • Hostingkonzept: Soll Rosetta zentral oder lokal betrieben werden?

Wie sieht Ihre Rolle aus?

Ein Projektmanagement koordiniert die Kommunikation mit Forschenden sowie mit folgenden Rollen an der eigenen Hochschule:

  • Daten-Manager/-Managerin: kennt eingelieferte Daten und Metadaten
  • LZV-Manager/-Managerin: plant und trifft nötige Erhaltungsentscheidungen
  • Daten-Kurator/-Kuratorin: betreut die Daten im System

Das hbz stellt unterstützende Materialien zur Verfügung, die u.a. bei der Auswahl archivtauglicher Formate behilflich sind. Hierfür wurde ein Bewertungsinstrument mit etwa 50 Dateiformaten erstellt, die hinsichtlich Langzeitstabilität und Integrationsfähigkeit in Rosetta geprüft wurden.

Wie kommen Ihre Daten in das System?

  • Es stehen unterschiedliche Einlieferungsverfahren zur Verfügung. Unter anderem können METS-Container verarbeitet werden.
  • Als Schnittstelle wird z.B. OAI-PMH unterstützt. Darüber hinaus ist es möglich, eine eigene Submission Application zu entwickeln.
  • Die geeignete Methode kann anhand der Daten und des Anwendungsszenarios gewählt werden.

Anbindung von Open-Access-Repositorien via OAI-PMH

Auf Wunsch können mit Hilfe eines automatisierten Workflows Hochschul-Repositorien mit einer OAI-Schnittstelle an Rosetta angebunden werden. Auf technischer Ebene hat das hbz hierfür grundlegende Vorarbeiten geleistet und verschiedene Repository-Systeme auf ihre Eignung hin überprüft. Erste Tests verliefen auch mit hochvolumigen OAI-Ingests erfolgreich. Die folgende Übersicht spiegelt den aktuellen Stand der Test-Anbindungen wieder.

SystemOAI-Anbindung
Opus 4 erfolgreich
mycore erfolgreich
eprints erfolgreich
contentdm erfolgreich
semantics erfolgreich
dspace erfolgreich
invenio in Prüfung
alfresco in Prüfung
opus3 nicht möglich

Erläuterung „erfolgreich“:
Die Möglichkeit Daten über die OAI-Schnittstelle in Rosetta einzuliefern, hängt von den jeweiligen konkreten Rahmenbedingungen ab. Erforderlich ist z.B., dass ein Link auf jede Nutzdatei vorliegt oder konstruierbar ist. Der Link muss die Dateinamenerweiterung enthalten. Die Inhalte müssen direkt ausgeliefert werden (HTTP Response Code 200), dürfen also nicht hinter einer Weiterleitung liegen.

Erläuterung „nicht möglich“:
Die Einlieferung von Daten aus diesen Quell-Systemen ist in der Regel auf anderem Weg möglich.

Wie geht es weiter?

Ab sofort können weitere Hochschulen sukzessive mit der Nutzung der Rosetta-Infrastruktur beginnen. Je konkreter der jeweilige Use Case vorbereitet ist, desto einfacher und schneller kann die Anbindung an die Infrastruktur erfolgen. Eigene Aufwände der Hochschule sollten rechtzeitig einkalkuliert und in Zusammenarbeit mit dem [hbz] abgestimmt werden. Das hbz unterstützt Sie bei Ihren Vorbereitungen.

Aktuell nutzen wir einen Fragebogen für die erste Beschreibung Ihres Anwendungsszenarios und beraten Sie technisch und strategisch im Bereich der digitalen Langzeitverfügbarkeit.

Für weitere Informationen steht Ihnen das Rosetta-Team des hbz zur Verfügung: teamrosetta@hbz-nrw.de

Nach oben

Cookies

Wir verwenden Cookies, um unsere Webseiten benutzerfreundlicher zu gestalten und um Zugriffsstatistiken zu erheben. Durch die Nutzung unserer Webseiten akzeptieren Sie die Speicherung von Cookies. Zum Impressum

mehr erfahren Cookies akzeptieren