Archivierung und Publikation von Forschungsdaten

Ist der eigene Forschungsprozess abgeschlossen und sind die eigenen Forschungsdaten angemessen aufbereitet und dokumentiert, steht für die Forschenden der finale Schritt bevor: die Archivierung und – wenn möglich – Publikation der erhobenen und generierten Daten.

  • Wahl eines geeigneten Archivs oder Repositoriums
  • Mindestaufbewahrung
  • Formen der Archivierung
  • Sonderformen Supplement, Data Journal und Data Paper
  • Persistent Identifier und Zitation

Wahl eines geeigneten Archivs oder Repositoriums

Um die Daten bestmöglich archivieren und veröffentlichen zu können, empfiehlt es sich, die Anforderungen potenzieller Archivierungs- und Publikationsdienstleister frühzeitig einzubeziehen, erste Sondierungen vorzunehmen und die beste Lösung für den eigenen Bedarf zu eruieren. Für die adäquate Aufbereitung der Daten und Kostenkalkulation ist es lohnenswert, sich rechtzeitig im Planungsverfahren mit dem Thema der Archivierung und Publikation zu befassen. Mögliche Kosten für Speichersysteme oder Dokumentationsaufwand können zum Beispiel bereits im Antragsverfahren für Drittmittelprojekte bei entsprechender Argumentation bewilligt werden. Auch eine frühzeitige Kontaktaufnahme zum gewünschten Archiv ist durchaus ratsam.

Jede Archivierungs- und Publikationslösung, ob übergreifende nationale oder internationale Repositorien oder fachspezifische Repositorien oder das sich an der Leuphana im Aufbau befindende institutionelle Repositorium, bietet gewisse Vorteile. Prinzipiell lässt sich aber die Empfehlung aussprechen, dass ein fachspezifisches Repositorium in der Regel am geeignetsten die Bedarfe und Möglichkeiten der eigenen Wissenschaftscommunity spiegelt und – wenn vorhanden und ausreichend aufgestellt – zu bevorzugen ist.

Einige Faktoren bei der Auswahl

• Inhaltliche Eignung des Repositoriums
• Praxis und Common Sense in der eigenen Wissenschaftsdisziplin
• Anforderungen von Geldgeber und/oder eigener Einrichtung
• Ruf und Vertrauenswürdigkeit des Anbieters (u.a. durch Zertifizierung oder Akkreditierung belegt)
• Kosten und eigener Aufwand
• Beschreibungsmöglichkeit der Daten (Qualität und Quantität der Metadaten)
• Publikations- und Nutzungsbedingungen (z.B. Open Access, Nutzungslizenzen, eingeschränkte Nutzung)
• Garantie der dauerhaften Zitierbarmachung der Daten über persistente Identifier
• Erfüllung des gewünschten Leistungsumfangs bzgl. Archivierung (mögliche Aspekte: Datensicherheit, Langzeitarchivierung oder reine Sicherung, Standorte, Zugriff auf eigene Daten)
• Technische Anbindung des Repositoriums (Interoperabilität, Nutzung geeigneter Standards)
• Geeignete Nutzungsbedingungen
• Qualitätssichernde Verfahren (z.B. Ausmaß an Datenkuratierung, Prüfprozesse)

Als Ankerpunkt dienen die FAIR Prinzipien, die bei vielen Repositorien bereits Berücksichtigung und Umsetzung erfahren. Diese Prinzipien propagieren, dass Daten bestenfalls so publiziert werden sollen, dass sie leicht auffindbar und zugänglich sind, sie unter Nutzung interoperabler Verfahren sichtbar und durch geeignete Beschreibung nachnutzbar sind. 

Mindestaufbewahrung

In vielen Förderbedingungen und Richtlinien wissenschaftlicher Einrichtungen wird mittlerweile standardmäßig eine Mindestaufbewahrungsdauer von 10 Jahren vorgeschrieben. An der Leuphana gilt laut der universitätseigenen Richtlinie zur Sicherung der guten wissenschaftlichen Praxis ebenfalls die Aufbewahrungspflicht von 10 Jahren. Maßgeblich ist dabei die Reproduzierbarkeit, also die Interpretier- und Lesbarkeit der archivierten Daten. Dies impliziert die Dokumentation der Daten in Form von Metadaten und die entsprechende technische und inhaltliche Aufbereitung der Daten.

Formen der Archivierung

Technik ist schnelllebig. Hardware, Software und dazugehörige Dateiformate entwickeln sich permanent weiter, technische Systeme haben eine begrenzte Lebensdauer. Bei der momentan festgelegten Mindestaufbewahrungsdauer muss aber garantiert werden, dass die einst archivierten Daten auch 10 Jahre später noch reproduzierbar, also auch technisch les- und nutzbar sind. Allein deshalb sollten Daten regelmäßig auf Funktionalität und Integrität hin geprüft und notfalls Sicherungsmaßnahmen ergriffen werden. Ein Datenarchiv kann genau diese Leistungen erbringen. Somit kann die Gefahr eines Datenverlusts reduziert werden.

Die langfristige Sicherung erfolgt oftmals durch Bitstream Preservation, also die bloße Prüfung und Gewährleistung der Dateiintegrität. Im Gegensatz zu dieser basalen Archivierung geht die sog. digitale Langzeitarchivierung einen Schritt weiter. Sie sorgt durch Migrationsverfahren, Vorhalten geeigneter Software, zusätzliche Prüfroutinen und ausgiebige Dokumentation der Verfahren in sehr hohem Maße dafür, dass Daten auch in Jahrzehnten noch garantiert adäquat genutzt werden können. Naturgemäß sind diese Archivierungsleistungen sehr aufwendig und kostenintensiv. Daher gibt es zurzeit nur wenige Anbieter für Langzeitarchivierung, die diese Leistungen garantieren können.

Sonderformen Supplement, Data Journal und Data Paper

Je nach Wissenschaftsdisziplin und Publikationspraxis variieren Veröffentlichungspraxis für Forschungsdaten. Vermehrt werden Forschungsdaten auch als Supplement einem wissenschaftlichen Artikel beigefügt und damit veröffentlicht oder aber über eigene Datenjournale (Data Journals) in Form von Data Papers beschrieben. Manche Verlage fordern den Datennachweis zum Zeitschriftenartikel.
Generell sind Repositorien als Speicher- und Archivierungsort dieser Daten vorzuziehen. Sie erlauben die standardisierte Beschreibung der Daten und bessere Auffindbarkeit der Daten, sichern und erhalten die Daten langfristig unter Verwendung geeigneter Verfahren und Formate und sind somit vertrauenswürdiger und im Sinne der FAIR Prinzipien besser geeignet, auch was die technische Umgebung und Datensicherheit (Download, Zugriff, Datenvolumina) anbelangt.

Persistent Identifier und Zitation

Bei der Publikation von Forschungsdaten ist es wichtig, diese im Sinne guter wissenschaftlicher Praxis dauerhaft identifizieren und damit auch zitieren zu können. Deshalb sollte unbedingt darauf geachtet werden, dass im Zuge der Bereitstellung und Veröffentlichung von Forschungsdaten auch gleichzeitig ein persistenter Identifier vergeben wird. Dies kann zum Beispiel eine DOI oder eine URN sein. Die Vergabe erfolgt über ein Registrierungsverfahren unter Übermittlung gewisser Metadaten, mindestens von Titel und Webadresse (Link), unter welcher die registrierte Ressource permanent hinterlegt bleibt. Änderungen an der Ressource führen üblicherweise zu einer Versionierung und damit zur Neuvergabe eines persistenten Identifiers.

Der eineindeutig zugewiesene Identifikator wird als Zeichenfolge dargestellt und ist elementarer Bestandteil einer Zitation. Eine exakte, standardisierte Ansetzungsform für das Zitieren von Forschungsdaten existiert (noch) nicht flächendeckend. Allerdings werden mitunter Zitiervorschläge formuliert und dem Katalogeintrag oder den Daten selbst beigefügt. Diesen sollten Sie folgen, unter Beachtung einheitlicher Zitierweise.

Ein Beispiel für eine Zitierweise liefert die Registrierungsagentur für Sozial- und Wirtschaftsdaten, da|ra.

Ihre Ansprechperson für den Bereich Archivierung und Publikation: Thomas Schwager

MIZ

Thomas Schwager
Universitätsallee 1, CB.131
21335 Lüneburg
Fon +49.4131.677-1175
thomas.schwager@leuphana.de

Martin Bilz
Universitätsallee 1, CB.105
21335 Lüneburg
Fon +49.4131.677-1113
martin.bilz@leuphana.de

Forschungsservice

Dipl.-Oec. Anke Zerm
Universitätsallee 1, C10.204
21335 Lüneburg
Fon +49.4131.677-1692
anke.zerm@leuphana.de