Das Management von Dateien während des Forschungsprozesses

In diesem Bereich finden Sie Informationen rund um das Dateimanagement mit dem Fokus auf der Organisation und Strukturierung von Daten und Dateien, relevante Hinweise zur Benennung, Versionierung und Auswahl geeigneter Dateiformate sowie zur Speicherung und Sicherung dieser Dateien. Dabei liegt der Fokus auf allgemeinen Handlungsempfehlungen und Hilfestellungen.

  • Datenorganisation und -strukturierung
  • Benennung von Dateien
  • Versionierung
  • Dateiformate und Software
  • Speicherung und Sicherung digitaler Daten

Datenorganisation und -strukturierung

Zur optimalen Arbeit mit Forschungsdaten, Materialien und Dokumenten empfiehlt es sich, die generierten und genutzten Dateien sowie die Verzeichnisse nach bestimmten Regeln systematisch zu organisieren und zu strukturieren.  Dies erleichtert nicht nur die Orientierung im eigenen System, sondern erzeugt Transparenz und bewährt sich gerade bei Zugriff durch unterschiedliche Mitarbeiterinnen und Mitarbeiter eines Forschungsteams.

Verzeichnisstruktur und Ablageort

Verzeichnisse sollten übersichtlich angelegt und aussagekräftig benannt werden, um die Suche nach Inhalten zu erleichtern sowie darauf zugreifende Personen zu leiten. Mitunter gibt es hierzu bereits formulierte Vorgaben und Rahmenbedingungen der eigenen Einrichtung, die es zu berücksichtigen gilt, z.B. bezüglich der Ablage personenbezogener und ethisch sensibler Daten.

Bestenfalls erfolgt die Ablage und Organisation derart, dass die Dateien jederzeit, auch perspektivisch für alle Beteiligten am Forschungsprozess leicht zugänglich und auffindbar, Änderungen und Dateiversionierungen nachvollziehbar sind sowie relevante Dateien erhalten bleiben und vor Verlust geschützt sind.

Bei der Wahl eines geeigneten Ablageorts sollte darauf geachtet werden, dass

  • Backup-Verfahren die Sicherung der Dateien garantieren,
  • genügend Speicherkapazität bereitgestellt werden kann,
  • es eine klare Zugriffssteuerung nach den rechtlichen Vorgaben gibt, also nur befugten Personen Zugriff gestattet werden kann.

Die Verzeichnisse sollten bestenfalls in einer hierarchischen Grundstruktur abgebildet werden, also Unterverzeichnisse genutzt werden. Bestenfalls finden Ober- und Unterkategorien Verwendung. Wie diese inhaltlich und formal strukturiert und benannt werden, liegt im Verantwortungsbereich der Forschenden.

Mögliche Ordnungskategorien:
⇒ Projektstruktur
⇒ Arbeitspakete
⇒ Inhalte der Ordner (z.B. Literatur, Veranstaltungen, Publikationen, Technik, 
     Dokumentation, Forschungsdaten)
⇒ Themenschwerpunkte
⇒ Zeitangaben (nach Datum oder Zeitspannen
⇒ Personen

Innerhalb eines Ordnersystems lassen sich auch feste Elemente systematisch und wiederkehrend verankern, z.B. ein Ordner Kommunikation für Absprachen und E-Mails, jeweils ein Unterordner Archiv für veraltete, aber dennoch aufzuhebende Dateien, ein Unterordner Posted für mit Dritten geteilte Dateien, etc.

Benennung von Dateien

Bei der Erstellung und Bearbeitung von Dateien ist eine eindeutige Benennung mitsamt Kennzeichnung von Änderungen elementar. Klare Bezeichnungen zu Inhalt, Datum und Personen erleichtern sowohl die Unterscheidung, die Auffindbarkeit der Daten und den gemeinsamen Zugriff darauf. Sie dienen der Übersichtlichkeit und helfen auch hinsichtlich der späteren Aufbewahrung und Bereitstellung nach Abschluss des Forschungsprozesses.

Empfehlungen

Die Benennung sollte einheitlich, eindeutig und nach klaren vereinbarten Regeln erfolgen.

  • Mit Rücksicht auf unterschiedliche Systeme und Komponenten (z.B. Betriebssysteme, Webserver) sollten Leer-, Sonderzeichen und Umlaute vermieden werden. Die Trennung der Namensbestandteile sollte konsistent, z.B. über Binde- oder Unterstrich erfolgen.
  • Der Dateiname sollte möglichst kurz gehalten werden, aber dennoch so lange wie nötig sein. Dies ist durchaus für die Sicherung und Backup von Belang, weil manche Systeme eine Obergrenze von 260 Zeichen für den gesamten Dateipfad festsetzen.
  • Der Inhalt der Datei sollte sich im Namen widerspiegeln, um auch ggf. die Zuordnung in dafür vorgesehene Verzeichnisse zu erleichtern.

Auswahl möglicher Elemente für die Benennung

  • Inhalt(e) der Datei, bestenfalls mit einem Begriff
  • Kurztitel (Projekt, Literaturangabe etc.)
  • Organisationseinheit
  • Formale Angaben (Original, Konzept, Bericht, Paper etc.)
  • Datum der Erstellung, Änderung oder Publikation (Empfehlung: JJJJMMTT)
  • Angaben zum Bearbeitungsprozess und -status (bearb., korr., publ., Anm., etc.)
  • Kürzel der erstellenden, bearbeitenden oder verantwortlichen Person
  • Versionsnummer

Beispiel: ProjektX_Inhalt_20001129_bearb_MM_v2

Für die eindeutige Benennung von Forschungsdaten empfiehlt es sich, ein Studienkürzel oder Studien–ID, den Datentyp (z.B. Interview, Video) in eindeutiger Kurzform sowie laufende Nummern für die einzelnen Datentypen (001, 002, etc., bei Bedarf weitere Unterscheidungen bei mehreren Dateien eines Datentyps ⇒ 001a, 001b, etc.) und Kennzeichnungen bei unterschiedlichen Versionen (v1, v2) im Dateinamen abzubilden.

Beispiel: Studienkürzel_Video_001b_v3

Versionierung

Zur Nachvollziehbarkeit und Kontrolle der eigenen Arbeitsschritte und Ergebnisse ist es dringend ratsam, vorgenommene Änderungen jeglicher Art zu dokumentieren. Dies kann einerseits durch Hinzufügen von Versionsnummern zum Dateinamen erfolgen, aber auch in der Datei selbst oder über ausgelagerte Dokumentation in einem Versionierungsdokument.

Änderungen sollten dabei klar benannt und kenntlich gemacht werden mit Informationen darüber, wer welche Bearbeitung wann vorgenommen hat. In der Regel gilt, dass größere Änderungen eine neue Versionsnummer (z.B. v1, v2, v3 usw.) veranlassen, kleinere Anpassungen üblicherweise an zweiter oder dritter Kommastelle (z.B. v1.1, v1.2 usw.) gekennzeichnet werden. Dabei bleibt der Dateiname im Kern erhalten.

Veraltete Versionen sollten an einem eigenen Ablageort innerhalb des Verzeichnisses gespeichert werden, solange sie von Relevanz sind. Eine Kopie des Originals der Datei sollte prinzipiell aufbewahrt werden.

Zur Überprüfung von Änderungen kann man auch Versionskontrollsysteme wie z.B. die Open Source-Software Subversion, GitHub, GitLab, aber auch basal Wiki-Technologie mit integrierter Versionsverwaltung einsetzen. Allgemein ist jeder Einsatz von Software mit Aufzeichnung einer Bearbeitungshistory zweckdienlich.

Dateiformate und Software

Bei der Erstellung und Nutzung von Dateien empfiehlt es sich, auf die Auswahl geeigneter Dateiformate zu achten und somit auch entsprechende Softwareprodukte zu verwenden. Im Sinne des langfristigen Erhalts und der potenziellen Nachnutzung der Forschungsdaten sollten nichtproprietäre oder zumindest weit verbreitete Dateiformate genutzt werden. Datenarchive und Repositorien nehmen nämlich oftmals nur bestimmte, langzeitarchivierungsfähige Dateiformate an, um etwaigen Aufwänden bei der notwendigen Datenmigration in neuere Dateiformate (z.B. auf Grund neuerer Softwareversionen) zu reduzieren und dem wissenschaftlichen Adressatenkreis niedrigschwellig bereitzustellen.

Weitere Informationen über nutzbare und empfohlene Dateiformate nach Dokumententyp erhalten Sie auf Anfrage. Werfen Sie auch gerne einen Blick auf die Dateiformatpolicy für Forschungsdaten von PubData, dem Leuphana-Repositorium für Forschungsdaten.

Speicherung und Sicherung digitaler Daten

Die angemessene Speicherung und Sicherung der erzeugten und genutzten Forschungsdaten stellen wichtige Anforderungen an Forschungsdatenmanagement dar. Ziel muss es sein, die Datensicherheit zu gewährleisten, also die rechtlichen Anforderungen zum Schutz personenbezogener und –beziehbarer Daten zu erfüllen sowie generell Verlust und Beschädigung digitaler Daten und zugehörigen Software durch technische oder menschliche Fehler zu verhindern, also die sog. Datenintegrität zu erhalten.

Anforderungen durch den Datenschutz

Bei Daten mit jeglichem Personenbezug muss gewährleistet werden, dass nur autorisierte Personen Zugriff auf die Daten haben. Hierzu gilt es entsprechende Schutzmaßnahmen zu ergreifen. Diese beinhalten:

  • die Verwendung gesicherter Übermittlungs- und Zugangsverfahren,
  • den Passwortschutz oder die Verschlüsselung der Dateien bzw. Verzeichnisse inklusive sicherer und kontrollierter Verwahrung der Zugangsdaten und Schlüssel.
  • sichere Autorisierungs- und Authentifizierungsverfahren.

Datensicherung

Die Speicherung und Sicherung der Forschungsdaten im laufenden Forschungsprozess sollte in regelmäßigen Abständen mit ausreichenden Backupkopien durchgeführt werden. Es bietet sich an, die technischen Angebote der eigenen Einrichtung für regelmäßige Datenbackups zu nutzen, also z.B. gesicherte und zugangsgeschützte Server und Laufwerke des Rechenzentrums zu nutzen. Eine Option stellen prinzipiell auch externe Speichermedien (Festplatten, USB-Sticks) dar. Insgesamt sollte die Sicherung ortsverteilt, also an verschiedenen Standorten gewährleistet werden.

Die Vorteile der Angebote des Rechenzentrums liegen in der Anwendung professioneller Backupverfahren sowie in der Option der Verfügbarkeit für autorisierte Personen mit der Option auf feste Zugriffsbeschränkungen und Rechtemanagement. Somit kann Datensicherheit garantiert, d.h. Datenverlust über automatisierte und standardisierte Prozesse vermieden werden. Bei der Speicherung auf externen Speichermedien fehlt diese Kontrolle der Datenintegrität üblicherweise. Durch die fehlende Synchronisierung unterschiedlicher Backups wird kollaboratives Arbeiten oftmals erschwert bis hin zu Versionierungsproblemen mit Dateien unterschiedlichen Stands.

Generell sollten Forscherinnen und Forscher sich bereits rechtzeitig vor der Datenerhebung Gedanken machen, welche Daten zu welchen Bedingungen wo sicher gespeichert werden müssen, welche technische Infrastruktur notwendig ist und welche weiteren Vorkehrungen organisatorisch getroffen werden müssen. Dabei gilt es die eigenen Bedarfe mit den Sicherheits- und Serviceleistungen der eigenen Einrichtung in Einklang zu bringen oder – bei Nichterfüllbarkeit der Anforderungen - notfalls geeignete Alternativen zu eruieren.

Datensicherung bei Beteiligung externer Partner:
Im Falle externer Kooperationen erfolgt der Datenaustausch und -zugriff meist über übergreifenden Plattformen und Systeme, so z.B. Cloudlösungen, oder Systeme einer der beteiligten Einrichtungen. Auch hier ist es dringend erforderlich, die Sicherheit und Sicherung der im Kooperationsnetzwerk bereitgestellten Daten und Materialien zu gewährleisten, die Eignung der Systeme zu prüfen und geregelte Mechanismen und Verfahren rechtzeitig zu implementieren.

Datenspeicherung an der Leuphana

Für die Speicherung Ihrer Forschungsdaten und Dokumente können Sie bereits bestehende Netzlaufwerke Ihrer Organisationseinheit nutzen oder ein neues Gruppenlaufwerk mit standardmäßig 100 Gigabyte Speichervolumen, kostenfrei erweiterbar auf 400 Gigabyte, beantragen. Darüber hinausgehende Datenmengen müssen mit einer finanziellen Aufwandsentschädigung vergolten werden.
Von den Daten auf den Netzlaufwerken werden regelmäßig Backups erstellt und somit die Gefahr von Datenverlust minimiert. Der IT-Service hilft Ihnen gerne bei der Einrichtung des Laufwerkes auf Ihrem Rechner. Um ein Gruppenlaufwerk zu beantragen oder den Speicherplatz erweitern zu lassen, wenden Sie sich bitte an heiko.reincke@leuphana.de. Besuchen Sie für nähere Instruktionen auch den hierfür vorgesehenen Bereich Anleitungen des MIZ  zum Thema Datenspeicher.

Zusätzlich steht mit dem niedersächsischen Dienst academicCloud Sync&Sha­re eine Möglichkeit zur Verfügung, Daten und Materialien auch extern für einen eingeschränkten Benutzerkreis zugänglich zu machen. Der Dienst ist über Client oder Web­brow­ser nutzbar und wird entsprechend der europäischen und deutschen Datenschutzbestimmungen betrieben. Insgesamt werden pro Nutzer nzw. Nutzerin 50 Gigabyte Speicherplatz bereitgestellt. Der Dienst sollte primär in seinem eigentlichen Verwendungszweck als professionelle und sichere Austausch- und Synchronisierungsplattform verstanden werden. → weitere Informationen   

Für weitere, fallbezogene Auskünfte rund um die Organisation, Benennung, Sicherung und Speicherung Ihrer Forschungsdaten und Dateien stehen gerne auch unsere Beratungsservices zur Verfügung.

Thomas Schwager
Universitätsallee 1, CB.132
21335 Lüneburg
Fon +49.4131.677-1175
thomas.schwager@leuphana.de

Martin Bilz
Universitätsallee 1, CB.105
21335 Lüneburg
Fon +49.4131.677-1113
martin.bilz@leuphana.de

Heiko Reincke
Universitätsallee 1, C7.122
21335 Lüneburg
Fon +49.4131.677-1204
heiko.reincke@leuphana.de