Kurz und bündig

Hier finden Sie in knapper Form eine Übersicht zu Begriffen rund um Forschungsdatenmanagement, Links zu Informationsangeboten, Portalen und zusätzlichen Anlaufstellen sowie perspektivisch einen Bereich mit FAQs (im Aufbau).

Glossar

  • A
  • B
  • C
  • D
  • F
  • I
  • K
  • L
  • M
  • N
  • O
  • P
  • R
  • S
  • U
  • Z

Glossar

A

Anonymisierung
Bei der Anonymisierung werden →personenbezogene Daten gemäß Datenschutzvorgaben so entfernt, dass Informationen nicht mehr oder nur mit unverhältnismäßig hohem Aufwand einer natürlichen Person zugeordnet werden können und dadurch keine Rückschlüsse mehr möglich sind.

Archivierung
Die Archivierung von Daten bedeutet sowohl die systematische →Sicherung der Daten über einen gewissen Zeitraum als auch der Erhalt und die Betreuung der Daten über geeignete Verfahren. Eine erweiterte Form stellt die →Langzeitarchivierung dar.

B

Backup
Sicherung der Daten

Bitstream Preservation
Bei Bitstream Preservation handelt es sich um eine Grundvoraussetzung für die digitale →Langzeitarchivierung. Die einzelnen Bits digitaler Daten (Wert 0 bis 1) werden in ihrer Zusammensetzung, dem Bitstream, langfristig – auch über Technologiewechsel hinweg - erhalten, zum Vorteile der →Datenintegrität.

C

Creative Commons-Lizenzen (CC-Lizenzen)
Im Zuge der Vergabe gewisser Nutzungsrechte für veröffentlichte Ressourcen bieten Creative Commons-Lizenzen eine weltweit anerkannte Lizenzierungsmöglichkeit für freien Zugang unter Wahrung der von Rechteinhabern eingeräumten Verwendungszwecke, die in Version 4.0 auch für die Lizenzierung von Forschungsdaten geeignet sind. Die Einräumung von Nutzungsrechten unter Nutzungsbedingungen ist dabei die Voraussetzung für eine geregelte Nachnutzung der bereitgestellten Daten.

D

Data Lifecycle
Datenlebenszyklus

Data Sharing
Unter Data Sharing versteht man das Teilen, also die Bereitstellung von Daten für die Nachnutzung durch Dritte.

Dateiformat
Das Dateiformat enthält die Syntax und Semantik von Daten innerhalb einer Datei und zeigt die Dateiart bzw. den Dateityp an. Das Dateiformat ist Voraussetzung für Computerprogramme und –anwendungen, um Dateien lesen und darstellen zu können. Formate und Software können proprietär, also lizenz- und patentrechtlich geschützt, und offen, also frei nutzbar, vorliegen. Hinsichtlich dauerhafter Nachnutzbarkeit und →Langzeitarchivierung ist die Auswahl und Anpassung entsprechend geeigneter Formate von essenzieller Bedeutung.

Datenarchiv
Ein Datenarchiv ist eine Einrichtung oder System, welches nach festen Richtlinien und Abläufen Forschungsdaten erfasst, erhält und betreut. Eine spezielle Form eines Archivs ist ein →Repositorium.

Datenintegrität
Unter Datenintegrität versteht man im Zuge von →Datensicherheit und →Sicherung der Daten die Unversehrtheit der Daten durch die Wahrung des Schutzes vor unbeabsichtigten technischen oder menschlichen Fehlern.

Datenlebenszyklus
Der Datenlebenszyklus (Data Lifecycle) ist ein Modell, dass die Lebenszeit von Forschungsdaten in einzelne Phasen vor, während und nach dem Forschungsprozess unterteilt. Dazu zählen i.d.R. die Planungs- und Antragsphase, die Erstellungs- und Erhebungsphase, die Verarbeitung, die Analyse der Daten, deren Archivierung, Zugang sowie Nachnutzung. Anhand dieses Datenlebenszyklus werden die Aufgabenbereiche von Forschungsdatenmanagement gruppiert und definiert. Das Modell soll einerseits zeigen, welche Prozesse und Aufgaben stattfinden, zum anderen auch durch die zyklische Ausrichtung verdeutlichen, dass die Lebenszeit von Forschungsdaten in neuen oder anderen Kontexten fortdauern kann und sogar soll.

Datenmanagementplan (DMP)
Ein Datenmanagementplan ist ein von beteiligten Forschenden auszufüllendes Dokument zur systematischen Planung und Steuerung der Anforderungen im Umgang mit eigenen Forschungsdaten oder Daten Dritter. Viele Fördereinrichtungen verlangen mittlerweile im Projektantragsverfahren die Erstellung eines solchen DMP und bieten Vorlagen. Er beinhaltet Aussagen zum Datenmanagement während des eigenen Forschungsprozesses und beschreibt den Umgang mit den Daten nach Abschluss des Forschungsvorhabens, speziell bezüglich →Archivierung und Bereitstellung der Daten zur Nachnutzung.

Datenmigration
Datenmigration bedeutet die technische Überführung von Daten in Dateiform auf andere technische Systeme oder in andere →Dateiformate.

Datenschutz
Datenschutz betrifft alle →personenbezogenenDaten und umfasst die Einhaltung der in der EU Datenschutz-Grundverordnung (DS-GVO), im Bundesdatenschutzgesetz und auf Bundeslandebene verabschiedeten gesetzlichen Bestimmungen. Diese besagen, dass personenbezogenen Daten unter Anwendung aller notwendigen technischen und organisatorischen Maßnahmen vor Missbrauch bewahrt werden müssen.

Datensicherheit
Datensicherheit geht über den bloßen →Datenschutz hinaus und umfasst alle technischen Aspekte zum Schutz von allen möglichen Arten von Daten mit dem Desiderat der Vertraulichkeit, also Zugriffsschutz, Integrität, also die Unversehrtheit der Daten, und Verfügbarkeit der Daten.

Digital Object Identifier (DOI)
Ein Digital Object Identifier ist ein bestimmter, weit verbreiteter →Persistent Identifier, der die eindeutige Identifizier-, Auffindbar- und Zitierfähigkeit digitaler Ressourcen dauerhaft ermöglicht.

F

FAIR Prinzipien
Die FAIR Prinzipien wurden 2016 von der FORCE11-Community erstmals formuliert. Das Akronym FAIR steht für findable, accessible, →interoperable und reusable und besagt, dass Daten im Sinne nachhaltigen Forschungsdatenmanagements so archiviert und bereitgestellt werden sollen, dass sie auffindbar, zugänglich, austauschbar zwischen verschiedenen Systemen und nachnutzbar sind.

Forschungsdaten
Unter Forschungsdaten versteht man alle Daten, Materialien und Informationen, die Gegenstand eines Forschungsprozesses sind, während eines Forschungsprozesses zu wissenschaftlichen Zwecken genutzt und erzeugt werden und die dessen Ergebnis sind.

Forschungsdatenmanagement
Forschungsdatenmanagement ist der systematische Umgang mit Forschungsdaten mit Hinblick auf deren Erhalt, Publikation, Nachnutz- und Nachvollziehbarkeit.

Forschungsdatenzentrum (FDZ)
Ein Forschungsdatenzentrum ist eine auf die Erfassung, Erhaltung, Betreuung und Bereitstellung von Forschungsdaten spezialisierte Form eines →Datenarchivs.

I

Informierte Einwilligung
Um →personenbezogene Daten in irgendeiner Form verwenden und verarbeiten zu dürfen, muss vor der Erhebung die informierte Einwilligung der beteiligten Personen eingeholt werden. Das heißt, dass diese Personen über alle Zwecke der geplanten Datenverwendung verständlich aufgeklärt werden, sie freiwillig zustimmen und sie diese Einwilligung widerrufen dürfen.

Interoperabilität
Als Interoperabilität bezeichnet man im Kontext Forschungsdaten die Fähigkeit unterschiedlicher technischer Systeme kompatibel zusammenarbeiten zu können, also Austausch und Verknüpfung von Informationen, Daten und →Metadaten über geeignete Schnittstellen zu ermöglichen. Dies gelingt u.a. durch die Verwendung geeigneter →Metadatenstandards.

K

Kontrolliertes Vokabular
Kontrolliertes Vokabular umfasst fest definierte Terme und Bezeichnungen zur eindeutigen Bestimmung von Inhalten und Sachverhalten. Es findet bei der Beschreibung von Ressourcen Anwendung und dient dazu, Inhalte unter konsistenter Definition und Ansetzung einheitlich zu dokumentieren und dadurch einfacher durchsuch- und auffindbar zu machen.

Kuratierung von Daten
Als Kuratieren von Daten (Data Curation) bezeichnet man alle aktiven Managementprozesse zur sorgsamen, langfristig ausgerichteten Pflege von Forschungsdaten während des →Datenlebenszyklus. Im Fokus stehen dabei deren Wiederverwendung und Erhalt. Ziel ist es, über geregelte Verfahren und Aktivitäten einen Mehrwert für die Daten zu generieren, und zwar in Bezug auf Auffindbarkeit und Zugang zum Zwecke qualitativ hochwertiger Nachnutzbarkeit.

L

Langzeitarchivierung
Die Langzeitarchivierung von Forschungsdaten ist ein Verfahren, das Daten und Informationen langfristig verfügbar und interpretierbar hält. Um dies zu gewährleisten, werden über Prüf- und Arbeitsprozesse →Datenintegrität und Lesbarkeit aufrechterhalten. Dies impliziert Technologiewechsel auf Grund der begrenzten Funktionsdauer von Speichermedien oder Sicherheitsanforderungen, die →Datenmigration in funktionsfähige Dateiformate und bei Bedarf das Vorhalten der notwendigen Software.

M

Metadaten
Metadaten sind strukturierte Daten, die Informationen über Daten enthalten. Sie werden automatisch oder intellektuell erfasst und liegen in unterschiedlichen Kategorien und Formaten vor. Metadaten können inhaltlicher, formaler, technischer, administrativer, rechtlicher, identifizierender oder auch relationaler Natur sein. Ihr primärer Zweck ist es, vor dem Zugriff auf die Daten relevante Beschreibungselemente zur Verfügung zu stellen. Somit lassen sich Daten nicht nur beschreiben, sondern auch finden. Um die letzteres zu erleichtern und die Sichtbarkeit der Metadaten und damit der Daten zu erhöhen, werden Metadaten oft in standardisierter Form im Sinne der →Interoperabilität erfasst und bereitgestellt.

Metadatenstandards
Metadatenstandards sind standardisierte Schemata von →Metadaten und liegen auf Grund der Vielfalt an Metadaten in vielen verschiedenen Varianten und Anwendungsprofilen vor. Die Standardisierung von Metadaten begünstigt zum einen eindeutige Beschreibungen von Daten unter Hinzunahme →kontrollierter Vokabularien und definierter Regeln, bietet also gesicherte Verfahren und Konsistenz. Zum andern liefern Metadatenstandards aber auch einen weiteren großen Mehrwert: Bei Gegenüberstellung und Zuordnung zweier Metadatenstandards können unterschiedliche Metadatenelemente automatisiert ausgelesen und einander automatisiert zugeführt werden (Mapping). Dies ermöglicht erst gewinnbringenden Austausch von Informationen in unterschiedliche technische Systeme, zum Nutzen der Verbreitung und Auffindbarkeit, also damit auch der Sichtbarkeit der eigenen Metadaten und Daten.

N

Nutzungslizenzen
Nutzungslizenzen bieten dem Rechteinhaber von Ressourcen wie Forschungsdaten, aber auch dem Nutzer Rechtssicherheit. Durch sie kann der Rechteinhaber Nutzungsrechte einräumen und somit die Verwendung der Ressourcen durch die Vergabe fester Nutzungsbedingungen steuern. Dies erzeugt gerade bei Forschungsdaten oftmals Transparenz und fördert deren Nachnutzung.

O

ORCID
Die Open Researcher and Contributor ID (ORCID) ist eine weltweite Personenkennung für Forschende. Sie ermöglicht die eindeutige Identifikation von Forschenden und birgt den Vorteil, dass sich wissenschaftliche Aktivitäten und Output wie Projekte, Publikationen oder Forschungsdaten mit der ORCID-Kennung verknüpfen, anreichern und elektronisch zuordnen lassen. Dadurch wird einerseits dauerhafte Zitierfähigkeit gewährleistet, andererseits auch die Sichtbarkeit der Forschenden und ihrer wissenschaftlichen Arbeit erhöht.

P

Persistent Identifier
Ein Persistent Identifier garantiert die dauerhafte, eindeutige Identifizierbarkeit einer digitalen Ressource. Die Ressource wird reglementiert über bestimmte Anbieter und Systeme registriert und im Zuge dessen ein fester Wert als ID vergeben. Diese ID bleibt konstant bestehen. Sie verweist standortunabhängig auf die Ressource, die damit langfristig eindeutig auffindbar und zitierfähig ist. Ein weit gebräuchlicher Persistent Identifier für Forschungsdaten ist der →Digital Object Identifier (DOI). 

Personenbezogene Daten
Personenbezogene Daten umfassen alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen und die Zuordnung über irgendeine Kennung erlauben. Solche Daten sollen sparsam unter dem Grundsatz der notwendigen Erforderlichkeit und nur mit →informierter Einwilligung der betroffenen Personen erhoben werden. Sie bedürfen im Sinne des →Datenschutzes geeigneter technischer und organisatorischer Maßnahmen.

Primärdaten
Als Primärdaten bezeichnet man Forschungsdaten, die unmittelbar von den Forschenden in Bezug auf den Gegenstand der Untersuchung neu erhoben und erzeugt werden und in der Folge als Grundlage für den eigenen wissenschaftlichen Forschungsprozess (Primärforschung) dienen.

Pseudonymisierung
Pseudonymisierung bedeutet in Abgrenzung zur →Anonymisierung, dass personenbezogene und –beziehbare Identifikationsmerkmale durch Codes ersetzt, zusammengeführt oder paraphrasiert werden. Über Listen dieser Codes und Pseudonymisierungsverfahren ist oftmals eine Zuordnung in einem gewissen Rahmen, z.B. für Analysezwecke, noch möglich.

R

Repositorium
Unter einem (digitalen) Repositorium versteht man eine Sonderform eines Archivs, das in Form eines Dokumentenservers einen Speicherort für digitale Objekte und damit Forschungsdaten bietet. Der Fokus liegt nicht auf der bloßen →Archivierung, sondern auf der Onlinebereitstellung zu bestimmten Bedingungen und standardisierten →Metadaten, sei es öffentlich über Open Access oder für einen eingeschränkten Nutzerkreis.

S

Sekundäranalyse
Bei der Sekundäranalyse oder Sekundärnutzung von Forschungsdaten werden bereits existierende Daten für eine weitere Analyse, sei es für die Reproduktion und Validierung der Forschungsergebnisse, sei es für die Untersuchung anderer oder ähnlicher Fragestellungen, erneut verwendet.

Sicherung der Daten
Die Datensicherung, auch Backup genannt, umfasst angemessene Sicherungs- und Speicherungsverfahren von Dateien in Form von mindestens einer Sicherheitskopie zum Zwecke der Wiederherstellung dieser Daten bei Verlust oder Beschädigung durch technische oder menschliche Fehler. Wesentliche Merkmale angemessener Backupstrategien sind die Sicherung der Daten an verschiedenen räumlichen Orten zum Schutz vor physischem Schaden, eine festgelegte Regelmäßigkeit sowie die automatische Erstellung der Kopie.

U

Urheberrecht
Für Deutschland findet das deutsche Urheberrechtsgesetz Anwendung. Es räumt Schöpfern von Werken der Literatur, Wissenschaft und Kunst gesetzlichen Schutz und Recht am geistigen Eigentum ein. Dieser Schutz gilt ab einer bestimmten geistigen Schöpfungshöhe, speziell dann, wenn Daten erzeugt wurden unter wahrnehmbarer Formgestaltung, persönlichem Schaffen, geistigem Gehalt und eigenpersönlicher Prägung. Erlaubt sind z.B. die →Zitation für besondere, z.B. wissenschaftliche Zwecke und Vervielfältigung für den privaten Gebrauch oder sonstige ausschließlich eigene Nutzung. Um Nachnutzbarkeit von Forschungsdaten zu fördern und regulieren, empfiehlt sich die Vergabe von →Nutzungslizenzen.

Z

Zitation
Die korrekte Zitation von Forschungsdaten ist notwendig im Sinne guter wissenschaftlicher Praxis. Die Zitation sorgt für Sichtbarkeit und damit Anerkennung der Forschungsleistung und –ergebnisse, sollte nach festen Regeln und konsistent erfolgen. Einen etablierten Zitationsstandard für Forschungsdaten gibt es in diesem Sinne (noch) nicht flächendeckend, sondern nur Empfehlungen. Generell sollten in einer Datenzitation die üblichen bibliographischen Angaben Verwendung finden, also Angaben zum Urheber, Titel, Publikationsdatum. Bei Daten sind zusätzlich Datentyp sowie der Standort relevant. Bei Vorhandensein eines → Persistent Identifiers sollte dieser in die Zitationsweise aufgenommen werden, um die dauerhafte Identifizierbarkeit der Daten und Nachvollziehbarkeit der Arbeit mit diesen Daten zu gewährleisten.

Links zu externen Angeboten und Inhalten

  • Allgemeine Informationsangebote
  • Repositorien und Datenservices
  • Nationale Infrastrukturen
  • Publikationsorgan FDM

Links zu externen Angeboten und Inhalten

Allgemeine Informationsangebote

» Portal Forschungsdaten.info
» Wiki Forschungsdaten.org
» Englischsprachiges Angebot des Digital Curation Centres

Repositorien und Datenservices

Eine Übersicht über Repositorien und Datenarchive samt Beschreibung finden Sie beim Service re3data.

Übergreifende Repositorien und Datenarchive

» ZENODO
» Research Data Repository (RADAR)

Spezifische Repositorien und Angebote

Geistes- und Kulturwissenschaften
» Verbund DARIAH
» Forschungsinfrastruktur CLARIN-D
» Repository und Laboratory Textgrid

Sozial- und Wirtschaftswissenschaften
» Consortium of European Social Sciences Data Archives (CESSDA)
» Inter-university Consortium for Political and Social Research (ICPSR)
» Datenservice Datorium
» Verbund Forschungsdaten Bildung
» UK Data Service

Geo- und Umweltwissenschaften
» Datenpublikationsservice Pangaea

Psychologie
» PsychData

Publikationsorgan FDM

» Bausteine Forschungsdatenmanagement, Zeitschrift rund um Forschungsdatenmanagement

 

  • Services und Einrichtungen an der Leuphana

Services und Einrichtungen an der Leuphana

 

Alle Fragen rund um Forschungsdatenmanagement und Beratung:
Medien- und Informationszentrum, Team Forschungsdatenmanagement
Kontakt: forschungsdaten@leuphana.de.

 

Nach Themen:

Antragsstellung:
Team des Forschungsservice, Kontakt: Stefan Friedrich.

Datenmanagementplan:
Medien- und Informationszentrum, Kontakt: Thomas Schwager.

Datenschutz:
Thies Ove Zengel, offizieller Datenschutzbeauftrager der Leuphana, Kontakt: datenschutz@leuphana.de.

Ethische und rechtliche Aspekte:
Ethikbeirat, Kontakt: ethikbeirat@leuphana.de.

Datensicherung, Speicherung und Technik:
Medien- und Informationszentrum, Kontakt: Thomas Schwager.

IT-Infrastruktur, Hardware- und Softwarebeschaffung:
Medien- und Informationszentrum, Kontakt: Martin Noeres, für Netzlaufwerke Heiko Reincke.

Dokumentation, Metadaten und Publikation:
Medien- und Informationszentrum, Kontakt: Thomas Schwager.

Schulungen und Informationsangeboten:
Medien- und Informationszentrum, Kontakt: Thomas Schwager.

MIZ

Thomas Schwager
Universitätsallee 1, CB.132
21335 Lüneburg
Fon +49.4131.677-1175
thomas.schwager@leuphana.de

Martin Bilz
Universitätsallee 1, CB.105
21335 Lüneburg
Fon +49.4131.677-1113
martin.bilz@leuphana.de

Forschungsservice

Dipl.-Oec. Anke Zerm
Universitätsallee 1, C10.204
21335 Lüneburg
Fon +49.4131.677-1692
anke.zerm@leuphana.de

Dr. Stefan Friedrich
Universitätsallee 1, C10.203
21335 Lüneburg
Fon +49.4131.677-1447
stefan.friedrich@leuphana.de