Alle Disziplinen arbeiten heutzutage mit digitalen Forschungsdaten. Dass diese Datenschätze auch nach Projektende für die Wissenschaft stets sicher verfügbar bleiben, darum kümmern sich unter anderem Christian Bittner und Ben Stöver aus dem neunköpfigen, interdisziplinär zusammengesetzten Team der Servicestelle Forschungsdaten. „Wissenschaft ist am glaubwürdigsten, wenn sie transparent ist“, stellt Bittner fest. Deshalb hätten Forschende ein hohes Eigeninteresse daran, ihre Daten zugänglich zu machen. Die Servicestelle wird von der Universitäts- und Landebibliothek und dem Hochschulrechenzentrum gemeinsam betrieben und unterstützt die Forschenden der Universität Bonn beim Forschungsdatenmanagement (FDM).
Zentral sind die vier FAIR-Prinzipien: Daten sollten gut auffindbar (Findable) sein und möglichst ohne komplizierte Schranken zugänglich (Accessible). Die Daten sollten am Besten in quelloffenen oder weit verbreiteten Datenformaten gespeichert sein (Interoperable). Und zuletzt gilt das Prinzip der Nachnutzbarkeit (Reusable). Das heißt: Elementar sind freizügige Lizenzbedingungen und eine vernünftige Dokumentation darüber, wie die Daten zustande kamen.
Nicht alle Disziplinen haben gleichermaßen Erfahrung mit Daten
„Forschende managen seit jeher irgendwie Daten“, so Stöver, „wir unterstützen sie professionell und von Beginn an, auch bei verändernden Rahmenbedingungen.“ Denn generell steigen die Anforderungen. Neben den Leitlinien zur guten wissenschaftlichen Praxis haben viele Geldgeber oft hohe Transparenz-Auflagen und Open Access-Bestimmungen. Um ein gutes Datenmanagement komme man da kaum noch herum. Das bedeute zwar anfangs mehr Aufwand: So müsse man sich im Vorfeld Gedanken machen, wie man die Arbeit an den Daten bestmöglich strukturiert. Langfristig komme dies aber dem Projekt und den Teilnehmenden zugute.
Noch sei das Thema nicht durchweg in der akademischen Ausbildung verankert. Viele Wissenschaftler:innen fühlen sich daher oftmals überfordert. „Viele scheinbar komplexe Vorgaben kann man relativ einfach auflösen“, beruhigt Bittner. Genauso ließen sich Befürchtungen meist schnell abbauen, etwa wenn es darum geht, sensible Daten zu schützen und zugleich zugänglich zu machen. Rund 80 Beratungen fanden im letzten Jahr statt, von Promotionen bis hin zu Langzeitprojekten, bei denen man Impulse gebe und gemeinsam überlegt, wie man das Forschungsdatenmanagement strukturell verbessert.
Datenmanagement aus Überzeugung
Beide arbeiten seit ihrem Studium mit Datenverwaltung: Stöver promovierte an der Uni Münster, forschte als Bioinformatiker und beschäftigte sich dabei mit Software rund um den Forschungsprozess. „Forschung erschien mir immer sinnvoller, wenn es eine Nachnutzungsmöglichkeit für Daten gab“, so Stöver.
Christian Bittner promovierte an der Universität Erlangen in der Geographie mit sozialwissenschaftlicher Ausrichtung. Mit Schwierigkeiten dabei kennt er sich aus: „Ich habe sehr datenintensiv gearbeitet, und bin in alle Fallen reingelaufen, die es beim Datenmanagement gab“, resümiert er. Nebenbei beteiligte er sich beim Aufbau eines Geodatenzentrums.
Tools und Datenspeicher für bessere Kooperationen
Das Angebot der Servicestelle ist breit. Neben der Beratungstätigkeit führt das Team regelmäßig Schulungen durch. Parallel dazu werden IT-Dienste entwickelt. Zentral ist hier die neue Forschungsdateninfrastruktur (FDI), die den Cloud-Speicherdienst Sciebo und den Dienst UniVM für virtuelle Maschinen ergänzt. Mit der FDI können Teams oder Einzelpersonen große Datenmengen sicher abspeichern und bearbeiten – aktuell stehen mit der FDI 2,5 Petabyte (2500 Terrabyte) replizierter Netzwerkspeicher zu Verfügung, der momentan noch erweitert wird.
Daneben gibt es einen Dienst für elektronische Laborbücher sowie das Forschungsdatenrepositorium RADAR.
Dort können Daten nach den FAIR-Prinzipien publiziert und langfristig archiviert werden. Die Daten erhalten eine DOI-Kennung, wodurch Wissenschaftler:innen sie zitierfähig in ihre Publikationsliste setzen können. Weitere Dienste sind bereits in Vorbereitung, wie z.B. ein Gitlab und ein JupyterHub zur Unterstützung code-basierter Forschungsarbeiten.