FAKIN auf FDM Netzwerkveranstaltung des BMBF

Am 1.6.2017 fand die Auftaktveranstaltung des BMBF zur Vernetzung und Identifikation von Synergiepotenzialen im Harnack Haus der Max Planck Gesellschaft in Berlin statt auf der wir (Hauke Sonnenberg & Michael Rustler) das Projekt FAKIN in zwei verschiedenen Sessions (Kompetenzen & Disziplin-spezifische Besonderheiten im FDM) mit Redebeitragen vorgestellt haben.

FDM = Forschungsdatenmanagement

Hinweise an das KWB in persönlichen Gesprächen

  • Malte Dreyer, HU Berlin: Wir sollten Datenzentren (= Repositorien) nutzen. Ausgangspunkt dafür kann re3data sein, eine Art Suchmaschine für solche Datenzentren.
  • Hans-Dieter Weckmann, Uni Düsseldorf: Wir sollten uns Kooperationspartner (z.B. Uni mit Rechenzentrum?) suchen
  • Kerstin Helbig, HU Berlin: Software zum Ablegen von Daten mit Metadaten: resourceSpace. Am 15. und 16. Juni findet ein Community Meeting statt, siehe bei attending.io

Es folgen stichpunktartige Zusammenfassungen aus den einzelnen Sessions, in denen sich die einzelnen Projekte unter Bezugnahme auf verschiedene Aspekte vorstellen und austauschen konnten.

Begrüßung durch Vertreter des BMBF

Session 1: Kompetenzen

Session 2: Kooperationen

Projekt UNEKE, Ania Lopez, Uni Duisburg

  • Partner: Uni Essen, RWTH Aachen
  • Ziel: Kriterienkatalog: Nach welchen Kriterien wird entschieden, welche Systeme genutzt werden?
  • Statement Bela Brenger, RWTH Aachen: praxisnahe Handlungsanweisungen

Projekt FoDaKo, Hans-Dieter Weckmann, Uni Düsseldorf

  • Partner: drei Universitäten: Düsseldorf, Siegen, Wuppertal
  • Digitale Langzeitarchivierung und FDM
  • Rechenzentren und Bibliotheken
  • bereits geschehen: Evaluation von Software, Anforderungskatalog
  • bereits vorhanden:
    • dreistufige IT-Infrastruktur, u.a. Sharepoint, Open Source, insgesamt 2 PByte (1 PByte = 1000 GByte) Speicher, verteilt auf drei Zentren
    • Richtlinien
  • wichtig: verbindliches commitment
  • Projektziel:
    • Aufbau von Kompetenzzentren, die die vorhandenen Strukturen den Wissenschaftlern “andienen”
    • Schulungen
  • Statement Sabine Roller (Uni Siegen): Schulungsunterlagen

Projekt SynFo, Thilo Paul-Stüve, Uni Kiel

  • Uni Kiel: datengetriebene Forschung, u.a. Sonderforschungsbereiche SFB 1182 (Entstehen und Funktionieren von Metaorganismen), SFB 754 (Klima - Biogeochemische Wechselwirkungen im Tropischen Ozean)
  • Exzellenzcluster
  • Datenflüsse schwierig
  • Ziel: Workflows beleuchten
    • organisatorisch
    • technisch, z.B. Metadatenformate
    • rechtlich, z.B. Urheberschaft, Lizenzen
  • Produkte
    • Vorgehensweisen, workflows (generisch)
    • Data Policy Kit (Baukastensystem)
    • Musterverträge, Richtlinienblaupausen

Projekt FDMentor, Malte Dreyer, HU Berlin

  • Partner: HUB, FUB, TUB, Uni Potsdam (UP)
  • Good Practice im FDM
  • Idee Mentor: es sind unterschiedliche Niveaus vorhanden
  • Elemente
    • Strategieentwicklung (UP)
    • FD Policies (TUB)
    • Schulungen, Trainings (FUB, HUB): schlechte Skalierung wegen Fluktuationen
    • Verbund (HUB): Vernetzung, Koordination
  • Ziel: Handlungsempfehlungen, Policies
  • Austausch mit Repositories
  • re3data: Wie finde ich das passende Repository?
  • Herausforderung: Adressierung und Ansprache von Wissenschaftlern
  • Forschungsdaten-Policies

Diskussion

  • Es scheint regionale Beschränkungen zu geben. Sind Landesgrenzen bindend? Finanziell schon.
  • Kiel: dezentrales FDM
  • HS bemerkt, dass es für ein kleines Institut schwierig ist, ein FDM zu installieren, wenn dies in den Projekten nicht explizit eingeplant ist. Antwort: Entscheidend dafür ist, was förderfähig ist. Empfehlung an das KWB: Wir sollten uns Kooperationspartner (z.B. Uni mit Rechenzentrum?) suchen

Session 3: Disziplinen-spezifische Besonderheiten im FDM

Projekt FDM_OAS-Orient, Martin Lee, FU Berlin

  • Fachbereichsbibliothek, Asiatische Sprachen
  • Information Retrieval
  • “Was Google nicht findet, existiert nicht” - NEIN

Projekt InPT-Dat, Steffen Franke, INP Greifswald

Projekt geo_data_node_gfz, Roland Bertelmann, GFZ Potsdam

  • Spannungsfeld spezifisch <-> generisch
  • Domänen: privat, Gruppe, dauerhaft, Nachnutzung
  • Metadaten: essentiell für Wiederverwendung (Reuse) und Findbarkeit
  • Strukturelle Metadaten, z.B. DOI
  • Datenpublikation mit DOI
  • Standardisierte XML-Dateien
  • Konsensbildung in Communities

Projekt GRAcE, Jan Brase, Uni Göttingen

  • eResearch-Infrastruktur am Campus Göttingen
  • Etablierung von Disziplin-unabhängigen services
  • Embedded Librarian: Datenmanager geht “rein ins Feld”

Projekt eeFDM, Roman Gerlach, Uni Jena

  • [Kontaktstelle FDM Uni Jena](Kontaktstelle Forschungsdatenmanagement)
  • Biodiversitätsforschung
  • Datenmanagement-Plattform
  • Heterogenität
  • Herausforderung: Datenpublikation
  • Projektansatz: FDM-Plattform im Baukastenprinzip
  • Koordination und Harmonisierung

Projekt FDMHerder, Barbara Fichtl, Herder-Institut Marburg (Statement)

Projekt FAKIN, Hauke Sonnenberg, KWB (Statement)

  • Schon Goethe hat die Bedeutung des Wassers erkannt.
  • Wir bearbeiten Fragen zum Thema Wasser in Bezug auf Quantität und Qualität
  • Wir verarbeiten Daten in unterschiedlicher Quantität und Qualität
  • Daten sind heterogen in Bezug auf Struktur, Formate, Metadatenbedarf
  • Unsere Methoden: Datenbanken, Programmierung, Automatisierung
  • Unsere Tools: zum Teil Eigenentwicklungen, maßgeschneiderte Lösungen
  • Unsere Ziele:
    • weiterhin Qualität unserer Ergebnisse
    • Standardisierung, Vereinheitlichung eigener Methoden
    • etablierte Lösungen statt Eigenentwicklungen
  • Was können wir von Ihnen lernen?

Projekt FoDaKo, Hans-Dieter Weckmann, Uni Düsseldorf (Statement)

  • Rechenzentrumsleiter
  • Aufbau von Kompetenzzentren
  • Unterschiedliche Policies, je nach Disziplin
  • nicht nur Metadaten sind Disziplinen-spezifisch

Diskussion

  • elektronische Laborbücher, wer kennt gute?
  • Plädoyer: Mit dem arbeiten, was da ist!
  • Dataverse als Repositorium
  • Sharepoint als Möglichkeit, Prozesse abzubilden
  • Labfolder als Standardlaborbuch
  • Projekt GRAcE: gerätespezifische Metadaten (proprietäre Formate). Bei gemeinsamer Anschaffung von Großgeräten sollten Datenformate eine Rolle spielen. Das ist ein neuer Gedanke!
  • Wie begutachtet man FDM?
    • Forderung eines Forschungsdatenprodukts, z.B. Aufbau eines Repositoriums
    • “Ich habe mich mit FD-Managern unterhalten…”
    • Alt-Metriken nutzen: wie oft wird Datensatz referenziert, heruntergeladen?
    • Gutes FDM zeichnet sich durch Wiederfindbarkeit und Wiedernutzung aus.
    • Publizieren mit DOI, das ist quasi Standard.

Session 4: Governance

Session 5: Rechtliche Rahmenbedingungen

Session 6: Entscheidungskriterien für nachhaltige FDM-Systeme und Maßnahmen

Projekt UNEKE, Ania Lopez, Uni Duisburg

  • bester Fall: Fachdatenrepositorien
  • Hochschulen brauchen objektive Entscheidungskriterien für IT Infrastrukturen
  • NFDI (Nationale Forschungsdateninfrastruktur)
  • Diskussion: Was wird wohl ein Kriterium sein?
    • Welche Fachdisziplinen?
    • Rechtliche Belange
  • Statement Bela Brenger, RWTH Aachen: Kriterienkatalog auf Hochschulebene

Projekt GRAcE, Ramin Yahyapour, GWD Göttingen (Statement)

  • GWD: Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen
  • Motivation: möglichst wenig neu machen, viel nachnutzen
  • Wichtig: Aufwand/Ressourcen abschätzen!
  • FDM nicht für sich alleine, z.B. immer Mitbetrachtung existierender Geräte
  • Wem gelingt es, den Wissenschaftler “abzuholen”?
  • Wie passt sich alles in die bestehende Infrastruktur ein? [-> Gedanke HS: RSS-Feed in Outlook am KWB entspricht diesem Ansatz]
  • Wissenschaftler wollen eine Art von Skripting, Automation des Vorgangs, wie Daten in eine Lösung reinkommen, die man schon besitzt.
  • verschiedene Zugangswege bieten, z.B. über Webfrontend
  • [HS: Es wird die Abkürzung FDE verwendet, was heißt das?]

Projekt eeFDM, Roman Gerlach, Uni Jena (Statement)

Diskussion

  • Rechteverwaltung nutzen
  • Uni-Archivar entscheidet, was weg kann
  • Wird es in Zukunft Eigentum an Daten geben? Bisher gibt es das nicht.

Zusammenfassung

Avatar
Michael Rustler
Project Manager FAKIN, Data scientist

My research interests include reproducible research, data management and programming (R & Python).

Related