Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/13463
Title: Nachhaltige Infrastruktur zur Forschungsdatenpublikation am Beispiel von Hochdurchsatz-Pflanzenphänotypisierungsdaten
Author(s): Arend, Daniel
Referee(s): Saake, Gunter
Granting Institution: Otto-von-Guericke-Universität Magdeburg, Fakultät für Informatik
Issue Date: 2019
Type: Doctoral Thesis
Exam Date: 2018
Language: German
Publisher: Otto von Guericke University Library, Magdeburg, Germany
URN: urn:nbn:de:gbv:ma9:1-1981185920-135491
Subjects: Wissenschaftspraxis
Datenbanken
Abstract: Der schnelle technische Fortschritt hat unter anderem in den Lebenswissenschaften zu einem sehr großen Anstieg an verfügbaren Forschungsdaten geführt. Die Herausforderungen des „big data“-Zeitalters sind allgegenwärtig. Neben den neuen, vielfältigen Möglichkeiten, die diese Flut an Daten bietet, stellt sie auch neue Anforderungen an vorhandene Infrastrukturen und etablierte Verfahren zum Datenmanagement und zur Datenpublikation. In einigen Forschungsdomänen, z. B. im Bereich der Genomanalyse gibt es bereits seit vielen Jahren allgemein akzeptierte Datenbanken zum Austausch von Forschungsdaten. Diese müssen jedoch mit immer größer werdenden Datenbeständen zurechtkommen und gleichzeitig eine effektive Nachnutzung der Daten gewährleisten. Andere, vor allem noch junge Forschungsbereiche, z. B. Pflanzenphänotypisierung, sind darüber hinaus mit der Herausforderung konfrontiert, dass es in ihrem Feld kaum etablierte Infrastrukturen zum Datenmanagement gibt und das die starke Heterogenität der produzierten Forschungsdaten die Entwicklung neuer Informationssysteme erschwert. Aber nicht nur der Austausch von Forschungsdaten, auch die effektive und nachhaltige Speicherung und Publikation stellt eine neue Aufgabe dar. Forschungsdaten wurden bisher in reduzierter Form häufig als Supplement einer zugehörigen wissenschaftlichen Publikation veröffentlicht. Obwohl diese Daten meist nur im Bereich von wenigen Megabyte lagen, war die dauerhafte Bereitstellung auch nach Veröffentlichung aufgrund fehlender institutioneller Infrastrukturen bereits eine große Herausforderung. Heutzutage umfassen viele Forschungsdaten jedoch bereits mehrere Gigabyte bis Terabyte, sodass viele Institutionen mit dieser Aufgabe mittlerweile überfordert sind. In dieser Arbeit wird eine nachhaltige und generische Infrastruktur zum Forschungsdatenmanagement sowie das darin enthaltene Konzept zur Begutachtung und Publikation von Forschungsdaten vorgestellt. Um eine effektive Infrastruktur zu entwickeln, wurden die Anforderungen in der Verarbeitung und Publikation ebenso wie verbreitete Ansätze und Systeme zur Veröffentlichung von Forschungsdaten untersucht. Durch die Verwendung moderner Konzepte der Informatik sowie aktueller Technologien und Softwareframeworks wurde eine dynamische und skalierbare Implementierung realisiert, welche die Schwachstellen existierender Systeme überwindet. Diese folgt dem „Bringing the infrastructure to the data“-Ansatz und ermöglicht die einfache und flexible Einrichtung einer institutionellen Infrastruktur, welche die vorhandene Speicherkapazität zur effektiven Verwaltung und Veröffentlichung von Forschungsdaten nutzen kann. Eine erste produktive Instanz der Infrastruktur wurde zur Publikation von pflanzenphänotypischen Hochdurchsatzdaten am Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung (IPK) in Gatersleben erfolgreich etabliert. Sie enthält bereits über 150 verschiedene Forschungsdatensätze und verarbeitet mehrere 1000 Zugriffe pro Monat. Als ein Service im Portofolie der de.NBIInfrastruktur ist ihre langfristige Bereitstellung gewährleistet. Darüber hinaus konnte Mitte 2018 im Rahmen des DPPN-Projektes eine weitere Instanz auf Basis der entwickelten Infrastruktur am Forschungszentrum Jülich etabliert werden. i
URI: https://opendata.uni-halle.de//handle/1981185920/13549
http://dx.doi.org/10.25673/13463
Open Access: Open access publication
License: (CC BY-NC 4.0) Creative Commons Attribution NonCommercial 4.0
Appears in Collections:Fakultät für Informatik

Files in This Item:
File Description SizeFormat 
Arend_Daniel_Dissertation_2018.pdfDissertation13.09 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons