Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.25673/13463
Titel: Nachhaltige Infrastruktur zur Forschungsdatenpublikation am Beispiel von Hochdurchsatz-Pflanzenphänotypisierungsdaten
Autor(en): Arend, Daniel
Gutachter: Saake, Gunter
Körperschaft: Otto-von-Guericke-Universität Magdeburg, Fakultät für Informatik
Erscheinungsdatum: 2019
Art: Dissertation
Tag der Verteidigung: 2018
Sprache: Deutsch
Herausgeber: Otto von Guericke University Library, Magdeburg, Germany
URN: urn:nbn:de:gbv:ma9:1-1981185920-135491
Schlagwörter: Wissenschaftspraxis
Datenbanken
Zusammenfassung: Der schnelle technische Fortschritt hat unter anderem in den Lebenswissenschaften zu einem sehr großen Anstieg an verfügbaren Forschungsdaten geführt. Die Herausforderungen des „big data“-Zeitalters sind allgegenwärtig. Neben den neuen, vielfältigen Möglichkeiten, die diese Flut an Daten bietet, stellt sie auch neue Anforderungen an vorhandene Infrastrukturen und etablierte Verfahren zum Datenmanagement und zur Datenpublikation. In einigen Forschungsdomänen, z. B. im Bereich der Genomanalyse gibt es bereits seit vielen Jahren allgemein akzeptierte Datenbanken zum Austausch von Forschungsdaten. Diese müssen jedoch mit immer größer werdenden Datenbeständen zurechtkommen und gleichzeitig eine effektive Nachnutzung der Daten gewährleisten. Andere, vor allem noch junge Forschungsbereiche, z. B. Pflanzenphänotypisierung, sind darüber hinaus mit der Herausforderung konfrontiert, dass es in ihrem Feld kaum etablierte Infrastrukturen zum Datenmanagement gibt und das die starke Heterogenität der produzierten Forschungsdaten die Entwicklung neuer Informationssysteme erschwert. Aber nicht nur der Austausch von Forschungsdaten, auch die effektive und nachhaltige Speicherung und Publikation stellt eine neue Aufgabe dar. Forschungsdaten wurden bisher in reduzierter Form häufig als Supplement einer zugehörigen wissenschaftlichen Publikation veröffentlicht. Obwohl diese Daten meist nur im Bereich von wenigen Megabyte lagen, war die dauerhafte Bereitstellung auch nach Veröffentlichung aufgrund fehlender institutioneller Infrastrukturen bereits eine große Herausforderung. Heutzutage umfassen viele Forschungsdaten jedoch bereits mehrere Gigabyte bis Terabyte, sodass viele Institutionen mit dieser Aufgabe mittlerweile überfordert sind. In dieser Arbeit wird eine nachhaltige und generische Infrastruktur zum Forschungsdatenmanagement sowie das darin enthaltene Konzept zur Begutachtung und Publikation von Forschungsdaten vorgestellt. Um eine effektive Infrastruktur zu entwickeln, wurden die Anforderungen in der Verarbeitung und Publikation ebenso wie verbreitete Ansätze und Systeme zur Veröffentlichung von Forschungsdaten untersucht. Durch die Verwendung moderner Konzepte der Informatik sowie aktueller Technologien und Softwareframeworks wurde eine dynamische und skalierbare Implementierung realisiert, welche die Schwachstellen existierender Systeme überwindet. Diese folgt dem „Bringing the infrastructure to the data“-Ansatz und ermöglicht die einfache und flexible Einrichtung einer institutionellen Infrastruktur, welche die vorhandene Speicherkapazität zur effektiven Verwaltung und Veröffentlichung von Forschungsdaten nutzen kann. Eine erste produktive Instanz der Infrastruktur wurde zur Publikation von pflanzenphänotypischen Hochdurchsatzdaten am Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung (IPK) in Gatersleben erfolgreich etabliert. Sie enthält bereits über 150 verschiedene Forschungsdatensätze und verarbeitet mehrere 1000 Zugriffe pro Monat. Als ein Service im Portofolie der de.NBIInfrastruktur ist ihre langfristige Bereitstellung gewährleistet. Darüber hinaus konnte Mitte 2018 im Rahmen des DPPN-Projektes eine weitere Instanz auf Basis der entwickelten Infrastruktur am Forschungszentrum Jülich etabliert werden. i
URI: https://opendata.uni-halle.de//handle/1981185920/13549
http://dx.doi.org/10.25673/13463
Open-Access: Open-Access-Publikation
Nutzungslizenz: (CC BY-NC 4.0) Creative Commons Namensnennung - Nicht kommerziell 4.0 International(CC BY-NC 4.0) Creative Commons Namensnennung - Nicht kommerziell 4.0 International
Enthalten in den Sammlungen:Fakultät für Informatik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
Arend_Daniel_Dissertation_2018.pdfDissertation13.09 MBAdobe PDFMiniaturbild
Öffnen/Anzeigen