Please use this identifier to cite or link to this item:
http://dx.doi.org/10.25673/34165
Title: | Analytic cloud platform for near real-time mass spectrometry processing on the fast data architecture |
Author(s): | Zoun, Roman |
Referee(s): | Saake, Gunter Benndorf, Dirk |
Granting Institution: | Otto-von-Guericke-Universität Magdeburg, Fakultät für Informatik |
Issue Date: | 2020 |
Extent: | xiii, 132 Seiten |
Type: | Hochschulschrift |
Type: | PhDThesis |
Exam Date: | 2020 |
Language: | English |
URN: | urn:nbn:de:gbv:ma9:1-1981185920-343601 |
Subjects: | Prozeßrechner |
Abstract: | Ein Massenspektrometer ist ein Gerät zum Messen von Biomarkern in biologischen
Gemeinschaften. Diese Biomarker können genutzt werden, um Biogasanlagen zu optimieren
und Energieeffizienter zu machen oder auch Krankheiten zu diagnostizieren.
Die aktuellen Analysearbeitsabläufe eines Massenspektrometers sind sequenziell und
beinhaltet Stunden von Wartezeiten zwischen den einzelnen Arbeitsschritten. Diese
Situation ist nicht akzeptabel, besonders wenn es um klinische Diagnostik geht.
Zusätzlich ist die softwaregestützte Datenanalyse sehr komplex und braucht eine
stabile Hardwareinfrastruktur, welche mit hohen Kosten und Aufwand einhergeht.
In unserer Arbeit präsentieren wir einen konzeptionellen Beweis einer analytischen
Plattform für Echtzeitanalyse von Massenspektrometer-Experimenten. Wir implementierten
MStream, eine Cloudbasierte Plattform, welche auf der Fast-Data-
Architektur aufsetzt und eine skalierbare, streambasierte Protein Identifikation ermöglicht.
Wir diskutieren und lösen alle Herausforderungen, die für die Adaption
einzelner Schritte einer streambasierter Lösung auf einer Cloudarchitektur benötigt
waren. Die erste Herausforderung war die Konzepterstellung, die zweite Herausforderung
war das streamen der Daten während der Messung direkt von dem Massenspektrometer.
Die dritte Herausforderung war die Strukturierung der Daten für
einen schnellen Durchsatz und die letzte Herausforderung war die streambasierte
Validierung der Ergebnisse. Das Resultat ist MStream, eine prototypische Umsetzung
einer Cloudplattform zur Echtzeitverarbeitung von Massenspektrometerdaten.
Am Ende der Arbeit wird die Plattform evaluiert und die Ergebnisse zeigen eine
bessere Performance im Vergleich zu aktuellen Software-Alternativen. A mass spectrometer is a device which can measure biomarkers of biological environments such as sea, biogas plant, human gut or a just a blood. Using these biomarkers, it is possible to optimize biogas plants in order to maximize the energy production or to diagnose diseases of thousands of patients with only one mass spectrometer. Unfortunately, the mass spectrometry data analysis pipeline is sequentially including hours of waiting time between the workflow steps. This situation is not applicable especially for use cases such as clinical diagnostics. Additionally, the data analysis is complex and needs a stable infrastructure, which involves very high costs and effort. In our work, we present a proof of concept of an analytic platform for real-time analysis of mass spectrometry experiments. We implemented MStream, a cloud-based platform on the fast data architecture for scalable streamlined protein identification. We discuss and solve all challenges in the thesis for adapting the components to a streaming cloud-based pipeline. First challenge is the concept of cloud-based architecture for streaming mass spectrometer data analysis pipeline. Next challenge is the possibility to stream from a device during the measurement. The third challenge is to structure and transform the data in the database systems and the last challenge is the streaming validation of the results. Finally, we implement MStream, a prototype of real-time cloud platform for analyzing mass spectrometry data during the measurement. Furthermore, our evaluation results show the performance gain for the analysis process in comparison to the state-of-the-art software. |
URI: | https://opendata.uni-halle.de//handle/1981185920/34360 http://dx.doi.org/10.25673/34165 |
Open Access: | Open access publication |
License: | (CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0 |
Appears in Collections: | Fakultät für Informatik |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Zoun_Roman_Dissertation_2020.pdf | Dissertation | 8.75 MB | Adobe PDF | View/Open |