Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/34165
Title: Analytic cloud platform for near real-time mass spectrometry processing on the fast data architecture
Author(s): Zoun, Roman
Referee(s): Saake, Gunter
Benndorf, Dirk
Granting Institution: Otto-von-Guericke-Universität Magdeburg, Fakultät für Informatik
Issue Date: 2020
Extent: xiii, 132 Seiten
Type: HochschulschriftLook up in the Integrated Authority File of the German National Library
Type: PhDThesis
Exam Date: 2020
Language: English
URN: urn:nbn:de:gbv:ma9:1-1981185920-343601
Subjects: Prozeßrechner
Abstract: Ein Massenspektrometer ist ein Gerät zum Messen von Biomarkern in biologischen Gemeinschaften. Diese Biomarker können genutzt werden, um Biogasanlagen zu optimieren und Energieeffizienter zu machen oder auch Krankheiten zu diagnostizieren. Die aktuellen Analysearbeitsabläufe eines Massenspektrometers sind sequenziell und beinhaltet Stunden von Wartezeiten zwischen den einzelnen Arbeitsschritten. Diese Situation ist nicht akzeptabel, besonders wenn es um klinische Diagnostik geht. Zusätzlich ist die softwaregestützte Datenanalyse sehr komplex und braucht eine stabile Hardwareinfrastruktur, welche mit hohen Kosten und Aufwand einhergeht. In unserer Arbeit präsentieren wir einen konzeptionellen Beweis einer analytischen Plattform für Echtzeitanalyse von Massenspektrometer-Experimenten. Wir implementierten MStream, eine Cloudbasierte Plattform, welche auf der Fast-Data- Architektur aufsetzt und eine skalierbare, streambasierte Protein Identifikation ermöglicht. Wir diskutieren und lösen alle Herausforderungen, die für die Adaption einzelner Schritte einer streambasierter Lösung auf einer Cloudarchitektur benötigt waren. Die erste Herausforderung war die Konzepterstellung, die zweite Herausforderung war das streamen der Daten während der Messung direkt von dem Massenspektrometer. Die dritte Herausforderung war die Strukturierung der Daten für einen schnellen Durchsatz und die letzte Herausforderung war die streambasierte Validierung der Ergebnisse. Das Resultat ist MStream, eine prototypische Umsetzung einer Cloudplattform zur Echtzeitverarbeitung von Massenspektrometerdaten. Am Ende der Arbeit wird die Plattform evaluiert und die Ergebnisse zeigen eine bessere Performance im Vergleich zu aktuellen Software-Alternativen.
A mass spectrometer is a device which can measure biomarkers of biological environments such as sea, biogas plant, human gut or a just a blood. Using these biomarkers, it is possible to optimize biogas plants in order to maximize the energy production or to diagnose diseases of thousands of patients with only one mass spectrometer. Unfortunately, the mass spectrometry data analysis pipeline is sequentially including hours of waiting time between the workflow steps. This situation is not applicable especially for use cases such as clinical diagnostics. Additionally, the data analysis is complex and needs a stable infrastructure, which involves very high costs and effort. In our work, we present a proof of concept of an analytic platform for real-time analysis of mass spectrometry experiments. We implemented MStream, a cloud-based platform on the fast data architecture for scalable streamlined protein identification. We discuss and solve all challenges in the thesis for adapting the components to a streaming cloud-based pipeline. First challenge is the concept of cloud-based architecture for streaming mass spectrometer data analysis pipeline. Next challenge is the possibility to stream from a device during the measurement. The third challenge is to structure and transform the data in the database systems and the last challenge is the streaming validation of the results. Finally, we implement MStream, a prototype of real-time cloud platform for analyzing mass spectrometry data during the measurement. Furthermore, our evaluation results show the performance gain for the analysis process in comparison to the state-of-the-art software.
URI: https://opendata.uni-halle.de//handle/1981185920/34360
http://dx.doi.org/10.25673/34165
Open Access: Open access publication
License: (CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0(CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0
Appears in Collections:Fakultät für Informatik

Files in This Item:
File Description SizeFormat 
Zoun_Roman_Dissertation_2020.pdfDissertation8.75 MBAdobe PDFThumbnail
View/Open