Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.25673/34165
Titel: Analytic cloud platform for near real-time mass spectrometry processing on the fast data architecture
Autor(en): Zoun, Roman
Gutachter: Saake, Gunter
Benndorf, Dirk
Körperschaft: Otto-von-Guericke-Universität Magdeburg, Fakultät für Informatik
Erscheinungsdatum: 2020
Umfang: xiii, 132 Seiten
Typ: HochschulschriftIn der Gemeinsamen Normdatei der DNB nachschlagen
Art: Dissertation
Tag der Verteidigung: 2020
Sprache: Englisch
URN: urn:nbn:de:gbv:ma9:1-1981185920-343601
Schlagwörter: Prozeßrechner
Zusammenfassung: Ein Massenspektrometer ist ein Gerät zum Messen von Biomarkern in biologischen Gemeinschaften. Diese Biomarker können genutzt werden, um Biogasanlagen zu optimieren und Energieeffizienter zu machen oder auch Krankheiten zu diagnostizieren. Die aktuellen Analysearbeitsabläufe eines Massenspektrometers sind sequenziell und beinhaltet Stunden von Wartezeiten zwischen den einzelnen Arbeitsschritten. Diese Situation ist nicht akzeptabel, besonders wenn es um klinische Diagnostik geht. Zusätzlich ist die softwaregestützte Datenanalyse sehr komplex und braucht eine stabile Hardwareinfrastruktur, welche mit hohen Kosten und Aufwand einhergeht. In unserer Arbeit präsentieren wir einen konzeptionellen Beweis einer analytischen Plattform für Echtzeitanalyse von Massenspektrometer-Experimenten. Wir implementierten MStream, eine Cloudbasierte Plattform, welche auf der Fast-Data- Architektur aufsetzt und eine skalierbare, streambasierte Protein Identifikation ermöglicht. Wir diskutieren und lösen alle Herausforderungen, die für die Adaption einzelner Schritte einer streambasierter Lösung auf einer Cloudarchitektur benötigt waren. Die erste Herausforderung war die Konzepterstellung, die zweite Herausforderung war das streamen der Daten während der Messung direkt von dem Massenspektrometer. Die dritte Herausforderung war die Strukturierung der Daten für einen schnellen Durchsatz und die letzte Herausforderung war die streambasierte Validierung der Ergebnisse. Das Resultat ist MStream, eine prototypische Umsetzung einer Cloudplattform zur Echtzeitverarbeitung von Massenspektrometerdaten. Am Ende der Arbeit wird die Plattform evaluiert und die Ergebnisse zeigen eine bessere Performance im Vergleich zu aktuellen Software-Alternativen.
A mass spectrometer is a device which can measure biomarkers of biological environments such as sea, biogas plant, human gut or a just a blood. Using these biomarkers, it is possible to optimize biogas plants in order to maximize the energy production or to diagnose diseases of thousands of patients with only one mass spectrometer. Unfortunately, the mass spectrometry data analysis pipeline is sequentially including hours of waiting time between the workflow steps. This situation is not applicable especially for use cases such as clinical diagnostics. Additionally, the data analysis is complex and needs a stable infrastructure, which involves very high costs and effort. In our work, we present a proof of concept of an analytic platform for real-time analysis of mass spectrometry experiments. We implemented MStream, a cloud-based platform on the fast data architecture for scalable streamlined protein identification. We discuss and solve all challenges in the thesis for adapting the components to a streaming cloud-based pipeline. First challenge is the concept of cloud-based architecture for streaming mass spectrometer data analysis pipeline. Next challenge is the possibility to stream from a device during the measurement. The third challenge is to structure and transform the data in the database systems and the last challenge is the streaming validation of the results. Finally, we implement MStream, a prototype of real-time cloud platform for analyzing mass spectrometry data during the measurement. Furthermore, our evaluation results show the performance gain for the analysis process in comparison to the state-of-the-art software.
URI: https://opendata.uni-halle.de//handle/1981185920/34360
http://dx.doi.org/10.25673/34165
Open-Access: Open-Access-Publikation
Nutzungslizenz: (CC BY-SA 4.0) Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International(CC BY-SA 4.0) Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International
Enthalten in den Sammlungen:Fakultät für Informatik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
Zoun_Roman_Dissertation_2020.pdfDissertation8.75 MBAdobe PDFMiniaturbild
Öffnen/Anzeigen