Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/60328
Title: Computational Mass Spectrometry in Metabolomics
Author(s): Neumann, SteffenLook up in the Integrated Authority File of the German National Library
Referee(s): Breitling, Rainer
Schoof, Heiko
Große, IvoLook up in the Integrated Authority File of the German National Library
Granting Institution: Martin-Luther-Universität Halle-Wittenberg
Issue Date: 2021
Extent: 1 Online-Ressource (351 Seiten)
Type: HochschulschriftLook up in the Integrated Authority File of the German National Library
Type: Habilitation
Exam Date: 2021-11-11
Language: English
URN: urn:nbn:de:gbv:3:4-1981185920-622796
Abstract: Unter Metabolomics versteht man Forschung an kleinen Molekülen z.B. in der Biologie mit dem Ziel, die Funktion von Stoffwechselprodukten (Metabolite) in biologischen Systemen zu beschreiben. Massenspektrometrie ist dabei eine Schlüsseltechnologie für die Messung der Metabolite. Durch den immensen technologischen Fortschritt in den letzten Jahren haben Menge und Komplexität der erzeugten Daten rasant zugenommen. Die Aufgabe der rechnergestützten Metabolomik ist es, Software und Datenbanken für Management und Analyse der Daten zu entwickeln. Diese Arbeit beschreibt verschiedene Schritte einer typischen Analysepipeline von der Verarbeitung der Messungen und Kombination mehrerer Peaklisten aus verschiedenen Proben, mit dem Ziel, eine Datenmatrix zu erstellen. Die statistische Analyse solcher Matrizen hat dann das Ziel, interessante Metaboliten aufzudecken. Für deren biochemische Interpretation müssen die Metabolite identifiziert werden, einschließlich ihrer Molekularstrukturen. Tandem-Massenspektren können dabei als Fingerabdruck der Moleküle genutzt und gegen Datenbanken mit Spektren bekannter Verbindungen verglichen werden. Informatische Ansätze ermöglichen die Identifizierung über Spektraldatenbanken hinaus. Diese Fortschritte in der rechnergestützten Metabolomik haben stark von der Entwicklung offener Datenformate und Repositorien profitiert, die die Grundlage der FAIR Prinzipien sind. Wenngleich rechnergestützte Analysen die einzelnen Aufgaben wesentlich schneller erledigen als eine manuelle Interpretation, so geht der Nutzen über die reine Beschleunigung dieser Aufgaben hinaus. Die Effizienzsteigerung erlaubt die Bearbeitung gänzlich neuer, bis dato zu komplexer Analysen. Diese Herausforderungen treiben auch die Entwicklungen in der Informatik voran, von Datenbanken für die ständig wachsenden Datenmengen über effizientere Algorithmen bis hin zu Visualisierungen großer (biologischer) Netzwerke.
Metabolomics is the modern term for the field of small molecule research in biology with the aim to capture the metabolites in biological systems and describe their biochemical role. Today, mass spectrometry is a key technology for metabolomics research. Due to immense technological advances in mass spectrometry over the last years, the amount and complexity of the data produced has been growing rapidly. The task of computational metabolomics is to develop tools and databases for the handling and analysis of mass spectrometry data. This thesis describes the steps in a metabolomics data processing pipeline, from processing of signals and alignment of several peak lists from different samples into a data matrix. The statistical analysis of metabolomics experiments will reveal a number of \interesting" metabolites, but for the biochemical interpretation it is required to determine the metabolite identities including their molecular structure. Tandem mass spectra can be considered a fingerprint of a molecule, and thus it is possible to create databases of spectra from known compounds for later comparison. Computational approaches allow identification beyond spectral databases. Most of the advances in computational metabolomics came along with the development of open data formats and repositories of open data. Together they are the basis of FAIR data. While computational and integrated approaches are certainly faster than performing the individual tasks manually, the real benefit is beyond mere speedup of such tasks. Ultimately they allow to answer biochemical questions that could not be tackled before, and also spur novel developments in computer science, ranging from databases for the ever growing amounts of data, to faster or more efficient data analysis algorithms or visualisation approaches for large (biological) networks and their dynamic behaviour.
URI: https://opendata.uni-halle.de//handle/1981185920/62279
http://dx.doi.org/10.25673/60328
Open Access: Open access publication
License: In CopyrightIn Copyright
Appears in Collections:Interne-Einreichungen

Files in This Item:
File Description SizeFormat 
thesis-2021-12-17 (2).pdf37.87 MBAdobe PDFThumbnail
View/Open