Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/62547
Title: Mikrobiomanalyse unter Berücksichtigung biologischer Datenstruktur
Author(s): Antweiler, Kai Lars
Referee(s): Schwabe, RainerLook up in the Integrated Authority File of the German National Library
Kropf, Siegfried
Granting Institution: Otto-von-Guericke-Universität Magdeburg, Fakultät für Mathematik
Issue Date: 2021
Extent: VI, 171 Blätter
Type: HochschulschriftLook up in the Integrated Authority File of the German National Library
Type: PhDThesis
Exam Date: 2021
Language: German
URN: urn:nbn:de:gbv:ma9:1-1981185920-644988
Subjects: Mathematische Statistik
Mikrobiologie
Abstract: Das Ziel dieser Arbeit ist biologische Konzepte in die Datenauswertung von Mikrobiomstudien zu integrieren. Mikrobiomanalysen vergleichen relative Häufigkeiten der Organismen aus Mikrobengemeinschaften verschiedener Proben – z.B. Proben aus Wurzelbereichen unterschiedlich behandelter Pflanzen. Diese Häufigkeitsdaten sind hochdimensional und dünnbesetzt. Der Stichprobenumfang an Pflanzen ist meist gering. Aus den Daten werden oft abstrakte Abstände zwischen Pflanzen berechnet und mit Permutationstests auf Unterschiede geprüft. Abstände lassen sich auch für Äquivalenztests nutzen, die sonst durch die Hochdimensionalität zu geringe Güte hätten. Anstatt den Anspruch zu erheben für jede Variable Äquivalenz nachzuweisen, wird diese nur für das Abstandsmaß gezeigt. Durch ökologisch-sinnhafte Abstände lassen sich geeignete Testverfahren konstruieren. Das größte Problem stellt die zuverlässige Varianzschätzung einer ggf. komplizierten Abstandsvariable bei kleinen Stichprobengrößen dar. Zur Varianzschätzung wurde in dieser Arbeit ein 2-Stichproben-Jackknife- Verfahren identifiziert und in seiner Anwendbarkeit auf unbalancierte Designs erweitert. Das Verwenden von Verwandtschaftsbeziehungen (also Phylogenetik) zwischen Mikroben in Häufigkeitsauswertungen ist ein junges Forschungsgebiet. Zusammenhänge zwischen Genomsequenz, Phylogenetik und Messverfahren, wurden hier zusammengetragen. In dieser Arbeit wurden zwei Verfahren an phylogenetische Zusatzinformation angepasst. 1. Hierarchische Tests bilden baumförmig organisierte Variablen-Cluster, die geschickt getestet werden. Hier wird ein Baum, der die Verwandtschaften widerspiegelt, vorgegeben. Somit führen alle Ergebnisse der Prozedur zu biologisch sinnvollen Gruppen von Mikroben. Zu diesen Ergebnissen wurde hier auch eine übersichtliche Darstellungsmethode entwickelt. 2. Sequentielles Testen mit datenabhängig geordneten Hypothesen nach Kropf zeigt hohe Güte – verliert diese jedoch mit zunehmender Varianzungleichheit zwischen Variablen. Hier wird Phylogenetik verwendet, um Variablengruppen zu bilden, deren Varianzen ähnlicher sein sollten und somit die Testbedingungen verbessert. In dieser Arbeit konnte gezeigt werden, dass Äquivalenztests in Mikrobiomanalysen sinnvoll möglich sind und auch multiple Testverfahren phylogenetische Zusatzinformation ausnutzen können. Das betrifft insbesondere die Interpretier- und Darstellbarkeit der Ergebnisse dieser Analysen. Grenzen und Möglichkeiten durch neue Messmethoden wurden betrachtet.
The purpose of this dissertation is to integrate biological concepts into data analyses of microbiome studies. Analyses of the microbiome compare relative abundances of organisms from microbial communities of biological samples – e.g. samples from the root region of plants that were treated under different conditions. These data are sparse and high-dimensional. Usually, the sample size of plants is small. Often, the data is transformed into abstract distances between the plants and tested for difference by permutation testing. Distances can also be used for tests of equivalence that would otherwise suffer from highdimensionality and show little power. Equivalence is only investigated in terms of the distance measure instead of proving equivalence for each variable. Testing procedures can be constructed upon ecologically meaningful distance measures. The biggest problem is the reliable estimation of variance, since the distance measure can be complicated and the sample size small. In this dissertation, a 2-sample Jackknife procedure was identified for estimating the variance and its applicability was expanded to unbalanced designs. Utilizing phylogenetical relationships between microbes in analyses of abundances is a relatively new research topic. This dissertation includes literature research for relations between genome sequences, phylogenetics, and measuring procedures. Also, two statistical procedures were modified to incorporate phylogenetical information: 1. Hierarchical tests arrange clustered variables in a tree and test those aptly. Here, that tree is constructed to mirror the phylogenetical relationships. Thereby, all results are calculated for biologically meaningful groups of microbes. Also, to visualize those results clearly a procedure was developed, here. 2. Sequential testing based on variance ordering is a powerful measure that looses the more power the more the variances of variables deviate from one another. Here, phylogenetics is used to define clusters of variables. Because the variances inside each cluster are likely to be more similar to each other, those clusters provide better conditions for this testing procedure. In this dissertation, it was shown that test of equivalence can be applied appropriately in microbiome analyses and that procedures for multiple testing can be improved by utilizing phylogenetical information. The latter is especially true for the visualization and interpretability of the results of analyses. Potentials and limits of methods for Next Generation Sequencing based studies were considered.
URI: https://opendata.uni-halle.de//handle/1981185920/64498
http://dx.doi.org/10.25673/62547
Open Access: Open access publication
License: (CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0(CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0
Appears in Collections:Fakultät für Mathematik

Files in This Item:
File Description SizeFormat 
antweiler_Kai-Lars_Dissertation_2021.pdfDissertation1.73 MBAdobe PDFThumbnail
View/Open