Please use this identifier to cite or link to this item:
http://dx.doi.org/10.25673/62547
Title: | Mikrobiomanalyse unter Berücksichtigung biologischer Datenstruktur |
Author(s): | Antweiler, Kai Lars |
Referee(s): | Schwabe, Rainer Kropf, Siegfried |
Granting Institution: | Otto-von-Guericke-Universität Magdeburg, Fakultät für Mathematik |
Issue Date: | 2021 |
Extent: | VI, 171 Blätter |
Type: | Hochschulschrift |
Type: | PhDThesis |
Exam Date: | 2021 |
Language: | German |
URN: | urn:nbn:de:gbv:ma9:1-1981185920-644988 |
Subjects: | Mathematische Statistik Mikrobiologie |
Abstract: | Das Ziel dieser Arbeit ist biologische Konzepte in die Datenauswertung von Mikrobiomstudien
zu integrieren.
Mikrobiomanalysen vergleichen relative Häufigkeiten der Organismen aus Mikrobengemeinschaften
verschiedener Proben – z.B. Proben aus Wurzelbereichen unterschiedlich behandelter
Pflanzen. Diese Häufigkeitsdaten sind hochdimensional und dünnbesetzt. Der Stichprobenumfang
an Pflanzen ist meist gering. Aus den Daten werden oft abstrakte Abstände
zwischen Pflanzen berechnet und mit Permutationstests auf Unterschiede geprüft.
Abstände lassen sich auch für Äquivalenztests nutzen, die sonst durch die Hochdimensionalität
zu geringe Güte hätten. Anstatt den Anspruch zu erheben für jede Variable Äquivalenz
nachzuweisen, wird diese nur für das Abstandsmaß gezeigt. Durch ökologisch-sinnhafte Abstände
lassen sich geeignete Testverfahren konstruieren. Das größte Problem stellt die zuverlässige
Varianzschätzung einer ggf. komplizierten Abstandsvariable bei kleinen Stichprobengrößen
dar. Zur Varianzschätzung wurde in dieser Arbeit ein 2-Stichproben-Jackknife-
Verfahren identifiziert und in seiner Anwendbarkeit auf unbalancierte Designs erweitert.
Das Verwenden von Verwandtschaftsbeziehungen (also Phylogenetik) zwischen Mikroben in
Häufigkeitsauswertungen ist ein junges Forschungsgebiet. Zusammenhänge zwischen Genomsequenz,
Phylogenetik und Messverfahren, wurden hier zusammengetragen. In dieser
Arbeit wurden zwei Verfahren an phylogenetische Zusatzinformation angepasst. 1. Hierarchische
Tests bilden baumförmig organisierte Variablen-Cluster, die geschickt getestet werden.
Hier wird ein Baum, der die Verwandtschaften widerspiegelt, vorgegeben. Somit führen
alle Ergebnisse der Prozedur zu biologisch sinnvollen Gruppen von Mikroben. Zu diesen Ergebnissen
wurde hier auch eine übersichtliche Darstellungsmethode entwickelt. 2. Sequentielles
Testen mit datenabhängig geordneten Hypothesen nach Kropf zeigt hohe Güte – verliert
diese jedoch mit zunehmender Varianzungleichheit zwischen Variablen. Hier wird Phylogenetik
verwendet, um Variablengruppen zu bilden, deren Varianzen ähnlicher sein sollten und
somit die Testbedingungen verbessert.
In dieser Arbeit konnte gezeigt werden, dass Äquivalenztests in Mikrobiomanalysen sinnvoll
möglich sind und auch multiple Testverfahren phylogenetische Zusatzinformation ausnutzen
können. Das betrifft insbesondere die Interpretier- und Darstellbarkeit der Ergebnisse
dieser Analysen. Grenzen und Möglichkeiten durch neue Messmethoden wurden betrachtet. The purpose of this dissertation is to integrate biological concepts into data analyses of microbiome studies. Analyses of the microbiome compare relative abundances of organisms from microbial communities of biological samples – e.g. samples from the root region of plants that were treated under different conditions. These data are sparse and high-dimensional. Usually, the sample size of plants is small. Often, the data is transformed into abstract distances between the plants and tested for difference by permutation testing. Distances can also be used for tests of equivalence that would otherwise suffer from highdimensionality and show little power. Equivalence is only investigated in terms of the distance measure instead of proving equivalence for each variable. Testing procedures can be constructed upon ecologically meaningful distance measures. The biggest problem is the reliable estimation of variance, since the distance measure can be complicated and the sample size small. In this dissertation, a 2-sample Jackknife procedure was identified for estimating the variance and its applicability was expanded to unbalanced designs. Utilizing phylogenetical relationships between microbes in analyses of abundances is a relatively new research topic. This dissertation includes literature research for relations between genome sequences, phylogenetics, and measuring procedures. Also, two statistical procedures were modified to incorporate phylogenetical information: 1. Hierarchical tests arrange clustered variables in a tree and test those aptly. Here, that tree is constructed to mirror the phylogenetical relationships. Thereby, all results are calculated for biologically meaningful groups of microbes. Also, to visualize those results clearly a procedure was developed, here. 2. Sequential testing based on variance ordering is a powerful measure that looses the more power the more the variances of variables deviate from one another. Here, phylogenetics is used to define clusters of variables. Because the variances inside each cluster are likely to be more similar to each other, those clusters provide better conditions for this testing procedure. In this dissertation, it was shown that test of equivalence can be applied appropriately in microbiome analyses and that procedures for multiple testing can be improved by utilizing phylogenetical information. The latter is especially true for the visualization and interpretability of the results of analyses. Potentials and limits of methods for Next Generation Sequencing based studies were considered. |
URI: | https://opendata.uni-halle.de//handle/1981185920/64498 http://dx.doi.org/10.25673/62547 |
Open Access: | Open access publication |
License: | (CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0 |
Appears in Collections: | Fakultät für Mathematik |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
antweiler_Kai-Lars_Dissertation_2021.pdf | Dissertation | 1.73 MB | Adobe PDF | View/Open |