DSpace Collection:https://opendata.uni-halle.de//handle/497920112/1592452024-03-29T09:49:34Z2024-03-29T09:49:34ZMarkov Chain Monte Carlo algorithms for the uniform sampling of combinatorial objectsRechner, Steffenhttps://opendata.uni-halle.de//handle/1981185920/90132023-12-07T07:40:21Z2018-01-01T00:00:00ZTitle: Markov Chain Monte Carlo algorithms for the uniform sampling of combinatorial objects
Author(s): Rechner, Steffen
Abstract: In dieser Arbeit untersuche ich die Effizienz von Markov-Chain Monte Carlo (MCMC) Algorithmen zum gleichverteilten Erzeugen zufälliger kombinatorischer Strukturen. Zu diesem Zweck habe ich eine Software namens marathon entwickelt, welche ich zur Berechnung struktureller Eigenschaften von Markov-Ketten einsetze, die rein analytisch schwer zu bestimmen wären. Ich verwende diese Software, um MCMC-Algorithmen aus drei Problemklassen zu untersuchen. Zunächst untersuche ich drei bekannte Methoden zum Erzeugen zufälliger bipartiter Graphen mit festen Knotengraden. Unter anderem zeige ich, welcher Algorithmus am besten für den Einsatz in speziellen ökologischen Anwendungen geeignet ist. Anschließend betrachte ich das Erzeugen zufälliger bipartiter Graphen mit beschränkten Knotengraden. Ich führe zwei neue MCMC-Algorithmen ein und untersuche auf experimentellem Wege deren Effizienz. Schließlich analysiere ich Algorithmen zum zufälligen Erzeugen perfekter Matchings in bipartiten Graphen. Dabei identifiziere ich Initialzustände, die eine polynomielle beziehungsweise exponentielle Mischzeit besitzen.; In this thesis, we discuss a family of sampling methods known as Markov chain Monte Carlo (MCMC) algorithms. To support the analysis of such algorithms,we developed the software tool marathon, designed to determine properties of Markov chains that are usually hard to find analytically. We apply our software to experimentally assess the efficiency of several MCMC algorithms from three sampling applications. First, we address three well-known MCMC algorithms for the uniform sampling of bipartite graphs with fixed degrees. In a set of experiments, we show which sampling algorithm works best in certain types of ecological applications. Motivated by the work with incomplete data, we next address the uniform sampling of bipartite graphs whose degrees lie in prescribed intervals. After introducing two new MCMC algorithms, we give a proof of their correctness and experimentally assess their efficiency. Finally, we address the uniform sampling of perfect matchings in bipartite graphs. In a set of experiments with two special classes of bipartite graphs, we identify initial states that require a polynomial and an exponential number of steps.2018-01-01T00:00:00ZNew approaches for de-novo motif discovery using phylogenetic footprinting - from data acquisition to motif visualization ; [kumulative Dissertation]Nettling, Arthur Martinhttps://opendata.uni-halle.de//handle/1981185920/87732023-12-07T07:42:29Z2017-01-01T00:00:00ZTitle: New approaches for de-novo motif discovery using phylogenetic footprinting - from data acquisition to motif visualization ; [kumulative Dissertation]
Author(s): Nettling, Arthur Martin
Abstract: In dieser Arbeit haben meine Kollegen und ich sechs Limitierungen in drei verwandten Themengebieten adressiert. Im ersten Themengebiet, der Datenakquisition und Datenvorbereitung, haben wir die Datenbank miRGen und den Key-Value store DRUMS entwickelt. Im zweiten Themengebiet haben wir drei Ansätze zur Verbesserung der de-novo Motivsuche mit Phylogenetic Footprinting untersucht. Wir konnten zeigen, dass es unter Verwendung von speziesübergreifenden Informationen möglich ist, den Bindeaffinitätsbias in ChIP-Seq Daten zu berücksichtigen. Des Weiteren haben wir entdeckt, dass die Verwendung von unrealistischen phylogenetischen Bäumen beim Phylogenetic Footprinting zu einer robusteren Vorhersage von Sequenzmotiven führt. Schließlich haben wir ein traditionelles phylogenetisches Motivmodell um die Fähigkeit erweitert Nukleotidabhängigkeiten höherer Ordnung zu modellieren. Alle drei Ansätze führen zu einer verbesserten Vorhersage von Transkriptionsfaktorbindestellen. Im dritten Themengebiet, der Visualisierung von Sequenzmotiven, haben wir DiffLogo entwickelt, ein frei verfügbares R-Paket, spezialisiert auf die vergleichende Visualisierung von Sequenzmotiven. Jede dieser Arbeiten trägt dazu bei unser Verständnis der Genregulation als Ganzen zu verbessern.; In this thesis, my colleagues and I have addressed six limitations in three related fields. First, we proposed miRGen and DRUMS, two approaches to improve „data acquisition and data preparation.“ Second, we proposed three approaches to improve „de-novo motif discovery using phylogenetic footprinting.“ Specifically, we studied the detection and correction of the binding affinity bias in ChIP-Seq data using inter-species information. Further, we studied unrealistic phylogenetic trees for more robust de-novo motif predictions with phylogenetic footprinting. Finally, we extended phylogenetic motif models by taking into account intra-motif dependencies. We found that all three approaches lead to an improved prediction of transcription factor binding sites. Third, we proposed DiffLogo to improve the „visualization of sequence motifs.“ DiffLogo is a freely available R package for the comparative visualization of sequence motifs. Each of these studies potentially advance our attempt of understanding transcriptional gene regulation as a whole.2017-01-01T00:00:00ZStudy of small non-coding RNAs in plants by developing novel pipelinesPatra Bhattacharya, Deblinahttps://opendata.uni-halle.de//handle/1981185920/87652023-12-07T07:39:47Z2017-01-01T00:00:00ZTitle: Study of small non-coding RNAs in plants by developing novel pipelines
Author(s): Patra Bhattacharya, Deblina
Abstract: Aufgrund der moderaten Größe von kleinen RNA-seq-Datasets wird der Webserver plantDARIO eingeführt, um eine umfassende Analyse für small non-coding RNAs (sncRNAs) zu ermöglichen, die wesentliche Änderungen zur pflanzenspezifischen sncRNA-Verarbeitung beinhalten. Während der Analyse werden kleine nukleolare RNAs (snoRNAs) als die ältesten sowie konservierten Familien unter nicht-Protein-kodierenden RNAs gefunden. Daher wird ein anspruchsvoller Ansatz angewandt, um die phylogenetische Verteilung einzelner snoRNA-Familien in Pflanzen darzustellen, und 296 Familien von snoRNAs in 24 Arten werden identifiziert, um ihre Evolution im gesamten Pflanzenreich zu verfolgen. Um neben neuartige snoRNAs und deren Erhaltung zu finden, werden der plantDARIO Webserver und der anspruchsvolle Ansatz gemeinsam umgesetzt. Als Ergebnis werden 11 neuartige snoRNA-Familien in 9 Kasten-C/D-SnoRNA-Familien und 2 Kasten-H/ACA-SnoRNA-Familien zusammen mit ihren Zielen identifiziert.; Due to the moderate size of small RNA-seq datasets, webserver plantDARIO is introduced in order to provide comprehensive analysis for plant small non-coding RNAs (sncRNAs) which includes major modifications to cope with plant-specific sncRNA processing. During analysis, small nucleolar RNAs(snoRNAs) are found to be the most ancient as well as conserved families amongst non-protein coding RNAs. Hence, a sophisticated approach is applied to chart the phylogenetic distribution of individual snoRNA families in plants and 296 families of snoRNAs in 24 species are identified tracing their evolution throughout the plant kingdom. Moreover to find novel snoRNAs and their conservation, plantDARIO webserver and the sophisticated approach are implemented together. As a result 11 novel snoRNA families are identified classified into 9 box C/D snoRNA families and 2 box H/ACA snoRNA families along with their targets.2017-01-01T00:00:00ZUntersuchungen über den Einfluss des IGF2 mRNA-bindenden Proteins 1 auf in-vitro-Tumorzellmigration mit Methoden der digitalen Bildverarbeitung und GenexpressionsanalysenGlaß, Markushttps://opendata.uni-halle.de//handle/1981185920/87112023-12-07T07:27:01Z2017-01-01T00:00:00ZTitle: Untersuchungen über den Einfluss des IGF2 mRNA-bindenden Proteins 1 auf in-vitro-Tumorzellmigration mit Methoden der digitalen Bildverarbeitung und Genexpressionsanalysen
Author(s): Glaß, Markus
Abstract: Im Rahmen der vorliegenden Arbeit wurden zwei Bildanalyseapplikationen für die automatisierte Auswertung von Zellmigrationsexperimenten entwickelt und implementiert. Diese Applikationen dienen der Quantifzierung der Zellmigration mit Hilfe von Mikroskopaufnahmen aus Einzelzell-Tracking beziehungsweise Scratch-Assay-Experimenten. Mit Hilfe dieser Applikationen wurde der Einfluss des RNA bindenden Proteins IGF2BP1 auf die Tumorzellmigration untersucht. Dabei konnte bestätigt werden, dass die Reduktion der Expression dieses Proteins zu einer reduzierten Geschwindigkeit und einem verzögerten Wundschlusspotential der betrachteten Tumorzellen führte. Die Auswertung von RNA-Seq-Daten zeigte zudem, dass IGF2BP1 einen Einfluss auf die Expression einer Vielzahl migrationsrelevanter Gene ausübt. Durch die kombinierte Analyse von Mikroskopie- und Genexpressionsdaten, konnte somit eine Korrelation zwischen beobachtetem Migrationsverhalten und der Regulation der Genexpression gezeigt werden.; For the present work two image analysis applications aiming at the automated evaluation of cell migration experiments were developed and implemented. These applications can be used for the quantification of cell migration using microscopy images acquired from single cell tracking and scratch assay experiments. The applications were applied to investigate the influence of the RNA-binding protein IGF2BP1 on the migration of tumor derived cells. A reduction in cell speed as well as a reduced wound closure potential upon the reduction of IGF2BP1 expression could be confirmed. Furthermore, the evaluation of RNA-Seq data revealed an influence of IGF2BP1 on the expression of a plethora of migration-related genes. Thus, through the combined analysis of microscopy and gene expression data, a correlation between observed migratory behaviour and regulation of gene expression could be shown.2017-01-01T00:00:00Z