Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/101350
Full metadata record
DC FieldValueLanguage
dc.contributor.refereeGroße, Ivo-
dc.contributor.refereeMorgenstern, Burkhard-
dc.contributor.authorWeging, Silvio-
dc.date.accessioned2023-03-10T10:21:02Z-
dc.date.available2023-03-10T10:21:02Z-
dc.date.issued2022-
dc.identifier.urihttps://opendata.uni-halle.de//handle/1981185920/103306-
dc.identifier.urihttp://dx.doi.org/10.25673/101350-
dc.description.abstractExamining the taxonomic composition of sequenced data is a necessary step in almost any metagenomic analysis. Most existing and widely used programs prioritize speed over accuracy and robustness, while consuming large amounts of memory. As an alternative, we have developed and implemented new methods in a program called kASA, which is able to efficiently identify DNA or protein sequences using k-mers to build a metagenomic profile. We ensure high accuracy and robustness by using an amino acid-like encoding together with an interval of k's while using at most the amount of memory specified by the user. Algorithms and data structures specifically adapted to the use of secondary memory allow a complete taxonomic analysis of metagenomic data without compromises on HPC clusters, desktops or even laptops.eng
dc.description.abstractDie Untersuchung der taxonomischen Zusammensetzung von sequenzierten Daten ist ein notwendiger Schritt in fast jeder metagenomischen Analyse. Die meisten existierenden und weit verbreiteten Programme priorisieren Geschwindigkeit über Genauigkeit oder Robustheit und verbrauchen dabei große Mengen an Arbeitsspeicher. Als Alternative haben wir neue Methoden entwickelt und in einem Programm namens kASA implementiert, das in der Lage ist, effizient DNA- oder Proteinsequenzen mit k-meren zu identifizieren, um ein metagenomisches Profil zu erstellen. Dabei wird eine hohe Genauigkeit und Robustheit sicher gestellt, indem es eine aminosäureähnliche Kodierung zusammen mit einem Intervall von k's verwendet, wobei dabei maximal die vom Benutzer angegebene Speichermenge verbraucht wird. Algorithmen und Datenstrukturen, die speziell an die Verwendung von Sekundärspeicher angepasst sind, ermöglichen eine taxonomische Analyse von metagenomischen Daten auf HPC-Clustern, Desktops oder sogar Laptops.ger
dc.format.extent1 Online-Ressource (ii, 149 Seiten)-
dc.language.isoeng-
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/-
dc.subject.ddc004-
dc.titleNovel resource-efficient methods for robust and accurate taxonomic profiling of metagenomic dataeng
dcterms.dateAccepted2022-10-20-
dcterms.typeHochschulschrift-
dc.typePhDThesis-
dc.identifier.urnurn:nbn:de:gbv:3:4-1981185920-1033066-
local.versionTypepublishedVersion-
local.publisher.universityOrInstitutionMartin-Luther-Universität Halle-Wittenberg-
local.subject.keywordsHigh Performance Computing, Big data, Bioinformatics, Computational genomics, Metagenomics, Metagenomic profiling, Taxonomic profiling-
local.subject.keywordsHigh Performance Computing, Big Data, Bioinformatik, Computergestützte Genomik, Metagenomik, Metagenomisches Profiling, Taxonomisches Profiling-
local.openaccesstrue-
dc.identifier.ppn1838872035-
local.publication.countryXA-DE-
cbs.sru.importDate2023-03-10T10:20:21Z-
local.accessrights.dnbfree-
Appears in Collections:Interne-Einreichungen

Files in This Item:
File Description SizeFormat 
Dissertation_MLU_2022_WegingSilvio.pdf2.38 MBAdobe PDFThumbnail
View/Open