Novel resource-efficient methods for robust and accurate taxonomic profiling of metagenomic data

Weging, Silvio

Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.25673/101350

Langanzeige der Metadaten

DC Element	Wert	Sprache
dc.contributor.referee	Große, Ivo	-
dc.contributor.referee	Morgenstern, Burkhard	-
dc.contributor.author	Weging, Silvio	-
dc.date.accessioned	2023-03-10T10:21:02Z	-
dc.date.available	2023-03-10T10:21:02Z	-
dc.date.issued	2022	-
dc.identifier.uri	https://opendata.uni-halle.de//handle/1981185920/103306	-
dc.identifier.uri	http://dx.doi.org/10.25673/101350	-
dc.description.abstract	Examining the taxonomic composition of sequenced data is a necessary step in almost any metagenomic analysis. Most existing and widely used programs prioritize speed over accuracy and robustness, while consuming large amounts of memory. As an alternative, we have developed and implemented new methods in a program called kASA, which is able to efficiently identify DNA or protein sequences using k-mers to build a metagenomic profile. We ensure high accuracy and robustness by using an amino acid-like encoding together with an interval of k's while using at most the amount of memory specified by the user. Algorithms and data structures specifically adapted to the use of secondary memory allow a complete taxonomic analysis of metagenomic data without compromises on HPC clusters, desktops or even laptops.	eng
dc.description.abstract	Die Untersuchung der taxonomischen Zusammensetzung von sequenzierten Daten ist ein notwendiger Schritt in fast jeder metagenomischen Analyse. Die meisten existierenden und weit verbreiteten Programme priorisieren Geschwindigkeit über Genauigkeit oder Robustheit und verbrauchen dabei große Mengen an Arbeitsspeicher. Als Alternative haben wir neue Methoden entwickelt und in einem Programm namens kASA implementiert, das in der Lage ist, effizient DNA- oder Proteinsequenzen mit k-meren zu identifizieren, um ein metagenomisches Profil zu erstellen. Dabei wird eine hohe Genauigkeit und Robustheit sicher gestellt, indem es eine aminosäureähnliche Kodierung zusammen mit einem Intervall von k's verwendet, wobei dabei maximal die vom Benutzer angegebene Speichermenge verbraucht wird. Algorithmen und Datenstrukturen, die speziell an die Verwendung von Sekundärspeicher angepasst sind, ermöglichen eine taxonomische Analyse von metagenomischen Daten auf HPC-Clustern, Desktops oder sogar Laptops.	ger
dc.format.extent	1 Online-Ressource (ii, 149 Seiten)	-
dc.language.iso	eng	-
dc.rights.uri	http://rightsstatements.org/vocab/InC/1.0/	-
dc.subject.ddc	004	-
dc.title	Novel resource-efficient methods for robust and accurate taxonomic profiling of metagenomic data	eng
dcterms.dateAccepted	2022-10-20	-
dcterms.type	Hochschulschrift	-
dc.type	PhDThesis	-
dc.identifier.urn	urn:nbn:de:gbv:3:4-1981185920-1033066	-
local.versionType	publishedVersion	-
local.publisher.universityOrInstitution	Martin-Luther-Universität Halle-Wittenberg	-
local.subject.keywords	High Performance Computing, Big data, Bioinformatics, Computational genomics, Metagenomics, Metagenomic profiling, Taxonomic profiling	-
local.subject.keywords	High Performance Computing, Big Data, Bioinformatik, Computergestützte Genomik, Metagenomik, Metagenomisches Profiling, Taxonomisches Profiling	-
local.openaccess	true	-
dc.identifier.ppn	1838872035	-
local.publication.country	XA-DE	-
cbs.sru.importDate	2023-03-10T10:20:21Z	-
local.accessrights.dnb	free	-
Enthalten in den Sammlungen:	Interne-Einreichungen

Dateien zu dieser Ressource:

Datei	Beschreibung	Größe	Format
Dissertation_MLU_2022_WegingSilvio.pdf		2.38 MB	Adobe PDF	Öffnen/Anzeigen

Zur Kurzanzeige BibTeX EndNote