Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/117606
Title: Chemoinformatical analysis of natural products
Author(s): Hartig, Anne-KathrinLook up in the Integrated Authority File of the German National Library
Referee(s): Wessjohann, LudgerLook up in the Integrated Authority File of the German National Library
Steinbeck, ChristophLook up in the Integrated Authority File of the German National Library
Granting Institution: Martin-Luther-Universität Halle-Wittenberg
Issue Date: 2024
Extent: 1 Online-Ressource (v, 74, xlii Seiten)
Type: HochschulschriftLook up in the Integrated Authority File of the German National Library
Type: PhDThesis
Exam Date: 2024-09-26
Language: English
URN: urn:nbn:de:gbv:3:4-1981185920-1195652
Abstract: The importance of bioactive natural products from plants has been known in medicine for thousands of years. This thesis presents a comprehensive approach to identify potential biological sources for new natural products, linking activities to the entire plant phylogeny and incorporating spatial data. This approach was initially applied only to the island of Java and later to a global dataset. This data set was to be based on primary literature. For this purpose, a text mining tool was developed that recognizes both biological sources and natural products based on rules and trained models (Named Entity Recognition). It also includes a rule-based relationship extraction, i.e. the extraction of biological source-natural product pairs. A gold set with relevant literature was created for the development of this tool.
Die Bedeutung bioaktiver Naturstoffe aus Pflanzen ist in der Medizin seit Jahrtausenden bekannt. In dieser Arbeit wird ein umfassender Ansatz zur Identifikation potentieller biologischer Quellen für neue Naturstoffe vorgestellt, der die Aktivitäten mit der gesamten pflanzlichen Phylogenie verknüpft und räumliche Daten einbezieht. Dieser Ansatz wurde zunächst nur für die Insel Java angewandt, später auf einem globalen Datensatz. Dieser Datensatz sollte auf Primärliteratur basieren. Dafür wurde ein Text-Mining Tool entwickelt, dass sowohl biologische Quellen als auch Naturstoffe basierend auf Regeln und trainierten Modellen erkennt (Named Entity Recognition). Außerdem beinhaltet es eine regelbasierte Beziehungsextraktion, d.h. die Extraktion von biologischen Quellen-Naturprodukt-Paaren. Zur Entwicklung dieses Tools wurde ein Gold Set mit relevanter Literatur erstellt.
URI: https://opendata.uni-halle.de//handle/1981185920/119565
http://dx.doi.org/10.25673/117606
Open Access: Open access publication
License: (CC BY 4.0) Creative Commons Attribution 4.0(CC BY 4.0) Creative Commons Attribution 4.0
Appears in Collections:Interne-Einreichungen

Files in This Item:
File Description SizeFormat 
Dissertation_MLU_2024_HartigAnneKathrin.pdf9.63 MBAdobe PDFThumbnail
View/Open