Please use this identifier to cite or link to this item:
http://dx.doi.org/10.25673/117606
Title: | Chemoinformatical analysis of natural products |
Author(s): | Hartig, Anne-Kathrin |
Referee(s): | Wessjohann, Ludger Steinbeck, Christoph |
Granting Institution: | Martin-Luther-Universität Halle-Wittenberg |
Issue Date: | 2024 |
Extent: | 1 Online-Ressource (v, 74, xlii Seiten) |
Type: | Hochschulschrift |
Type: | PhDThesis |
Exam Date: | 2024-09-26 |
Language: | English |
URN: | urn:nbn:de:gbv:3:4-1981185920-1195652 |
Abstract: | The importance of bioactive natural products from plants has been known in medicine for thousands of years. This thesis presents a comprehensive approach to identify potential biological sources for new natural products, linking activities to the entire plant phylogeny and incorporating spatial data. This approach was initially applied only to the island of Java and later to a global dataset. This data set was to be based on primary literature. For this purpose, a text mining tool was developed that recognizes both biological sources and natural products based on rules and trained models (Named Entity Recognition). It also includes a rule-based relationship extraction, i.e. the extraction of biological source-natural product pairs. A gold set with relevant literature was created for the development of this tool. Die Bedeutung bioaktiver Naturstoffe aus Pflanzen ist in der Medizin seit Jahrtausenden bekannt. In dieser Arbeit wird ein umfassender Ansatz zur Identifikation potentieller biologischer Quellen für neue Naturstoffe vorgestellt, der die Aktivitäten mit der gesamten pflanzlichen Phylogenie verknüpft und räumliche Daten einbezieht. Dieser Ansatz wurde zunächst nur für die Insel Java angewandt, später auf einem globalen Datensatz. Dieser Datensatz sollte auf Primärliteratur basieren. Dafür wurde ein Text-Mining Tool entwickelt, dass sowohl biologische Quellen als auch Naturstoffe basierend auf Regeln und trainierten Modellen erkennt (Named Entity Recognition). Außerdem beinhaltet es eine regelbasierte Beziehungsextraktion, d.h. die Extraktion von biologischen Quellen-Naturprodukt-Paaren. Zur Entwicklung dieses Tools wurde ein Gold Set mit relevanter Literatur erstellt. |
URI: | https://opendata.uni-halle.de//handle/1981185920/119565 http://dx.doi.org/10.25673/117606 |
Open Access: | Open access publication |
License: | (CC BY 4.0) Creative Commons Attribution 4.0 |
Appears in Collections: | Interne-Einreichungen |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Dissertation_MLU_2024_HartigAnneKathrin.pdf | 9.63 MB | Adobe PDF | View/Open |