Please use this identifier to cite or link to this item:
http://dx.doi.org/10.25673/679
Title: | Text mining and applications in life sciences |
Author(s): | Hinneburg, Alexander |
Referee(s): | Brass, Stefan, Prof. Dr. Seidl, Thomas, Prof. Dr. Spiliopoulou, Myra, Prof. Dr. |
Granting Institution: | Martin-Luther-Universität Halle-Wittenberg |
Issue Date: | 2011 |
Extent: | Online-Ressource (152 S. = 2,57 mb) |
Type: | Hochschulschrift |
Type: | Habilitation |
Exam Date: | 2011-01-13 |
Language: | English |
Publisher: | Universitäts- und Landesbibliothek Sachsen-Anhalt |
URN: | urn:nbn:de:gbv:3:4-7603 |
Subjects: | Text Mining Hochschulschrift Online-Publikation |
Abstract: | Text ist eine der häufigsten Form von elektronischen Daten, die für Menschen direkt lesbar ist. In dieser Arbeit wird untersucht, ob und wie statistische Methoden zur Textanalyse auf Anwendungen aus den Lebenswissenschaften übertragen werden können. Die betrachteten Anwendungen sind zwei-dimensionale-NMR-Spektren, Proteomics-Experimente und Protein-Precursor-Sequenzen, die eine Funktion als Transit-Peptid für Mitochondrien haben. All diese verschiedenen Datensorten können sinnvoll in eine Repräsentation überführt werden, die analog der Bag-of-Words-Repräsentation von Textdokumenten ist. Die verwendeten Text-Mining-Methoden sind Topic-Modeling und dessen Anwendungen auf Ähnlichkeitssuche, Near-Duplicate-Detektion von Dokumenten mittels Locality-Sensitive-Hashing und Cluster-Analyse basierend auf fraktaler Dimension. Die Ergebnisse zeigen, dass die Bag-of-Words-Repräsentation ebenso wie die genannten Text-Mining-Methoden sich erfolgreich in den ausgewählten Anwendungen übertragen und nutzbar machen lassen. |
URI: | https://opendata.uni-halle.de//handle/1981185920/7579 http://dx.doi.org/10.25673/679 |
Open Access: | Open access publication |
License: | In Copyright |
Appears in Collections: | Datenverarbeitung; Informatik |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
habil_hinneburg.pdf | 2.64 MB | Adobe PDF | View/Open |