Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/679
Title: Text mining and applications in life sciences
Author(s): Hinneburg, Alexander
Referee(s): Brass, Stefan, Prof. Dr.
Seidl, Thomas, Prof. Dr.
Spiliopoulou, Myra, Prof. Dr.
Granting Institution: Martin-Luther-Universität Halle-Wittenberg
Issue Date: 2011
Extent: Online-Ressource (152 S. = 2,57 mb)
Type: Hochschulschrift
Type: Habilitation
Exam Date: 13.01.2011
Language: English
Publisher: Universitäts- und Landesbibliothek Sachsen-Anhalt
URN: urn:nbn:de:gbv:3:4-7603
Subjects: Text Mining
Hochschulschrift
Online-Publikation
Abstract: Text ist eine der häufigsten Form von elektronischen Daten, die für Menschen direkt lesbar ist. In dieser Arbeit wird untersucht, ob und wie statistische Methoden zur Textanalyse auf Anwendungen aus den Lebenswissenschaften übertragen werden können. Die betrachteten Anwendungen sind zwei-dimensionale-NMR-Spektren, Proteomics-Experimente und Protein-Precursor-Sequenzen, die eine Funktion als Transit-Peptid für Mitochondrien haben. All diese verschiedenen Datensorten können sinnvoll in eine Repräsentation überführt werden, die analog der Bag-of-Words-Repräsentation von Textdokumenten ist. Die verwendeten Text-Mining-Methoden sind Topic-Modeling und dessen Anwendungen auf Ähnlichkeitssuche, Near-Duplicate-Detektion von Dokumenten mittels Locality-Sensitive-Hashing und Cluster-Analyse basierend auf fraktaler Dimension. Die Ergebnisse zeigen, dass die Bag-of-Words-Repräsentation ebenso wie die genannten Text-Mining-Methoden sich erfolgreich in den ausgewählten Anwendungen übertragen und nutzbar machen lassen.
URI: https://opendata.uni-halle.de//handle/1981185920/7579
http://dx.doi.org/10.25673/679
Open Access: Open access publication
License: In CopyrightIn Copyright
Appears in Collections:Datenverarbeitung; Informatik

Files in This Item:
File Description SizeFormat 
habil_hinneburg.pdf2.64 MBAdobe PDFThumbnail
View/Open