Skip navigation
Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/853
Title: Learning and visualizing topics and their change with time for the exploratory analysis of social tags and multilingual topic modeling of chemical compounds
Author(s): Gohr, André
Advisor(s): Hinneburg, Alexander, Dr.
Wrobel, Stefan, Prof. Dr.
Granting Institution: Martin-Luther-Universität Halle-Wittenberg
Issue Date: 2012
Extent: Online-Ressource (159 Bl. = 2,28 mb)
Type: Hochschulschrift
Exam Date: 19.12.2012
Language: English
Publisher: Universitäts- und Landesbibliothek Sachsen-Anhalt
URN: urn:nbn:de:gbv:3:4-9444
Subjects: Computerlinguistik
Online-Publikation
Hochschulschrift
Abstract: Ich schlage AdaptivePLSA für das Lernen von dynamischen Topics aus Dokumentströmen vor. Für die SIGIR Konferenzbände liefern die gelernten Topics Hinweise auf die wissenschaftlichen Hauptthemen. Ich schlage TopicTable als eine Visualisierung für die aus Dokumentströmen gelernten Topics vor. TopicTable visualisiert nützliche Zusatzinformationen wie Topicähnlichkeiten und neu auftretende Wörter. In einem Beispiel liefert TopicTable eindeutige Hinweise auf fremdartige Dokumente in einem Dokumentstrom. Desweiteren beschäftige ich mich mit dem Aufdecken der semantischen Mehrdeutigkeit von sozialen Tags. Der vorgestellte Ansatz deckt unerwartete Bedeutungen dieser Tags auf und visualisiert Themen der Dokumente mit diesen Tags. Zuletzt wende ich ein bilinguales Topic-Modell an, um NMR-Spektren und chemische Konstitutionen chemischen Verbindungen zu modellieren. Die gelernten bilingualen Topics könnten Anwendung finden in neuartigen Ansätzen zum Datamining in chemischen Strukturdatenbanken.
I propose AdaptivePLSA for dynamic topic modeling with streams of documents. For the SIGIR proceedings, the learned topics give clear hints to the main research subjects. Next, I propose TopicTable, a visualization for presenting topics learned from document streams. TopicTable visualizes useful pieces of information, e.g., topics similarities and newly emerging words. It is effective as it provides clear hints to alien documents which were added to a test stream of documents. Next, I propose an approach for the disambiguation of social tags which have been added to documents by many users of a collaborative tagging system. This approach uncovers unobvious semantics of tags and visualizes topics which are learned from the tagged documents. Last, I apply bilingual topic modeling to NMR spectra and chemical constitutions of chemical compounds. The learned bilingual topics might be exploited by new approaches for data mining in chemical- and structure-databases of chemical compounds.
URI: https://opendata.uni-halle.de//handle/1981185920/7752
http://dx.doi.org/10.25673/853
Open access: Open access publication
Appears in Collections:Datenverarbeitung; Informatik

Files in This Item:
File Description SizeFormat 
Gohr.pdf2.34 MBAdobe PDFThumbnail
View/Open
Show full item record BibTeX EndNote


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.