Please use this identifier to cite or link to this item:
http://dx.doi.org/10.25673/3209
Title: | Density-based clustering in large databases using projections and visualizations |
Author(s): | Hinneburg, Alexander |
Granting Institution: | Martin-Luther-Universität Halle-Wittenberg |
Issue Date: | 2002 |
Extent: | Online-Ressource, Text + Image |
Type: | Hochschulschrift |
Type: | PhDThesis |
Language: | English |
Publisher: | Universitäts- und Landesbibliothek Sachsen-Anhalt |
URN: | urn:nbn:de:gbv:3-000004638 |
Subjects: | Elektronische Publikation Hochschulschrift Zsfassung in dt. Sprache |
Abstract: | In dieser Arbeit wurde ein Rahmen-System für Clusteranalyse entwickelt, daß Cluster-Primitive für verschiedene Aufgabenstellungen bereit hält. Alle Cluster-Primitive basieren auf Dichteschätzung, die von der eigentlichen Clusteranalyse getrennt wurde. Diese Trennung führte zu Algorithmen mit geringerer Laufzeitkomplexität. Um hoch-dimensionale Daten zu bearbeiten, wurde ein neuer Algorithmus vorgeschlagen, der Cluster in verschiedenen Projektionen des hoch-dimensionalen Datenraumes finden kann. Der neue Algorithmus kann Cluster finden, die von anderen bekannten Verfahren nicht gefunden werden können. Zum Abschluss wurde das HD-Eye-System entwickelt, das automatische Verfahren mit Visualisierungstechniken verknüpft, um dem Nutzer eine bessere Grundlage für seine Entscheidungen zu liefern und um das Verständnis und die Einschätzung der Ergebnisse zu erleichtern. In zukünftigen Arbeiten kann der Algorithmus zum Finden von Clustern in Projektionen erweitert werden, um auch Cluster mit abhängigen Attributen zu finden. In diesem Rahmen gibt es auch Potential zur Entwicklung neuer Visualisierungstechniken. In the thesis we propose a new framework for clustering based on primitives for different clustering schemes. Our ideas is that the primitives are based on density estimation, which is a separated task from cluster analysis. This separation leads to new algorithms with lower run time complexity as previous published ones. To handle high dimensional data we proposed a new algorithm which determines clusters in different projections of the high dimensional data space. We demonstrate that the new algorithms finds clusters, which are missed by known projected clustering methods. Finally we describe an interactive visual clustering system, called HD-Eye, which combines automated clustering algorithms with novel visualization techniques. This combination provides the analyst a good basis for data exploration and improves her/his understanding of the results. In future work we will exploit extensions of our projected clustering algorithm to find also clusters with dependent attributes. There is also potential for the development of advanced visualization techniques. |
URI: | https://opendata.uni-halle.de//handle/1981185920/9994 http://dx.doi.org/10.25673/3209 |
Open Access: | Open access publication |
License: | In Copyright |
Appears in Collections: | Hochschulschriften bis zum 31.03.2009 |