Please use this identifier to cite or link to this item:
http://dx.doi.org/10.25673/116468
Title: | Leveraging the potential of multi-layer networks for subgroup discovery |
Author(s): | Ramos Teixeira Puga, Clara |
Referee(s): | Spiliopoulou, Myra |
Granting Institution: | Otto-von-Guericke-Universität Magdeburg, Fakultät für Informatik |
Issue Date: | 2024 |
Extent: | XVI, 127 Seiten |
Type: | Hochschulschrift |
Type: | PhDThesis |
Exam Date: | 2024 |
Language: | English |
URN: | urn:nbn:de:gbv:ma9:1-1981185920-1184233 |
Subjects: | Künstliche Intelligenz Medizinische Mathematik medizinische Statistik |
Abstract: | Multi-layer networks have emerged as a powerful tool for representing complex
systems that exist in various domains, such as social networks and biological systems.
These networks are capable of encapsulating diverse interactions and relationships
across multiple dimensions, making them an ideal framework for modeling complex
systems.
This thesis explores the usefulness of multi-layer networks in modeling complex
systems and highlights their advantages in capturing subtle and nuanced relationships.
One domain where this approach is particularly useful is medical research, where
understanding heterogeneity among patient populations is crucial for personalized
treatment strategies.
Traditional clustering methods have been used though they are not able to capture
feature interaction, which can be useful in developing personalized treatment plans.
However, using multi-layer networks, this thesis demonstrates a novel approach to
subgroup discovery in medical research. By integrating various data modalities
such as genetic profiles, clinical variables, and environmental factors into a unified
multi-layer framework, the intricate interplay among these factors can be elucidated.
In addition to that, the thesis focuses on the complexity of patient data and
addresses the issue of cost associated with acquiring and processing features. Tradi-
tional methods tend to include all features available, which can lead to computational
inefficiencies and obscure relevant patterns. To tackle this challenge, the thesis
proposes a framework for feature selection within the multi-layer network paradigm,
taking cost into consideration. This approach aims to balance predictive performance
and resource utilization, making analyses more cost-effective. The proposed method
can be applied in real-world medical settings to derive valuable insights regarding
subgroups of patients/participants.
This thesis showcases the effectiveness of multi-layer networks in identifying patient
subgroups with distinct prognostic or therapeutic responses through a series of case
studies. The proposed methodology offers a comprehensive framework for stratifying
patient populations based on complex interactions, facilitating precision medicine
initiatives. Additionally, the interpretability of multi-layer networks allows for
identifying actionable insights and potential biomarkers, enhancing the translational
potential of research findings.
Overall, this thesis underscores the significance of multi-layer networks in unraveling
the complexity inherent in medical data. By harnessing the power of multi-layer
representations, researchers can gain deeper insights into the underlying mechanisms
driving disease progression and treatment outcomes, ultimately paving the way for
more effective and personalized healthcare interventions.
We introduce in this thesis two new techniques for identifying cost-aware subgroups
in multi-layer networks for both static and temporal data. We test these methods on
four different datasets with varying characteristics in terms of the number of time
points and the scarcity of values. Additionally, we compare the performance of our
methods with traditional clustering approaches that have been commonly used in
research. Multi-layer networks haben sich als leistungsfähiges Instrument zur Darstellung komplexer Systeme in verschiedenen Bereichen, wie z. B. soziale Netzweke und biolo- gische Systeme, erwiesen. Diese Netzwerke sind in der Lage, vielfältige Interaktionen und Beziehungen über mehrere Dimensionen hinweg zu erfassen, was sie zu einem idealen Rahmen für die Modellierung komplexer Systeme macht. In dieser Arbeit wird die Nützlichkeit von mehrschichtigen Netzweke bei der Modellierung komplexer Systeme untersucht und ihre Vorteile bei der Erfassung subtiler und nuancierter Beziehungen hervorgehoben. Ein Bereich, in dem dieser Ansatz besonders nützlich ist, ist die medizinische Forschung, in der das Verständ- nis der Heterogenität von Patientenpopulationen entscheidend für personalisierte Behandlungsstrategien ist. Die bisher verwendeten, herkömmlichen Clustering-Methoden sind nicht in der Lage Interaktionen von Merkmalen zu erfassen, was jedoch für die Entwicklung per- sonalisierter Behandlungspläne nützlich sein kann. In dieser Arbeit hingegen werden mehrschichtige Netzwerke als neuartiger Ansatz zur Entdeckung von Untergruppen in der medizinischen Forschung vorgestellt. Durch die Integration verschiedener Datenmodalitäten wie genetische Profile, klinische Variablen und Umweltfaktoren in ein einheitliches mehrschichtiges System kann das komplexe Zusammenspiel dieser Faktoren aufgeklärt werden. Darüber hinaus befasst sich die Arbeit mit der Komplexität von Patienten- /Patientinnendaten und mit der Frage der Kosten, die mit der Erfassung und Ver- arbeitung von Merkmalen verbunden sind. Herkömmliche Methoden sind meist so angelegt, dass sie alle verfügbaren Merkmale einbeziehen, was zu Ineffizienzen bei der Datenverarbeitung führen und relevante Muster verdecken kann. Um diese Heraus- forderung zu bewältigen, wird in dieser Arbeit ein Rahmen für die Merkmalsauswahl im Rahmen des Paradigmas des mehrschichtigen Netzwerkes unter Berücksichtigung der Kosten vorgeschlagen. Dieser Ansatz zielt darauf ab, ein Gleichgewicht zwischen der Vorhersageleistung und der Ressourcennutzung herzustellen, um die Analysen kosteneffizienter zu machen. Die vorgeschlagene Methode kann in realen medizinis- chen Umgebungen eingesetzt werden, um wertvolle Erkenntnisse über Untergruppen von verschiedener Populationen zu gewinnen. In dieser Arbeit wird die Wirksamkeit von mehrschichtigen Netzwerken bei der Identifizierung von Untergruppen von Patienten/Patientinnen mit unterschiedlichen prognostischen oder therapeutischen Verläufen anhand einer Reihe von Fallstudien aufgezeigt. Die vorgeschlagene Methodik bietet einen umfassenden Rahmen für die Stratifizierung von Patientenpopulationen auf der Grundlage komplexer Inter- aktionen und erleichtert damit Initiativen der Präzisionsmedizin. Darüber hinaus ermöglicht die Interpretierbarkeit von mehrschichtigen Netzwerken die Identifizierung von umsetzbaren Erkenntnissen und potenziellen Biomarkern, was das translationale Potenzial von Forschungsergebnissen erhöht. Insgesamt unterstreicht diese Arbeit die Bedeutung von mehrschichtigen Netzw- erken bei der Entschlüsselung der Komplexität medizinischer Daten. Durch die Nutzung der Leistungsfähigkeit mehrschichtiger Darstellungen können Forschende tiefere Einblicke in die zugrundeliegenden Mechanismen gewinnen, die Krankheitsver- läufe und Behandlungsergebnisse vorantreiben, was letztlich den Weg für effektivere und personalisierte Gesundheitsmaßnahmen ebnet. Diese Arbeit stellt zwei neue Verfahren zur Identifizierung kostenbewusster Unter- gruppen in mehrschichtigen Netzwerken für statische und zeitabhängige Daten vor. Diese Methoden werden an vier verschiedenen Datensätzen mit unterschiedlichen Merkmalen in Bezug auf die Anzahl der Zeitpunkte und die Knappheit der Werte getestet. Außerdem wird die Leistung dieser Methoden mit traditionellen Clustering- Ansätzen verglichen, die in der Forschung häufig verwendet werden. |
URI: | https://opendata.uni-halle.de//handle/1981185920/118423 http://dx.doi.org/10.25673/116468 |
Open Access: | Open access publication |
License: | (CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0 |
Appears in Collections: | Fakultät für Informatik |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Puga, Clara_Dissertation_2024.pdf | Dissertation | 14.81 MB | Adobe PDF | View/Open |