Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/37216
Title: Visual analytics of epidemiological and multi-omics data
Author(s): Alemzadeh, Shiva
Referee(s): Preim, BernhardLook up in the Integrated Authority File of the German National Library
Granting Institution: Otto-von-Guericke-Universität Magdeburg, Fakultät für Informatik
Issue Date: 2021
Extent: x, 132 Seiten
Type: HochschulschriftLook up in the Integrated Authority File of the German National Library
Type: PhDThesis
Exam Date: 2021
Language: English
URN: urn:nbn:de:gbv:ma9:1-1981185920-374501
Subjects: Maschinelles Sehen
Computergraphik
Abstract: Kohortenstudien zielen darauf ab, Risikofaktoren zu identifizieren, die den Gesundheitszustand einer Bevölkerung in Bezug auf bestimmte Krankheiten beeinflussen können. In der Epidemiologie werden die Teilnehmer von Gesundheitsstudien zur Ermittlung der Risikofaktoren einer Krankheit hinsichtlich verschiedener gesundheitsbezogener Aspekte beobachtet, die bei der Entwicklung der Zielkrankheit eine Rolle spielen können. Diese Aspekte umfassten viele Faktoren wie Lebensstil (z. B. Rauchen oder Alkoholkonsum) oderMedikamente (z. B. Drogenkonsum), aktuelle Gesundheit (z. B. Diabetes oder erhöhter Blutdruck) und soziodemografische Faktoren (z. B. Geschlecht, Familienstand). UmdieDaten zu sammeln,werden Personen eingeladen, an der Studie teilzunehmen. Die Informationen von den Individuen werden durch Interviews erhalten, z.B. Fragen zu ihren Gewohnheiten und demaktuellen Gesundheitszustand. Darüber hinaus werden medizinische Bilder akquiriert, umAnomalien zu entdecken, z.B. erhöhte Brustdichte. In Kohortenstudien werden dieselben Personen erneut zur Studie eingeladen, umdie Untersuchungen zu wiederholen und die zeitlichen Veränderungen zu beobachten. Der Zweck dieser Nachuntersuchungen besteht darin, den möglichen Zusammenhang zwischen den Krankheiten und den Risikofaktoren zu identifizieren. Fehlende Daten sind jedoch ein unvermeidlicher Bestandteil solcher Studien, bei denen einige Personen aus der Studie ausscheiden oder die Aufzeichnungen unvollständig sind. Diese Arbeit bietet halbüberwachte visuelle Analyse-Frameworks, um diskriminierende Subpopulationen in Kohortenstudiendaten zu untersuchen und zu entdecken. Um dies zu erreichen, bieten interaktiv koordinierte Mehrfachansichtsysteme die Möglichkeit, um die verschiedenen Assoziationen zwischen Daten und Funktionen zu untersuchen. Mit S-ADVIsED kann der Analyst die Ergebnisse des Subspace-Clusters untersuchen und visuell validieren. Mit DiscoVA kann der Analyst Subpopulationen anhand verschiedener Datentypen (z. B.Multi-Omics und klinische Daten) identifizieren. Umfehlende Daten in Längsschnittstudiendaten zu behandeln, bietet das VIVID Framework außerdem Methoden zur Imputation (z. B. Mehrfachimputation) und zur Überprüfung der Plausibilität der Ergebnisse
Cohort studies aim to identify risk factors that may influence the health conditions of a population regarding specific diseases. In epidemiology science, to discover the risk factors of a disease, the cohort individuals are observed regarding different health-related aspects that may have a role in developing the target disease. These aspects involved many factors like lifestyle (e.g. smoking or alcohol consumption), or medicament (e.g. taking drugs), current health situations (e.g. diabetes or having elevated blood pressure), and socio-demographic factors (e.g. gender,marital status). To collect the data, people are invited to join the study via advertisements. The information from the individuals is acquired by having interviews, e.g. asking questions about their habits examinations and doing to find out the current health condition of individuals. Moreover, medical images are prepared to discover probable abnormalities, e.g. breast density. In cohort study data, the same individuals are re-invited to the study to repeat the examinations and observe the changes over time in different time points. The purpose of these follow-ups is to identify the possible link between the diseases and risk factors. However,missing data are an inevitable part of such studies where some individuals drop from the study of the records is incomplete. This thesis provides semi-supervised visual analytics frameworks to explore and discover discriminative subpopulations in cohort study data. To reach this, interactive coordinated multiple views systems provide a platform to investigate the different associations between the data and features. S-ADVIsED enables the analyst to explore the results of subspace clustering and also validate the results visually. DiscoVA enables the analyst to identify subpopulations using different data types (e.g. multi-omics and clinical data). Additionally, to handle missing data in longitudinal study data, VIVID framework provides the methods to explore and impute (e.g. multiple imputation) the missing values. Moreover, it allows the expert to check the plausibility of the results.
URI: https://opendata.uni-halle.de//handle/1981185920/37450
http://dx.doi.org/10.25673/37216
Open Access: Open access publication
License: (CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0(CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0
Appears in Collections:Fakultät für Informatik

Files in This Item:
File Description SizeFormat 
Alemzadeh_Shiva_Dissertation_2021.pdfDissertation35.36 MBAdobe PDFThumbnail
View/Open