Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/112192
Title: Large scale partial- and near-duplicate image retrieval using spatial information of local features
Author(s): Ahmad Alyosef, Afra'a
Granting Institution: Otto-von-Guericke-Universität Magdeburg, Fakultät für Informatik
Issue Date: 2023
Extent: xxiii, 185 Seiten
Type: HochschulschriftLook up in the Integrated Authority File of the German National Library
Type: PhDThesis
Language: English
URN: urn:nbn:de:gbv:ma9:1-1981185920-1141502
Subjects: Maschinelles Sehen
Multimedia
Smart devices
Social media
Near-duplicate images
Abstract: The rapid development of smart devices and cameras together with the increased use of social media that support image sharing results in large amounts of redundant images. Many of these images can be characterized as near-duplicate images, that present the same scene but are captured by different users with different cameras, resolutions, scales or viewpoints. Moreover, image editing apps to modify and enhance images can be easily applied and produce even more near-duplicates, sometimes { intended or unintended { infringing copyrights of the creator. Therefore, methods to efficiently detect the correspondence between these near-duplicates in large datasets are valuable for commercial or legal reasons as well as for personal use as an aid to organize large image collections. Existing methods approach the problem of near-duplicate detection by either improving the local features, that describe specific areas in images, or by combining the benefits of two or more types of local and global features, that report details about all areas in an image. Unfortunately, these methods either tend to retrieve nonrelevant images on top of their result lists or have high computational requirements. Recent techniques to construct panorama images or detect copyright infringements utilize the spatial correlation among the corresponding features linking images. These techniques suffer from either low accuracy or expensive computation costs as well. In this thesis, we propose methods to improve and accelerate the usage of local features in algorithms for near-duplicate image retrieval. In addition, to enhance rankings of images in the retrieved list, we introduce an approach that combines information from local and global features to filter false positives. To determine the spatial correlation between near-duplicate images, we propose an algorithm that identifies whether compared images are similar { or have a similar region { and concurrently derive the kind of similarity { or the geometrical transformation { between them. The proposed algorithm does not require any prior knowledge about the content or image domain. We compare our algorithms to several existing state-of-the-art approaches for different retrieval tasks, namely, accelerating image retrieval, enhancing the ranking of relevant images in the retrieved list, rejecting non-relevant images and estimating the spatial correlation between images. Our experiments show that, in most cases, the performance of the proposed methods outperforms other hand-crafted approaches in some cases while having even lower computational costs.
Die rapide Entwicklung von Smart-Devices und Kameras in Kombination mit der gestiegenen Nutzung sozialer Medien - und deren Möglichkeiten Bilder untereinander auszutauschen - resultiert in enormen Mengen an redundanten Bildern. Viele dieser Bilder können als sog. Near-Duplicates bezeichnet werden, da sie die selbe Szene darstellen, jedoch durch verschiedene Nutzer mit unterschiedlichen Geräten, Auflösung, Maßstab oder Betrachtungswinkel aufgenommen wurden. Zahlreiche Anwendersoftware zum einfachen Editieren, Modifizieren und Verbessern von Bildern erhöhen die Anzahl der Near-Duplicates weiterhin und verletzen dabei manchmal { gewollt oder nicht { das Urheberrecht. Aus diesem Grund erweisen sich Methoden zur effizienten Detektierung der Übereinstimmung zwischen solchen Near-Duplicates, besonders in großen Datensätzen, als wertvolles Mittel sowohl aus kommerziellen als auch rechtlichen Gründen. Aber auch für den persönlichen Gebrauch bieten derartige Methoden ein Hilfsmittel zur Organisation großer Bildsammlungen. Aktuelle Methoden näheren sich dem Problem der Near-Duplicate Erkennung entweder durch die Verbesserung lokaler Bildmerkmale oder versuchen die Vorteile von mehreren lokalen und globalen Merkmals-Typen zu kombinieren. Erstere beschreiben spezifische Bereiche in den Bildern, Zweitere nutzen die Beschreibung von sämtlichen Details im ganzen Bild. Nachteile der aktuellen Methoden äußern sich entweder im Auffinden vieler nicht relevanter Bilder in den obersten Suchergebnissen { wenn die Erkennung als Retrieval Problem betrachtet wird - oder haben hohe Rechenkosten zur Folge. Die jüngsten Techniken, um z.B. Panorama-Bilder zu konstruieren oder um Urheberrechtsverletzungen zu finden, verwenden die räumliche übereinstimmung zwischen den korrespondierenden Merkmalen, die die Bilder miteinander verknüpfen. Aber auch diese Techniken haben Nachteile in puncto geringe Genauigkeit oder hoher Rechenkosten. In dieser Arbeit werden neue Methoden vorgestellt, welche die Verwendung lokaler Bildmerkmale beschleunigen und verbessern, um so zur Lösung der Aufgaben des Near-Duplicate-Retrievals beizutragen. Um zusätzlich die Rangfolge der Near- Duplicates in der Suchergebnisliste zu verbessern, wird ein optimierter/neuer Ansatz vorgestellt, der die lokalen und globalen Merkmale kombiniert und so die False- Positives minimiert. Um die räumliche übereinstimmung zwischen Near-Duplicates zu bestimmen, wird weiterhin ein Algorithmus beschrieben, der feststellt, ob die miteinander verglichenen Bilder ähnlich sind oder ähnliche Bereiche aufweisen. Dabei wird gleichzeitig die Art der ähnlichkeit sowie die Art der Modifikation (geometrische Transformation) bestimmt. Ein weiterer Vorteil des Algorithmus ist, dass kein Vorwissen über den Bildinhalt oder die Bilddomäne erforderlich ist. Die hier vorgestellten Algorithmen und Methoden werden mit verschiedenen, bereits existierenden State-of-the-Art Ansätzen bzgl. der Beschleunigung des Bild- Retrievals, der Verbesserung der Rangfolge der relevanten Bilder in der Ergebnisliste, dem Aussortieren von nicht relevanten Bildern und der Abschätzung der räumlichen übereinstimmung zwischen den Bildern verglichen. Die dafür durchgeführten Experimente zeigen, dass in den meisten Fällen die in dieser Arbeit vorgestellten neuen Verfahren die bisherigen Ansätze übertreffen oder zumindest die gleichen Ergebnisse liefern und dabei sogar teilweise geringere Rechenkosten verursachen.
URI: https://opendata.uni-halle.de//handle/1981185920/114150
http://dx.doi.org/10.25673/112192
Open Access: Open access publication
License: (CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0(CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0
Appears in Collections:Fakultät für Informatik

Files in This Item:
File Description SizeFormat 
Ahmad Alyosef_Afraa_Dissertation_2023.pdfDissertation16.1 MBAdobe PDFThumbnail
View/Open