ChatPaper.aiChatPaper

Kunnen OOD Object Detectoren Leren van Stichtingsmodellen?

Can OOD Object Detectors Learn from Foundation Models?

September 8, 2024
Auteurs: Jiahui Liu, Xin Wen, Shizhen Zhao, Yingxian Chen, Xiaojuan Qi
cs.AI

Samenvatting

Het detecteren van objecten buiten de distributie (OOD) is een uitdagende taak vanwege het ontbreken van open-set OOD-gegevens. Geïnspireerd door recente ontwikkelingen in tekst-naar-afbeelding generatieve modellen, zoals Stable Diffusion, bestuderen we het potentieel van generatieve modellen die zijn getraind op grootschalige open-set gegevens om OOD-monsters te synthetiseren, waardoor de detectie van OOD-objecten wordt verbeterd. We introduceren SyncOOD, een eenvoudige methode voor gegevenscuratie die profiteert van de mogelijkheden van grote foundation-modellen om automatisch betekenisvolle OOD-gegevens te extraheren uit tekst-naar-afbeelding generatieve modellen. Dit biedt het model toegang tot open-world kennis die is ingekapseld in kant-en-klare foundation-modellen. De synthetische OOD-monsters worden vervolgens gebruikt om de training van een lichtgewicht, plug-and-play OOD-detector aan te vullen, waardoor de in-distributie (ID)/OOD-beslissingsgrenzen effectief worden geoptimaliseerd. Uitgebreide experimenten over meerdere benchmarks tonen aan dat SyncOOD aanzienlijk beter presteert dan bestaande methoden, waarbij een nieuwe state-of-the-art prestatie wordt vastgesteld met minimaal gebruik van synthetische gegevens.
English
Out-of-distribution (OOD) object detection is a challenging task due to the absence of open-set OOD data. Inspired by recent advancements in text-to-image generative models, such as Stable Diffusion, we study the potential of generative models trained on large-scale open-set data to synthesize OOD samples, thereby enhancing OOD object detection. We introduce SyncOOD, a simple data curation method that capitalizes on the capabilities of large foundation models to automatically extract meaningful OOD data from text-to-image generative models. This offers the model access to open-world knowledge encapsulated within off-the-shelf foundation models. The synthetic OOD samples are then employed to augment the training of a lightweight, plug-and-play OOD detector, thus effectively optimizing the in-distribution (ID)/OOD decision boundaries. Extensive experiments across multiple benchmarks demonstrate that SyncOOD significantly outperforms existing methods, establishing new state-of-the-art performance with minimal synthetic data usage.

Summary

AI-Generated Summary

PDF92November 16, 2024