ChatPaper.aiChatPaper

¿Pueden los detectores de objetos OOD aprender de modelos base?

Can OOD Object Detectors Learn from Foundation Models?

September 8, 2024
Autores: Jiahui Liu, Xin Wen, Shizhen Zhao, Yingxian Chen, Xiaojuan Qi
cs.AI

Resumen

La detección de objetos fuera de distribución (OOD, por sus siglas en inglés) es una tarea desafiante debido a la ausencia de datos OOD de conjunto abierto. Inspirados por los avances recientes en modelos generativos de texto a imagen, como Difusión Estable, estudiamos el potencial de los modelos generativos entrenados en datos de conjunto abierto a gran escala para sintetizar muestras OOD, mejorando así la detección de objetos OOD. Presentamos SyncOOD, un método simple de curación de datos que aprovecha las capacidades de los modelos base a gran escala para extraer automáticamente datos OOD significativos de los modelos generativos de texto a imagen. Esto brinda al modelo acceso al conocimiento de mundo abierto encapsulado dentro de los modelos base listos para usar. Las muestras OOD sintéticas se utilizan luego para aumentar el entrenamiento de un detector OOD ligero y fácil de usar, optimizando de manera efectiva los límites de decisión en distribución (ID)/OOD. Experimentos extensos en múltiples benchmarks demuestran que SyncOOD supera significativamente a los métodos existentes, estableciendo un nuevo rendimiento de vanguardia con un uso mínimo de datos sintéticos.
English
Out-of-distribution (OOD) object detection is a challenging task due to the absence of open-set OOD data. Inspired by recent advancements in text-to-image generative models, such as Stable Diffusion, we study the potential of generative models trained on large-scale open-set data to synthesize OOD samples, thereby enhancing OOD object detection. We introduce SyncOOD, a simple data curation method that capitalizes on the capabilities of large foundation models to automatically extract meaningful OOD data from text-to-image generative models. This offers the model access to open-world knowledge encapsulated within off-the-shelf foundation models. The synthetic OOD samples are then employed to augment the training of a lightweight, plug-and-play OOD detector, thus effectively optimizing the in-distribution (ID)/OOD decision boundaries. Extensive experiments across multiple benchmarks demonstrate that SyncOOD significantly outperforms existing methods, establishing new state-of-the-art performance with minimal synthetic data usage.

Summary

AI-Generated Summary

PDF92November 16, 2024