ChatPaper.aiChatPaper

Equivariancia Local de Escala con Canonizador de Equilibrio Profundo Latente

Local Scale Equivariance with Latent Deep Equilibrium Canonicalizer

August 19, 2025
Autores: Md Ashiqur Rahman, Chiao-An Yang, Michael N. Cheng, Lim Jun Hao, Jeremiah Jiang, Teck-Yian Lim, Raymond A. Yeh
cs.AI

Resumen

La variación de escala es un desafío fundamental en visión por computadora. Los objetos de la misma clase pueden tener diferentes tamaños, y su tamaño percibido se ve aún más afectado por la distancia a la cámara. Estas variaciones son locales a los objetos, es decir, diferentes tamaños de objetos pueden cambiar de manera distinta dentro de la misma imagen. Para manejar eficazmente las variaciones de escala, presentamos un canonizador de equilibrio profundo (DEC, por sus siglas en inglés) para mejorar la equivariancia de escala local de un modelo. DEC puede incorporarse fácilmente en arquitecturas de red existentes y puede adaptarse a un modelo preentrenado. Cabe destacar que demostramos que, en el competitivo benchmark de ImageNet, DEC mejora tanto el rendimiento del modelo como la consistencia de escala local en cuatro redes profundas preentrenadas populares, como ViT, DeiT, Swin y BEiT. Nuestro código está disponible en https://github.com/ashiq24/local-scale-equivariance.
English
Scale variation is a fundamental challenge in computer vision. Objects of the same class can have different sizes, and their perceived size is further affected by the distance from the camera. These variations are local to the objects, i.e., different object sizes may change differently within the same image. To effectively handle scale variations, we present a deep equilibrium canonicalizer (DEC) to improve the local scale equivariance of a model. DEC can be easily incorporated into existing network architectures and can be adapted to a pre-trained model. Notably, we show that on the competitive ImageNet benchmark, DEC improves both model performance and local scale consistency across four popular pre-trained deep-nets, e.g., ViT, DeiT, Swin, and BEiT. Our code is available at https://github.com/ashiq24/local-scale-equivariance.
PDF22August 21, 2025