ChatPaper.aiChatPaper

Equivariância em Escala Local com Canonificador de Equilíbrio Profundo Latente

Local Scale Equivariance with Latent Deep Equilibrium Canonicalizer

August 19, 2025
Autores: Md Ashiqur Rahman, Chiao-An Yang, Michael N. Cheng, Lim Jun Hao, Jeremiah Jiang, Teck-Yian Lim, Raymond A. Yeh
cs.AI

Resumo

A variação de escala é um desafio fundamental na visão computacional. Objetos da mesma classe podem ter tamanhos diferentes, e seu tamanho percebido é ainda mais afetado pela distância da câmera. Essas variações são locais aos objetos, ou seja, diferentes tamanhos de objetos podem mudar de maneira distinta dentro da mesma imagem. Para lidar efetivamente com as variações de escala, apresentamos um canonizador de equilíbrio profundo (DEC, na sigla em inglês) para melhorar a equivariância de escala local de um modelo. O DEC pode ser facilmente incorporado em arquiteturas de rede existentes e pode ser adaptado a um modelo pré-treinado. Notavelmente, mostramos que, no competitivo benchmark ImageNet, o DEC melhora tanto o desempenho do modelo quanto a consistência de escala local em quatro redes profundas pré-treinadas populares, como ViT, DeiT, Swin e BEiT. Nosso código está disponível em https://github.com/ashiq24/local-scale-equivariance.
English
Scale variation is a fundamental challenge in computer vision. Objects of the same class can have different sizes, and their perceived size is further affected by the distance from the camera. These variations are local to the objects, i.e., different object sizes may change differently within the same image. To effectively handle scale variations, we present a deep equilibrium canonicalizer (DEC) to improve the local scale equivariance of a model. DEC can be easily incorporated into existing network architectures and can be adapted to a pre-trained model. Notably, we show that on the competitive ImageNet benchmark, DEC improves both model performance and local scale consistency across four popular pre-trained deep-nets, e.g., ViT, DeiT, Swin, and BEiT. Our code is available at https://github.com/ashiq24/local-scale-equivariance.
PDF33August 21, 2025