Regularização de Entropia na Ativação: Impulsionando Controle Contínuo, Modelos de Linguagem de Grande Escala e Classificação de Imagens com Ativação como Restrições de Entropia
Entropy Regularizing Activation: Boosting Continuous Control, Large Language Models, and Image Classification with Activation as Entropy Constraints
October 9, 2025
Autores: Zilin Kang, Chonghua Liao, Tingqiang Xu, Huazhe Xu
cs.AI
Resumo
Propomos o ERA, um novo paradigma que restringe a entropia de amostragem acima de limiares específicos ao aplicar ativações especialmente projetadas às saídas dos modelos. Nossa abordagem demonstra ampla eficácia em diferentes domínios: 1) para modelos de linguagem de grande escala (LLMs), aumentando a pontuação AIME 2025 para o Qwen2.5-Math-7B em 37,4%; 2) para agentes de aprendizado por reforço em controle contínuo, melhorando o desempenho em mais de 30% em relação a baselines robustos como o SAC no desafiador HumanoidBench; 3) para classificação de imagens, aumentando a precisão top-1 do ImageNet em 0,69% para o ResNet-50. Esses ganhos são alcançados com uma sobrecarga computacional de menos de 7%. Nosso trabalho valida a ativação de saída como uma ferramenta poderosa para controle de entropia, abrindo uma nova direção para o design de algoritmos mais simples e robustos.
English
We propose ERA, a new paradigm that constrains the sampling entropy above
given thresholds by applying specially designed activations to the outputs of
models. Our approach demonstrates broad effectiveness across different domains:
1) for large language models(LLMs), boosting the AIME 2025 score for
Qwen2.5-Math-7B by 37.4%; 2) for continuous control reinforcement learning
agents, improving performance by more than 30% over strong baselines such as
SAC on the challenging HumanoidBench; 3) for image classification, enhancing
ImageNet top-1 accuracy by 0.69% for ResNet-50. These gains are achieved with a
computational overhead of less than 7%. Our work validates output activation as
a powerful tool for entropy control, opening a new direction for designing
simpler and more robust algorithms.