Dançando em Correntes: Persuasão Estratégica na Réplica Acadêmica via Teoria da Mente

Resumo

Embora a inteligência artificial (IA) tenha se integrado profundamente em várias etapas do fluxo de trabalho de pesquisa e alcançado avanços notáveis, a réplica acadêmica permanece um desafio significativo e pouco explorado. Isto ocorre porque a réplica é um processo complexo de comunicação estratégica sob severa assimetria de informação, e não um simples debate técnico. Consequentemente, as abordagens atuais enfrentam dificuldades, pois imitam largamente a linguística superficial, perdendo o elemento essencial da tomada de perspectiva necessária para uma persuasão eficaz. Neste artigo, apresentamos o RebuttalAgent, o primeiro framework a fundamentar a réplica acadêmica na Teoria da Mente (ToM), operacionalizada por meio de um pipeline ToM-Estratégia-Resposta (TSR) que modela o estado mental do revisor, formula a estratégia de persuasão e gera uma resposta fundamentada na estratégia. Para treinar nosso agente, construímos o RebuttalBench, um conjunto de dados em larga escala sintetizado por meio de uma nova abordagem de crítica e refinamento. Nosso processo de treinamento consiste em duas etapas, começando com uma fase de ajuste fino supervisionado para equipar o agente com capacidades de análise baseada em ToM e planejamento estratégico, seguida por uma fase de aprendizagem por reforço que aproveita o mecanismo de autorrecompensa para a autoaprimoração escalável. Para uma avaliação automatizada confiável e eficiente, desenvolvemos ainda o Rebuttal-RM, um avaliador especializado treinado em mais de 100 mil amostras de dados de réplica de múltiplas fontes, que alcança uma consistência de pontuação com as preferências humanas superando o poderoso modelo de juiz GPT-4.1. Experimentos extensivos mostram que o RebuttalAgent supera significativamente o modelo base em uma média de 18,3% nas métricas automatizadas, ao mesmo tempo que supera modelos proprietários avançados tanto em avaliações automatizadas quanto humanas. Aviso: o conteúdo da réplica gerada é apenas para referência, para inspirar autores e auxiliar na redação. Não se destina a substituir a própria análise crítica e resposta do autor.

English

Although artificial intelligence (AI) has become deeply integrated into various stages of the research workflow and achieved remarkable advancements, academic rebuttal remains a significant and underexplored challenge. This is because rebuttal is a complex process of strategic communication under severe information asymmetry rather than a simple technical debate. Consequently, current approaches struggle as they largely imitate surface-level linguistics, missing the essential element of perspective-taking required for effective persuasion. In this paper, we introduce RebuttalAgent, the first framework to ground academic rebuttal in Theory of Mind (ToM), operationalized through a ToM-Strategy-Response (TSR) pipeline that models reviewer mental state, formulates persuasion strategy, and generates strategy-grounded response. To train our agent, we construct RebuttalBench, a large-scale dataset synthesized via a novel critique-and-refine approach. Our training process consists of two stages, beginning with a supervised fine-tuning phase to equip the agent with ToM-based analysis and strategic planning capabilities, followed by a reinforcement learning phase leveraging the self-reward mechanism for scalable self-improvement. For reliable and efficient automated evaluation, we further develop Rebuttal-RM, a specialized evaluator trained on over 100K samples of multi-source rebuttal data, which achieves scoring consistency with human preferences surpassing powerful judge GPT-4.1. Extensive experiments show RebuttalAgent significantly outperforms the base model by an average of 18.3% on automated metrics, while also outperforming advanced proprietary models across both automated and human evaluations. Disclaimer: the generated rebuttal content is for reference only to inspire authors and assist in drafting. It is not intended to replace the author's own critical analysis and response.