Modelagem de Raciocínio Matemático Complexo via MathAgent Baseado em Modelo de Linguagem de Grande Escala

Resumo

Modelos de linguagem de grande escala (LLMs) enfrentam desafios ao resolver problemas matemáticos complexos que exigem capacidades abrangentes para analisar as afirmações, associar conhecimentos de domínio, realizar raciocínio lógico composto e integrar as racionalizações intermediárias. Abordar todos esses problemas de uma vez pode ser árduo para os LLMs, levando assim à confusão na geração. Neste trabalho, exploramos o potencial de aprimorar os LLMs com agentes por meio da decomposição meticulosa e modelagem do processo de raciocínio matemático. Especificamente, propomos uma descrição formal da resolução matemática e estendemos os LLMs com uma estrutura zero-shot baseada em agentes chamada Planejador-Raciocinador-Executor-Refletor (PRER). Além disso, fornecemos e implementamos dois MathAgents que definem as formas lógicas e relações inerentes por meio de um conjunto de ações em diferentes granularidades e orientações: o MathAgent-M adapta suas ações aos LLMs, enquanto o MathAgent-H se alinha com a humanidade. Experimentos no miniF2F e MATH demonstraram a eficácia do PRER e dos MathAgents propostos, alcançando um aumento de 12,3% (53,9%→66,2%) no miniF2F, 9,2% (49,8%→59,0%) no MATH e 13,2% (23,2%→35,4%) para problemas de nível 5 do MATH em comparação com o GPT-4. Resultados analíticos adicionais fornecem perspectivas mais profundas sobre a exploração dos comportamentos dos LLMs como agentes.

English

Large language models (LLMs) face challenges in solving complex mathematical problems that require comprehensive capacities to parse the statements, associate domain knowledge, perform compound logical reasoning, and integrate the intermediate rationales. Tackling all these problems once could be arduous for LLMs, thus leading to confusion in generation. In this work, we explore the potential of enhancing LLMs with agents by meticulous decomposition and modeling of mathematical reasoning process. Specifically, we propose a formal description of the mathematical solving and extend LLMs with an agent-based zero-shot framework named Planner-Reasoner-Executor-Reflector (PRER). We further provide and implement two MathAgents that define the logical forms and inherent relations via a pool of actions in different grains and orientations: MathAgent-M adapts its actions to LLMs, while MathAgent-H aligns with humankind. Experiments on miniF2F and MATH have demonstrated the effectiveness of PRER and proposed MathAgents, achieving an increase of 12.3%(53.9%66.2%) on the MiniF2F, 9.2% (49.8%59.0%) on MATH, and 13.2%(23.2%35.4%) for level-5 problems of MATH against GPT-4. Further analytical results provide more insightful perspectives on exploiting the behaviors of LLMs as agents.

Modelagem de Raciocínio Matemático Complexo via MathAgent Baseado em Modelo de Linguagem de Grande Escala

Modeling Complex Mathematical Reasoning via Large Language Model based MathAgent

Resumo

Support