Aprender Além da Resposta: Treinando Modelos de Linguagem com Reflexão para Raciocínio Matemático

Resumo

O ajuste fino supervisionado aprimora as habilidades de resolução de problemas dos modelos de linguagem em diversas tarefas de raciocínio matemático. Para maximizar esses benefícios, pesquisas existentes concentram-se em ampliar o conjunto de treinamento com várias técnicas de aumento de dados, o que é eficaz para cenários padrão de perguntas e respostas de rodada única. Nosso trabalho introduz uma técnica inovadora voltada para cultivar uma compreensão mais profunda dos problemas de treinamento em questão, melhorando o desempenho não apenas em cenários padrão, mas também em situações mais complexas que exigem pensamento reflexivo. Especificamente, propomos o aumento reflexivo, um método que incorpora a reflexão sobre o problema em cada instância de treinamento. Ele treina o modelo para considerar perspectivas alternativas e engajar-se com abstrações e analogias, promovendo assim uma compreensão abrangente por meio do raciocínio reflexivo. Experimentos extensivos validam a conquista de nosso objetivo, destacando as vantagens únicas de nosso método e sua natureza complementar em relação às técnicas de aumento existentes.

English

Supervised fine-tuning enhances the problem-solving abilities of language models across various mathematical reasoning tasks. To maximize such benefits, existing research focuses on broadening the training set with various data augmentation techniques, which is effective for standard single-round question-answering settings. Our work introduces a novel technique aimed at cultivating a deeper understanding of the training problems at hand, enhancing performance not only in standard settings but also in more complex scenarios that require reflective thinking. Specifically, we propose reflective augmentation, a method that embeds problem reflection into each training instance. It trains the model to consider alternative perspectives and engage with abstractions and analogies, thereby fostering a thorough comprehension through reflective reasoning. Extensive experiments validate the achievement of our aim, underscoring the unique advantages of our method and its complementary nature relative to existing augmentation techniques.

Aprender Além da Resposta: Treinando Modelos de Linguagem com Reflexão para Raciocínio Matemático

Learn Beyond The Answer: Training Language Models with Reflection for Mathematical Reasoning

Resumo

Support