ChatPaper.aiChatPaper

MAPS: Um Framework Multiagente Baseado na Personalidade Big Seven e Orientação Socrática para Resolução de Problemas Científicos Multimodais

MAPS: A Multi-Agent Framework Based on Big Seven Personality and Socratic Guidance for Multimodal Scientific Problem Solving

March 21, 2025
Autores: Jian Zhang, Zhiyuan Wang, Zhangqi Wang, Xinyu Zhang, Fangzhi Xu, Qika Lin, Rui Mao, Erik Cambria, Jun Liu
cs.AI

Resumo

Problemas científicos multimodais (MSPs) envolvem questões complexas que exigem a integração de múltiplas modalidades, como texto e diagramas, representando um desafio significativo na inteligência artificial. Embora progressos tenham sido feitos na abordagem de problemas científicos tradicionais, os MSPs ainda enfrentam duas questões principais: o desafio do raciocínio abrangente multimodal na resolução de problemas científicos e a falta de capacidades reflexivas e de repensar. Para abordar essas questões, introduzimos um framework Multi-Agente baseado na Personalidade Big Seven e na orientação socrática (MAPS). Esse framework emprega sete agentes distintos que utilizam mecanismos de feedback e o método socrático para guiar a resolução de MSPs. Para lidar com a primeira questão, propomos uma estratégia de resolução progressiva com quatro agentes, onde cada agente se concentra em uma etapa específica do processo de resolução de problemas. Para a segunda questão, introduzimos um agente Crítico, inspirado no questionamento socrático, que promove o pensamento crítico e estimula a aprendizagem autônoma. Realizamos extensos experimentos nos conjuntos de dados EMMA, Olimpíada e MathVista, alcançando resultados promissores que superam o modelo SOTA atual em 15,84% em todas as tarefas. Enquanto isso, os experimentos analíticos adicionais também verificam o progresso do modelo, bem como sua capacidade de generalização.
English
Multimodal scientific problems (MSPs) involve complex issues that require the integration of multiple modalities, such as text and diagrams, presenting a significant challenge in artificial intelligence. While progress has been made in addressing traditional scientific problems, MSPs still face two primary issues: the challenge of multi-modal comprehensive reasoning in scientific problem-solving and the lack of reflective and rethinking capabilities. To address these issues, we introduce a Multi-Agent framework based on the Big Seven Personality and Socratic guidance (MAPS). This framework employs seven distinct agents that leverage feedback mechanisms and the Socratic method to guide the resolution of MSPs. To tackle the first issue, we propose a progressive four-agent solving strategy, where each agent focuses on a specific stage of the problem-solving process. For the second issue, we introduce a Critic agent, inspired by Socratic questioning, which prompts critical thinking and stimulates autonomous learning. We conduct extensive experiments on the EMMA, Olympiad, and MathVista datasets, achieving promising results that outperform the current SOTA model by 15.84% across all tasks. Meanwhile, the additional analytical experiments also verify the model's progress as well as generalization ability.

Summary

AI-Generated Summary

PDF542March 24, 2025