Relatório Técnico FunReason-MT: Superando a Barreira de Complexidade na Invocação de Funções em Múltiplos Turnos
FunReason-MT Technical Report: Overcoming the Complexity Barrier in Multi-Turn Function Calling
October 28, 2025
Autores: Zengzhuang Xu, Bingguang Hao, Zechuan Wang, Yuntao Wen, Maolin Wang, Yang Liu, Long Chen, Dong Wang, Yicheng Chen, Cunyin Peng, Chenyi Zhuang, Jinjie Gu, Leilei Gan, Xiangyu Zhao, Shi Gu
cs.AI
Resumo
A chamada de funções (CF) capacita grandes modelos de linguagem (LLMs) e agentes autónomos para interagir com ferramentas externas, uma capacidade crítica para resolver problemas complexos do mundo real. À medida que esta capacidade se torna cada vez mais central para sistemas de IA avançados, a necessidade de dados de treino de alta qualidade e multi-turn (várias interações) para a desenvolver e aperfeiçoar não pode ser exagerada. Os métodos existentes de síntese de dados, como amostragem aleatória de ambientes ou role-playing multi-agente, não são suficientemente poderosos para gerar dados de alta qualidade em ambientes do mundo real. Os desafios práticos apresentam-se em três vertentes: treino de modelos direcionado, isolamento da arquitetura de ferramentas e dependência lógica multi-turn. Para colmatar estas deficiências estruturais, apresentamos o FunReason-MT, um novo quadro de síntese de dados para o uso multi-turn de ferramentas no mundo real. O FunReason-MT resolve a barreira de complexidade nos dados de CF multi-turn empregando 1) Interações de Grafos Ambiente-API para recolher trajetórias variadas e de alta qualidade, 2) Síntese Avançada de Consultas-Ferramenta para simplificar a construção de consultas complexas, e 3) uma Cadeia Iterativa Guiada para a geração sofisticada de CoT (Cadeia de Pensamento). As avaliações no Berkeley Function-Calling Leaderboard (BFCLv3) demonstram o poder do nosso quadro: um modelo de 4B construído com base nos dados gerados pelo FunReason-MT alcança um desempenho state-of-the-art entre modelos de tamanho comparável, superando a maioria dos modelos closed-source. Melhorias adicionais de desempenho no BFCLv4 confirmam que o FunReason-MT fornece uma fonte fiável e robusta para a aprendizagem agentiva.
English
Function calling (FC) empowers large language models (LLMs) and autonomous
agents to interface with external tools, a critical capability for solving
complex, real-world problems. As this ability becomes increasingly central to
advanced AI systems, the need for high-quality, multi-turn training data to
develop and refine it cannot be overstated. Existing data synthesis methods,
such as random environment sampling or multi-agent role-playing, are not
powerful enough to generate high-quality data in real-world environments.
Practical challenges come in three folds: targeted model training, isolation of
tool architecture, and multi-turn logical dependency. To address these
structural deficiencies, we present FunReason-MT, a novel data synthesis
framework for real-world multi-turn tool use. FunReason-MT resolves the
complexity barrier in multi-turn FC data by employing 1) Environment-API Graph
Interactions to gather varied high-quality trajectories, 2) Advanced Tool-Query
Synthesis to simplify hard query construction, and 3) Guided Iterative Chain
for sophisticated CoT generation. Evaluations on Berkeley Function-Calling
Leaderboard (BFCLv3) demonstrate the power of our framework: a 4B model built
upon FunReason-MT generated data achieves state-of-the-art performance among
comparable-sized models, outperforming most close-source models. Further
performance improvements on BFCLv4 confirm that FunReason-MT provides a
reliable and robust source for agentic learning.