Rapporto Tecnico FunReason-MT: Superare la Barriera della Complessità nella Chiamata di Funzioni Multi-Turn
FunReason-MT Technical Report: Overcoming the Complexity Barrier in Multi-Turn Function Calling
October 28, 2025
Autori: Zengzhuang Xu, Bingguang Hao, Zechuan Wang, Yuntao Wen, Maolin Wang, Yang Liu, Long Chen, Dong Wang, Yicheng Chen, Cunyin Peng, Chenyi Zhuang, Jinjie Gu, Leilei Gan, Xiangyu Zhao, Shi Gu
cs.AI
Abstract
La chiamata di funzione (FC) consente ai grandi modelli linguistici (LLM) e agli agenti autonomi di interfacciarsi con strumenti esterni, un'abilità cruciale per risolvere problemi complessi del mondo reale. Man mano che questa capacità diventa sempre più centrale per i sistemi di IA avanzati, non si può sopravvalutare la necessità di dati di addestramento di alta qualità e multi-turn per svilupparla e affinarla. I metodi esistenti di sintesi dei dati, come il campionamento casuale dell'ambiente o il role-playing multi-agente, non sono sufficientemente potenti per generare dati di alta qualità in ambienti reali. Le sfide pratiche si presentano su tre fronti: addestramento mirato del modello, isolamento dell'architettura degli strumenti e dipendenza logica multi-turn. Per affrontare queste carenze strutturali, presentiamo FunReason-MT, un nuovo framework di sintesi dei dati per l'uso multi-turn di strumenti nel mondo reale. FunReason-MT risolve la barriera di complessità nei dati FC multi-turn impiegando 1) Interazioni Grafico-API Ambientale per raccogliere traiettorie varie e di alta qualità, 2) Sintesi Avanzata Tool-Query per semplificare la costruzione di query complesse, e 3) Catena Iterativa Guidata per la generazione sofisticata di CoT. Le valutazioni sulla Berkeley Function-Calling Leaderboard (BFCLv3) dimostrano la potenza del nostro framework: un modello da 4B costruito sui dati generati da FunReason-MT raggiunge prestazioni all'avanguardia tra i modelli di dimensioni comparabili, superando la maggior parte dei modelli closed-source. Ulteriori miglioramenti delle prestazioni su BFCLv4 confermano che FunReason-MT fornisce una fonte affidabile e robusta per l'apprendimento agentico.
English
Function calling (FC) empowers large language models (LLMs) and autonomous
agents to interface with external tools, a critical capability for solving
complex, real-world problems. As this ability becomes increasingly central to
advanced AI systems, the need for high-quality, multi-turn training data to
develop and refine it cannot be overstated. Existing data synthesis methods,
such as random environment sampling or multi-agent role-playing, are not
powerful enough to generate high-quality data in real-world environments.
Practical challenges come in three folds: targeted model training, isolation of
tool architecture, and multi-turn logical dependency. To address these
structural deficiencies, we present FunReason-MT, a novel data synthesis
framework for real-world multi-turn tool use. FunReason-MT resolves the
complexity barrier in multi-turn FC data by employing 1) Environment-API Graph
Interactions to gather varied high-quality trajectories, 2) Advanced Tool-Query
Synthesis to simplify hard query construction, and 3) Guided Iterative Chain
for sophisticated CoT generation. Evaluations on Berkeley Function-Calling
Leaderboard (BFCLv3) demonstrate the power of our framework: a 4B model built
upon FunReason-MT generated data achieves state-of-the-art performance among
comparable-sized models, outperforming most close-source models. Further
performance improvements on BFCLv4 confirm that FunReason-MT provides a
reliable and robust source for agentic learning.