FunReason-MT Technischer Bericht: Überwindung der Komplexitätsbarriere bei Mehrschritt-Funktionsaufrufen
FunReason-MT Technical Report: Overcoming the Complexity Barrier in Multi-Turn Function Calling
October 28, 2025
papers.authors: Zengzhuang Xu, Bingguang Hao, Zechuan Wang, Yuntao Wen, Maolin Wang, Yang Liu, Long Chen, Dong Wang, Yicheng Chen, Cunyin Peng, Chenyi Zhuang, Jinjie Gu, Leilei Gan, Xiangyu Zhao, Shi Gu
cs.AI
papers.abstract
Funktion Calling (FC) ermöglicht es großen Sprachmodellen (LLMs) und autonomen Agenten, mit externen Werkzeugen zu interagieren – eine entscheidende Fähigkeit zur Lösung komplexer, realer Probleme. Da diese Fähigkeit für fortschrittliche KI-Systeme zunehmend zentral wird, ist die Notwendigkeit hochwertiger, mehrstufiger Trainingsdaten zu ihrer Entwicklung und Verfeinerung nicht zu unterschätzen. Bestehende Methoden zur Datensynthese, wie zufällige Umgebungsstichproben oder Multi-Agenten-Rollenspiele, sind nicht leistungsfähig genug, um hochwertige Daten in realen Umgebungen zu erzeugen. Die praktischen Herausforderungen sind dreifach: gezieltes Modelltraining, Isolierung der Werkzeugarchitektur und mehrstufige logische Abhängigkeiten. Um diese strukturellen Mängel zu beheben, stellen wir FunReason-MT vor, ein neuartiges Framework zur Datensynthese für mehrstufigen Werkzeugeinsatz in der realen Welt. FunReason-MT überwindet die Komplexitätsbarriere bei mehrstufigen FC-Daten durch den Einsatz von 1) Umgebungs-API-Graph-Interaktionen zur Erfassung vielfältiger, hochwertiger Trajektorien, 2) Erweiterter Werkzeug-Abfrage-Synthese zur Vereinfachung der Erstellung anspruchsvoller Abfragen und 3) einer Geführten Iterativen Kette zur Generierung anspruchsvoller Denkketten (CoT). Evaluationen auf dem Berkeley Function-Calling Leaderboard (BFCLv3) belegen die Stärke unseres Frameworks: Ein auf mit FunReason-MT generierten Daten trainiertes 4B-Modell erzielt state-of-the-art Leistung unter Modellen vergleichbarer Größe und übertrifft die meisten Closed-Source-Modelle. Weitere Leistungssteigerungen auf BFCLv4 bestätigen, dass FunReason-MT eine zuverlässige und robuste Quelle für agentenbasiertes Lernen darstellt.
English
Function calling (FC) empowers large language models (LLMs) and autonomous
agents to interface with external tools, a critical capability for solving
complex, real-world problems. As this ability becomes increasingly central to
advanced AI systems, the need for high-quality, multi-turn training data to
develop and refine it cannot be overstated. Existing data synthesis methods,
such as random environment sampling or multi-agent role-playing, are not
powerful enough to generate high-quality data in real-world environments.
Practical challenges come in three folds: targeted model training, isolation of
tool architecture, and multi-turn logical dependency. To address these
structural deficiencies, we present FunReason-MT, a novel data synthesis
framework for real-world multi-turn tool use. FunReason-MT resolves the
complexity barrier in multi-turn FC data by employing 1) Environment-API Graph
Interactions to gather varied high-quality trajectories, 2) Advanced Tool-Query
Synthesis to simplify hard query construction, and 3) Guided Iterative Chain
for sophisticated CoT generation. Evaluations on Berkeley Function-Calling
Leaderboard (BFCLv3) demonstrate the power of our framework: a 4B model built
upon FunReason-MT generated data achieves state-of-the-art performance among
comparable-sized models, outperforming most close-source models. Further
performance improvements on BFCLv4 confirm that FunReason-MT provides a
reliable and robust source for agentic learning.