Auf dem Weg zu allgemeiner agentenbasierter Intelligenz durch Skalierung der Umgebung
Towards General Agentic Intelligence via Environment Scaling
September 16, 2025
papers.authors: Runnan Fang, Shihao Cai, Baixuan Li, Jialong Wu, Guangyu Li, Wenbiao Yin, Xinyu Wang, Xiaobin Wang, Liangcai Su, Zhen Zhang, Shibin Wu, Zhengwei Tao, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou
cs.AI
papers.abstract
Fortgeschrittene agentenbasierte Intelligenz ist eine Voraussetzung für den Einsatz von Large Language Models in praktischen, realen Anwendungen. Verschiedene reale APIs erfordern präzise, robuste Funktionsaufruf-Intelligenz, die Agenten durch Interaktion in unterschiedlichen Umgebungen entwickeln müssen. Die Breite der Funktionsaufruf-Kompetenz ist eng mit der Vielfalt der Umgebungen verbunden, in denen Agenten trainiert werden. In dieser Arbeit skalieren wir Umgebungen als einen Schritt zur Weiterentwicklung allgemeiner agentenbasierter Intelligenz. Dies führt zu zwei zentralen Herausforderungen: (i) wie man Umgebungen auf prinzipielle Weise skaliert und (ii) wie man agentenbasierte Fähigkeiten effektiv aus Erfahrungen trainiert, die durch Interaktionen mit diesen Umgebungen gewonnen werden. Um diese zu bewältigen, entwerfen wir ein skalierbares Framework, das automatisch heterogene, vollständig simulierte Umgebungen konstruiert und systematisch den Raum der Funktionsaufruf-Szenarien erweitert. Wir passen außerdem eine zweiphasige Feinabstimmungsstrategie für Agenten an: Zunächst statten wir Agenten mit grundlegenden agentenbasierten Fähigkeiten aus, bevor wir sie für domänenspezifische Kontexte spezialisieren. Umfangreiche Experimente auf agentenbasierten Benchmarks, tau-bench, tau2-Bench und ACEBench, zeigen, dass unser trainiertes Modell, AgentScaler, die Funktionsaufruf-Fähigkeit von Modellen signifikant verbessert.
English
Advanced agentic intelligence is a prerequisite for deploying Large Language
Models in practical, real-world applications. Diverse real-world APIs demand
precise, robust function-calling intelligence, which needs agents to develop
these capabilities through interaction in varied environments. The breadth of
function-calling competence is closely tied to the diversity of environments in
which agents are trained. In this work, we scale up environments as a step
towards advancing general agentic intelligence. This gives rise to two central
challenges: (i) how to scale environments in a principled manner, and (ii) how
to effectively train agentic capabilities from experiences derived through
interactions with these environments. To address these, we design a scalable
framework that automatically constructs heterogeneous environments that are
fully simulated, systematically broadening the space of function-calling
scenarios. We further adapt a two-phase agent fine-tuning strategy: first
endowing agents with fundamental agentic capabilities, then specializing them
for domain-specific contexts. Extensive experiments on agentic benchmarks,
tau-bench, tau2-Bench, and ACEBench, demonstrate that our trained model,
AgentScaler, significantly enhances the function-calling capability of models.