Naar Algemene Agentische Intelligentie via Schaalvergroting van de Omgeving
Towards General Agentic Intelligence via Environment Scaling
September 16, 2025
Auteurs: Runnan Fang, Shihao Cai, Baixuan Li, Jialong Wu, Guangyu Li, Wenbiao Yin, Xinyu Wang, Xiaobin Wang, Liangcai Su, Zhen Zhang, Shibin Wu, Zhengwei Tao, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou
cs.AI
Samenvatting
Geavanceerde agentische intelligentie is een vereiste voor het inzetten van grote taalmodel(len) in praktische, real-world toepassingen. Diverse real-world API's vereisen precieze, robuuste functie-aanroepintelligentie, waarvoor agents deze capaciteiten moeten ontwikkelen door interactie in uiteenlopende omgevingen. De breedte van de functie-aanroepcompetentie hangt nauw samen met de diversiteit van de omgevingen waarin agents worden getraind. In dit werk schalen we omgevingen op als een stap richting het bevorderen van algemene agentische intelligentie. Dit leidt tot twee centrale uitdagingen: (i) hoe omgevingen op een principiële manier op te schalen, en (ii) hoe agentische capaciteiten effectief te trainen op basis van ervaringen die voortkomen uit interacties met deze omgevingen. Om deze uitdagingen aan te pakken, ontwerpen we een schaalbaar framework dat automatisch heterogene omgevingen construeert die volledig gesimuleerd zijn, waardoor de ruimte van functie-aanroepscenario's systematisch wordt verbreed. We passen verder een tweefasenstrategie voor agent-finetuning toe: eerst worden agents voorzien van fundamentele agentische capaciteiten, waarna ze worden gespecialiseerd voor domeinspecifieke contexten. Uitgebreide experimenten op agentische benchmarks, tau-bench, tau2-Bench en ACEBench, tonen aan dat ons getrainde model, AgentScaler, de functie-aanroepcapaciteit van modellen aanzienlijk verbetert.
English
Advanced agentic intelligence is a prerequisite for deploying Large Language
Models in practical, real-world applications. Diverse real-world APIs demand
precise, robust function-calling intelligence, which needs agents to develop
these capabilities through interaction in varied environments. The breadth of
function-calling competence is closely tied to the diversity of environments in
which agents are trained. In this work, we scale up environments as a step
towards advancing general agentic intelligence. This gives rise to two central
challenges: (i) how to scale environments in a principled manner, and (ii) how
to effectively train agentic capabilities from experiences derived through
interactions with these environments. To address these, we design a scalable
framework that automatically constructs heterogeneous environments that are
fully simulated, systematically broadening the space of function-calling
scenarios. We further adapt a two-phase agent fine-tuning strategy: first
endowing agents with fundamental agentic capabilities, then specializing them
for domain-specific contexts. Extensive experiments on agentic benchmarks,
tau-bench, tau2-Bench, and ACEBench, demonstrate that our trained model,
AgentScaler, significantly enhances the function-calling capability of models.