ChatPaper.aiChatPaper

Atlas: Het Orkestreren van Heterogene Modellen en Hulpmiddelen voor Complex Redeneren over Meerdere Domeinen

Atlas: Orchestrating Heterogeneous Models and Tools for Multi-Domain Complex Reasoning

January 7, 2026
Auteurs: Jinyang Wu, Guocheng Zhai, Ruihan Jin, Jiahao Yuan, Yuhao Shen, Shuai Zhang, Zhengqi Wen, Jianhua Tao
cs.AI

Samenvatting

De integratie van grote taalmmodellen (LLM's) met externe tools heeft de mogelijkheden van AI-agenten aanzienlijk uitgebreid. Naarmate de diversiteit van zowel LLM's als tools toeneemt, wordt het selecteren van de optimale model-toolcombinatie echter een hoogdimensionaal optimalisatieprobleem. Bestaande benaderingen vertrouwen vaak op een enkel model of vaste tool-aanroeplogica, waardoor ze geen gebruik maken van prestatieverschillen tussen heterogene model-toolparen. In dit artikel presenteren we ATLAS (Adaptive Tool-LLM Alignment and Synergistic Invocation), een dual-path raamwerk voor dynamisch toolgebruik bij domeinoverschrijdend complex redeneren. ATLAS werkt via een dual-path aanpak: (1) trainingsvrije op clustering gebaseerde routering die empirische priors benut voor domeinspecifieke afstemming, en (2) op reinforcement learning gebaseerde meerstapsroutering die autonome trajecten verkent voor generalisatie buiten de verdeling. Uitgebreide experimenten op 15 benchmarks tonen aan dat onze methode superieure prestaties levert vergeleken met closed-source modellen zoals GPT-4o, en bestaande routeringsmethoden overtreft voor zowel taken binnen de verdeling (+10,1%) als daarbuiten (+13,1%). Bovendien toont ons raamwerk aanzienlijke verbeteringen in visueel redeneren door de orchestratie van gespecialiseerde multimodale tools.
English
The integration of large language models (LLMs) with external tools has significantly expanded the capabilities of AI agents. However, as the diversity of both LLMs and tools increases, selecting the optimal model-tool combination becomes a high-dimensional optimization challenge. Existing approaches often rely on a single model or fixed tool-calling logic, failing to exploit the performance variations across heterogeneous model-tool pairs. In this paper, we present ATLAS (Adaptive Tool-LLM Alignment and Synergistic Invocation), a dual-path framework for dynamic tool usage in cross-domain complex reasoning. ATLAS operates via a dual-path approach: (1) training-free cluster-based routing that exploits empirical priors for domain-specific alignment, and (2) RL-based multi-step routing that explores autonomous trajectories for out-of-distribution generalization. Extensive experiments across 15 benchmarks demonstrate that our method outperforms closed-source models like GPT-4o, surpassing existing routing methods on both in-distribution (+10.1%) and out-of-distribution (+13.1%) tasks. Furthermore, our framework shows significant gains in visual reasoning by orchestrating specialized multi-modal tools.
PDF301January 9, 2026