ChatPaper.aiChatPaper

Atlas : Orchestrer des modèles et outils hétérogènes pour le raisonnement complexe multi-domaines

Atlas: Orchestrating Heterogeneous Models and Tools for Multi-Domain Complex Reasoning

January 7, 2026
papers.authors: Jinyang Wu, Guocheng Zhai, Ruihan Jin, Jiahao Yuan, Yuhao Shen, Shuai Zhang, Zhengqi Wen, Jianhua Tao
cs.AI

papers.abstract

L'intégration des grands modèles de langage (LLM) avec des outils externes a considérablement élargi les capacités des agents d'IA. Cependant, avec l'augmentation de la diversité des LLM et des outils, la sélection de la combinaison optimale modèle-outil devient un problème d'optimisation en haute dimension. Les approches existantes reposent souvent sur un modèle unique ou une logique d'appel d'outils fixe, ne parvenant pas à exploiter les variations de performance entre les paires hétérogènes modèle-outil. Dans cet article, nous présentons ATLAS (Alignement Adaptatif des Outils et des LLM et Invocation Synergique), un cadre à double voie pour l'utilisation dynamique d'outils dans le raisonnement complexe transdomaine. ATLAS fonctionne selon une approche à double voie : (1) un routage sans entraînement basé sur le clustering qui exploite des connaissances a priori empiriques pour un alignement domain-spécifique, et (2) un routage multi-étapes basé sur l'apprentissage par renforcement qui explore des trajectoires autonomes pour la généralisation hors-distribution. Des expériences approfondies sur 15 benchmarks démontrent que notre méthode surpasse les modèles propriétaires comme GPT-4o, dépassant les méthodes de routage existantes sur les tâches en distribution (+10,1%) et hors distribution (+13,1%). De plus, notre cadre montre des gains significatifs en raisonnement visuel en orchestrant des outils multimodaux spécialisés.
English
The integration of large language models (LLMs) with external tools has significantly expanded the capabilities of AI agents. However, as the diversity of both LLMs and tools increases, selecting the optimal model-tool combination becomes a high-dimensional optimization challenge. Existing approaches often rely on a single model or fixed tool-calling logic, failing to exploit the performance variations across heterogeneous model-tool pairs. In this paper, we present ATLAS (Adaptive Tool-LLM Alignment and Synergistic Invocation), a dual-path framework for dynamic tool usage in cross-domain complex reasoning. ATLAS operates via a dual-path approach: (1) training-free cluster-based routing that exploits empirical priors for domain-specific alignment, and (2) RL-based multi-step routing that explores autonomous trajectories for out-of-distribution generalization. Extensive experiments across 15 benchmarks demonstrate that our method outperforms closed-source models like GPT-4o, surpassing existing routing methods on both in-distribution (+10.1%) and out-of-distribution (+13.1%) tasks. Furthermore, our framework shows significant gains in visual reasoning by orchestrating specialized multi-modal tools.
PDF301January 9, 2026