アトラス:複数領域における複雑な推論のための異種モデルとツールのオーケストレーション
Atlas: Orchestrating Heterogeneous Models and Tools for Multi-Domain Complex Reasoning
January 7, 2026
著者: Jinyang Wu, Guocheng Zhai, Ruihan Jin, Jiahao Yuan, Yuhao Shen, Shuai Zhang, Zhengqi Wen, Jianhua Tao
cs.AI
要旨
大規模言語モデル(LLM)と外部ツールの統合は、AIエージェントの能力を大幅に拡張してきた。しかし、LLMとツールの両方の多様性が増すにつれ、最適なモデルとツールの組み合わせの選択は高次元の最適化課題となっている。既存のアプローチは単一のモデルや固定されたツール呼び出しロジックに依存することが多く、異種モデル・ツールペア間の性能変動を活用できていない。本論文では、クロスドメイン複雑推論における動的ツール利用のためのデュアルパスフレームワーク「ATLAS(Adaptive Tool-LLM Alignment and Synergistic Invocation)」を提案する。ATLASは二つの経路で動作する:(1)経験的事前分布を活用したドメイン特化アラインメントのための訓練不要なクラスタベースルーティング、(2)分布外汎化のための自律軌道探索を実現する強化学習ベースの多段階ルーティング。15のベンチマークによる大規模実験により、本手法がGPT-4oのようなクローズドソースモデルを上回り、既存のルーティング手法に対しても分布内タスク(+10.1%)と分布外タスク(+13.1%)の両方で優れた性能を発揮することを実証した。さらに、専門的なマルチモーダルツールを協調させることで、視覚推論において顕著な性能向上を示す。
English
The integration of large language models (LLMs) with external tools has significantly expanded the capabilities of AI agents. However, as the diversity of both LLMs and tools increases, selecting the optimal model-tool combination becomes a high-dimensional optimization challenge. Existing approaches often rely on a single model or fixed tool-calling logic, failing to exploit the performance variations across heterogeneous model-tool pairs. In this paper, we present ATLAS (Adaptive Tool-LLM Alignment and Synergistic Invocation), a dual-path framework for dynamic tool usage in cross-domain complex reasoning. ATLAS operates via a dual-path approach: (1) training-free cluster-based routing that exploits empirical priors for domain-specific alignment, and (2) RL-based multi-step routing that explores autonomous trajectories for out-of-distribution generalization. Extensive experiments across 15 benchmarks demonstrate that our method outperforms closed-source models like GPT-4o, surpassing existing routing methods on both in-distribution (+10.1%) and out-of-distribution (+13.1%) tasks. Furthermore, our framework shows significant gains in visual reasoning by orchestrating specialized multi-modal tools.