Atlas: Orquestación de Modelos y Herramientas Heterogéneos para el Razonamiento Complejo en Múltiples Dominios
Atlas: Orchestrating Heterogeneous Models and Tools for Multi-Domain Complex Reasoning
January 7, 2026
Autores: Jinyang Wu, Guocheng Zhai, Ruihan Jin, Jiahao Yuan, Yuhao Shen, Shuai Zhang, Zhengqi Wen, Jianhua Tao
cs.AI
Resumen
La integración de grandes modelos de lenguaje (LLM) con herramientas externas ha ampliado significativamente las capacidades de los agentes de IA. Sin embargo, a medida que aumenta la diversidad tanto de los LLM como de las herramientas, seleccionar la combinación óptima de modelo y herramienta se convierte en un desafío de optimización de alta dimensión. Los enfoques existentes a menudo dependen de un único modelo o de una lógica fija de invocación de herramientas, sin aprovechar las variaciones de rendimiento entre pares heterogéneos de modelo y herramienta. En este artículo, presentamos ATLAS (Alineación Adaptativa de Herramientas-LLM e Invocación Sinérgica), un marco de doble vía para el uso dinámico de herramientas en el razonamiento complejo entre dominios. ATLAS opera mediante un enfoque de doble vía: (1) un enrutamiento basado en clústeres sin entrenamiento que explota previos empíricos para la alineación específica del dominio, y (2) un enrutamiento multi-etapa basado en aprendizaje por refuerzo que explora trayectorias autónomas para la generalización fuera de distribución. Experimentos exhaustivos en 15 benchmarks demuestran que nuestro método supera a modelos de código cerrado como GPT-4o, superando a los métodos de enrutamiento existentes tanto en tareas dentro de distribución (+10.1%) como fuera de distribución (+13.1%). Además, nuestro marco muestra ganancias significativas en razonamiento visual mediante la orquestación de herramientas multimodales especializadas.
English
The integration of large language models (LLMs) with external tools has significantly expanded the capabilities of AI agents. However, as the diversity of both LLMs and tools increases, selecting the optimal model-tool combination becomes a high-dimensional optimization challenge. Existing approaches often rely on a single model or fixed tool-calling logic, failing to exploit the performance variations across heterogeneous model-tool pairs. In this paper, we present ATLAS (Adaptive Tool-LLM Alignment and Synergistic Invocation), a dual-path framework for dynamic tool usage in cross-domain complex reasoning. ATLAS operates via a dual-path approach: (1) training-free cluster-based routing that exploits empirical priors for domain-specific alignment, and (2) RL-based multi-step routing that explores autonomous trajectories for out-of-distribution generalization. Extensive experiments across 15 benchmarks demonstrate that our method outperforms closed-source models like GPT-4o, surpassing existing routing methods on both in-distribution (+10.1%) and out-of-distribution (+13.1%) tasks. Furthermore, our framework shows significant gains in visual reasoning by orchestrating specialized multi-modal tools.