ToolRosetta: Conectando Repositorios de Código Abierto y Agentes de Modelos de Lenguaje Grandes mediante la Estandarización Automática de Herramientas

Resumen

La reutilización e invocación de código existente sigue siendo costosa y poco fiable, ya que la mayoría de las herramientas prácticas están integradas en repositorios de código heterogéneos y carecen de interfaces ejecutables estandarizadas. Aunque los modelos de lenguaje grandes (LLMs) y los marcos de invocación de herramientas basados en el Protocolo de Contexto de Modelo (MCP) permiten la ejecución de tareas en lenguaje natural, los enfoques actuales dependen en gran medida de la curación y estandarización manual de herramientas, lo que limita fundamentalmente la escalabilidad. En este artículo, proponemos ToolRosetta, un marco unificado que traduce automáticamente repositorios de código abierto y APIs en herramientas compatibles con MCP que pueden ser invocadas de manera fiable por LLMs. Dada una tarea del usuario, ToolRosetta planifica de forma autónoma cadenas de herramientas, identifica bases de código relevantes y las convierte en servicios MCP ejecutables, permitiendo la finalización de tareas de extremo a extremo con mínima intervención humana. Además, ToolRosetta incorpora una capa de inspección de seguridad para mitigar los riesgos inherentes a la ejecución de código arbitrario. Experimentos exhaustivos en diversos dominios científicos demuestran que ToolRosetta puede estandarizar automáticamente un gran número de herramientas de código abierto y reducir el esfuerzo humano requerido para la reproducción e implementación de código. Notablemente, al aprovechar de manera fluida herramientas de código abierto especializadas, los agentes potenciados por ToolRosetta mejoran consistentemente el rendimiento en la finalización de tareas en comparación con LLMs comerciales y sistemas de agentes existentes.

English

Reusing and invoking existing code remains costly and unreliable, as most practical tools are embedded in heterogeneous code repositories and lack standardized, executable interfaces. Although large language models (LLMs) and Model Context Protocol (MCP)-based tool invocation frameworks enable natural language task execution, current approaches rely heavily on manual tool curation and standardization, which fundamentally limits scalability. In this paper, we propose ToolRosetta, a unified framework that automatically translates open-source code repositories and APIs into MCP-compatible tools that can be reliably invoked by LLMs. Given a user task, ToolRosetta autonomously plans toolchains, identifies relevant codebases, and converts them into executable MCP services, enabling end-to-end task completion with minimal human intervention. In addition, ToolRosetta incorporates a security inspection layer to mitigate risks inherent in executing arbitrary code. Extensive experiments across diverse scientific domains demonstrate that ToolRosetta can automatically standardize a large number of open-source tools and reduce the human effort required for code reproduction and deployment. Notably, by seamlessly leveraging specialized open-source tools, ToolRosetta-powered agents consistently improve task completion performance compared to commercial LLMs and existing agent systems.

ToolRosetta: Conectando Repositorios de Código Abierto y Agentes de Modelos de Lenguaje Grandes mediante la Estandarización Automática de Herramientas

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Resumen

Support