ToolRosetta: Conectando Repositórios de Código Aberto e Agentes de Modelos de Linguagem Grande por meio da Padronização Automatizada de Ferramentas

Resumo

A reutilização e invocação de código existente continua a ser dispendiosa e pouco fiável, uma vez que a maioria das ferramentas práticas está embutida em repositórios de código heterogéneos e carece de interfaces executáveis padronizadas. Embora os modelos de linguagem de grande escala (LLMs) e os frameworks de invocação de ferramentas baseados no Model Context Protocol (MCP) permitam a execução de tarefas em linguagem natural, as abordagens atuais dependem fortemente da curadoria e padronização manual de ferramentas, o que limita fundamentalmente a escalabilidade. Neste artigo, propomos o ToolRosetta, um framework unificado que traduz automaticamente repositórios de código aberto e APIs em ferramentas compatíveis com MCP que podem ser invocadas de forma fiável por LLMs. Dada uma tarefa do utilizador, o ToolRosetta planeia autonomamente cadeias de ferramentas, identifica bases de código relevantes e converte-as em serviços MCP executáveis, permitindo a conclusão de tarefas de forma ponta a ponta com intervenção humana mínima. Adicionalmente, o ToolRosetta incorpora uma camada de inspeção de segurança para mitigar os riscos inerentes à execução de código arbitrário. Experiências extensas em diversos domínios científicos demonstram que o ToolRosetta pode padronizar automaticamente um grande número de ferramentas de código aberto e reduzir o esforço humano necessário para reprodução e implantação de código. Notavelmente, ao aproveitar de forma transparente ferramentas de código aberto especializadas, os agentes potenciados pelo ToolRosetta melhoram consistentemente o desempenho na conclusão de tarefas em comparação com LLMs comerciais e sistemas de agentes existentes.

English

Reusing and invoking existing code remains costly and unreliable, as most practical tools are embedded in heterogeneous code repositories and lack standardized, executable interfaces. Although large language models (LLMs) and Model Context Protocol (MCP)-based tool invocation frameworks enable natural language task execution, current approaches rely heavily on manual tool curation and standardization, which fundamentally limits scalability. In this paper, we propose ToolRosetta, a unified framework that automatically translates open-source code repositories and APIs into MCP-compatible tools that can be reliably invoked by LLMs. Given a user task, ToolRosetta autonomously plans toolchains, identifies relevant codebases, and converts them into executable MCP services, enabling end-to-end task completion with minimal human intervention. In addition, ToolRosetta incorporates a security inspection layer to mitigate risks inherent in executing arbitrary code. Extensive experiments across diverse scientific domains demonstrate that ToolRosetta can automatically standardize a large number of open-source tools and reduce the human effort required for code reproduction and deployment. Notably, by seamlessly leveraging specialized open-source tools, ToolRosetta-powered agents consistently improve task completion performance compared to commercial LLMs and existing agent systems.