ToolRosetta: Colmare il Divario tra Repository Open-Source e Agenti di Large Language Model tramite Standardizzazione Automatica degli Strumenti

Abstract

Il riutilizzo e l'invocazione di codice esistente rimangono operazioni costose e inaffidabili, poiché la maggior parte degli strumenti pratici è incorporata in repository di codice eterogenei e manca di interfacce eseguibili standardizzate. Sebbene i modelli linguistici di grandi dimensioni (LLM) e i framework di invocazione di strumenti basati sul Model Context Protocol (MCP) consentano l'esecuzione di compiti in linguaggio naturale, gli approcci attuali si basano fortemente sulla cura e standardizzazione manuale degli strumenti, il che limita fondamentalmente la scalabilità. In questo articolo, proponiamo ToolRosetta, un framework unificato che traduce automaticamente i repository di codice open-source e le API in strumenti compatibili con MCP che possono essere invocati in modo affidabile dagli LLM. Dato un compito utente, ToolRosetta pianifica autonomamente le catene di strumenti, identifica i codebase rilevanti e li converte in servizi MCP eseguibili, consentendo il completamento end-to-end del compito con un intervento umano minimo. Inoltre, ToolRosetta incorpora un livello di ispezione della sicurezza per mitigare i rischi intrinseci nell'esecuzione di codice arbitrario. Esperimenti estesi in diversi domini scientifici dimostrano che ToolRosetta può standardizzare automaticamente un gran numero di strumenti open-source e ridurre lo sforzo umano richiesto per la riproduzione e il deployment del codice. In modo significativo, sfruttando senza soluzione di continuità strumenti open-source specializzati, gli agenti potenziati da ToolRosetta migliorano costantemente le prestazioni di completamento dei compiti rispetto agli LLM commerciali e ai sistemi agentistici esistenti.

English

Reusing and invoking existing code remains costly and unreliable, as most practical tools are embedded in heterogeneous code repositories and lack standardized, executable interfaces. Although large language models (LLMs) and Model Context Protocol (MCP)-based tool invocation frameworks enable natural language task execution, current approaches rely heavily on manual tool curation and standardization, which fundamentally limits scalability. In this paper, we propose ToolRosetta, a unified framework that automatically translates open-source code repositories and APIs into MCP-compatible tools that can be reliably invoked by LLMs. Given a user task, ToolRosetta autonomously plans toolchains, identifies relevant codebases, and converts them into executable MCP services, enabling end-to-end task completion with minimal human intervention. In addition, ToolRosetta incorporates a security inspection layer to mitigate risks inherent in executing arbitrary code. Extensive experiments across diverse scientific domains demonstrate that ToolRosetta can automatically standardize a large number of open-source tools and reduce the human effort required for code reproduction and deployment. Notably, by seamlessly leveraging specialized open-source tools, ToolRosetta-powered agents consistently improve task completion performance compared to commercial LLMs and existing agent systems.

ToolRosetta: Colmare il Divario tra Repository Open-Source e Agenti di Large Language Model tramite Standardizzazione Automatica degli Strumenti

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Abstract

Support