ToolRosetta: Een brug tussen open-source repositories en Large Language Model-agents door geautomatiseerde toolstandaardisatie

Samenvatting

Het hergebruiken en aanroepen van bestaande code blijft kostbaar en onbetrouwbaar, omdat de meeste praktische tools zijn ingebed in heterogene coderepositories en geen gestandaardiseerde, uitvoerbare interfaces hebben. Hoewel grote taalmodelmodellen (LLM's) en op het Model Context Protocol (MCP) gebaseerde toolaanroepframeworks de uitvoering van taken in natuurlijke taal mogelijk maken, zijn huidige benaderingen sterk afhankelijk van handmatige toolcuratie en -standaardisatie, wat de schaalbaarheid fundamenteel beperkt. In dit artikel stellen we ToolRosetta voor, een uniform raamwerk dat open-source coderepositories en API's automatisch vertaalt naar MCP-compatibele tools die betrouwbaar door LLM's kunnen worden aangeroepen. Gegeven een gebruikers-taak plant ToolRosetta autonoom toolketens, identificeert relevante codebasissen en zet deze om in uitvoerbare MCP-services, waardoor end-to-end taakvoltooiing met minimale menselijke tussenkomst mogelijk wordt. Bovendien bevat ToolRosetta een beveiligingsinspectielaag om de inherente risico's van het uitvoeren van willekeurige code te beperken. Uitgebreide experimenten in diverse wetenschappelijke domeinen tonen aan dat ToolRosetta een groot aantal open-source tools automatisch kan standaardiseren en de benodigde menselijke inspanning voor codereproductie en -implementatie kan verminderen. Opmerkelijk is dat agents aangedreven door ToolRosetta, door naadloos gebruik te maken van gespecialiseerde open-source tools, consequent betere taakvoltooiingsprestaties leveren in vergelijking met commerciële LLM's en bestaande agentsystemen.

English

Reusing and invoking existing code remains costly and unreliable, as most practical tools are embedded in heterogeneous code repositories and lack standardized, executable interfaces. Although large language models (LLMs) and Model Context Protocol (MCP)-based tool invocation frameworks enable natural language task execution, current approaches rely heavily on manual tool curation and standardization, which fundamentally limits scalability. In this paper, we propose ToolRosetta, a unified framework that automatically translates open-source code repositories and APIs into MCP-compatible tools that can be reliably invoked by LLMs. Given a user task, ToolRosetta autonomously plans toolchains, identifies relevant codebases, and converts them into executable MCP services, enabling end-to-end task completion with minimal human intervention. In addition, ToolRosetta incorporates a security inspection layer to mitigate risks inherent in executing arbitrary code. Extensive experiments across diverse scientific domains demonstrate that ToolRosetta can automatically standardize a large number of open-source tools and reduce the human effort required for code reproduction and deployment. Notably, by seamlessly leveraging specialized open-source tools, ToolRosetta-powered agents consistently improve task completion performance compared to commercial LLMs and existing agent systems.

ToolRosetta: Een brug tussen open-source repositories en Large Language Model-agents door geautomatiseerde toolstandaardisatie

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Samenvatting

Support