ToolRosetta : Relier les dépôts open-source et les agents de grands modèles linguistiques par la standardisation automatisée des outils

Résumé

La réutilisation et l'invocation de code existant restent coûteuses et peu fiables, car la plupart des outils pratiques sont intégrés dans des référentiels de code hétérogènes et manquent d'interfaces exécutables standardisées. Bien que les grands modèles de langage (LLM) et les cadres d'invocation d'outils basés sur le Model Context Protocol (MCP) permettent l'exécution de tâches en langage naturel, les approches actuelles reposent fortement sur une curation et une standardisation manuelles des outils, ce qui limite fondamentalement l'évolutivité. Dans cet article, nous proposons ToolRosetta, un cadre unifié qui traduit automatiquement les référentiels de code open-source et les API en outils compatibles MCP pouvant être invoqués de manière fiable par les LLM. Étant donnée une tâche utilisateur, ToolRosetta planifie de manière autonome des chaînes d'outils, identifie les bases de code pertinentes et les convertit en services MCP exécutables, permettant ainsi une réalisation de bout en bout des tâches avec une intervention humaine minimale. De plus, ToolRosetta intègre une couche d'inspection de sécurité pour atténuer les risques inhérents à l'exécution de code arbitraire. Des expériences approfondies dans divers domaines scientifiques démontrent que ToolRosetta peut standardiser automatiquement un grand nombre d'outils open-source et réduire l'effort humain nécessaire à la reproduction et au déploiement du code. Fait notable, en tirant parti de manière transparente d'outils open-source spécialisés, les agents propulsés par ToolRosetta améliorent constamment les performances de réalisation des tâches par rapport aux LLM commerciaux et aux systèmes d'agents existants.

English

Reusing and invoking existing code remains costly and unreliable, as most practical tools are embedded in heterogeneous code repositories and lack standardized, executable interfaces. Although large language models (LLMs) and Model Context Protocol (MCP)-based tool invocation frameworks enable natural language task execution, current approaches rely heavily on manual tool curation and standardization, which fundamentally limits scalability. In this paper, we propose ToolRosetta, a unified framework that automatically translates open-source code repositories and APIs into MCP-compatible tools that can be reliably invoked by LLMs. Given a user task, ToolRosetta autonomously plans toolchains, identifies relevant codebases, and converts them into executable MCP services, enabling end-to-end task completion with minimal human intervention. In addition, ToolRosetta incorporates a security inspection layer to mitigate risks inherent in executing arbitrary code. Extensive experiments across diverse scientific domains demonstrate that ToolRosetta can automatically standardize a large number of open-source tools and reduce the human effort required for code reproduction and deployment. Notably, by seamlessly leveraging specialized open-source tools, ToolRosetta-powered agents consistently improve task completion performance compared to commercial LLMs and existing agent systems.

ToolRosetta : Relier les dépôts open-source et les agents de grands modèles linguistiques par la standardisation automatisée des outils

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Résumé

Support