ToolRosetta: Brückenschlag zwischen Open-Source-Repositorien und KI-Agenten durch automatisierte Werkzeugstandardisierung
ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization
March 10, 2026
Autoren: Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong Rui
cs.AI
Zusammenfassung
Die Wiederverwendung und Aufrufung bestehender Codes bleibt kostspielig und unzuverlässig, da die meisten praktischen Werkzeuge in heterogenen Code-Repositories eingebettet sind und standardisierte, ausführbare Schnittstellen fehlen. Obwohl große Sprachmodelle (LLMs) und auf dem Model Context Protocol (MCP) basierende Werkzeugaufrufframeworks die Ausführung von Aufgaben in natürlicher Sprache ermöglichen, sind aktuelle Ansätze stark auf manuelle Werkzeugkuratierung und Standardisierung angewiesen, was die Skalierbarkeit grundlegend einschränkt. In diesem Beitrag stellen wir ToolRosetta vor, ein einheitliches Framework, das Open-Source-Code-Repositories und APIs automatisch in MCP-kompatible Werkzeuge übersetzt, die zuverlässig von LLMs aufgerufen werden können. Für eine gegebene Benutzeraufgabe plant ToolRosetta autonom Toolchains, identifiziert relevante Codebasen und konvertiert sie in ausführbare MCP-Dienste, wodurch End-to-End-Aufgabenabschluss mit minimalem menschlichem Eingriff ermöglicht wird. Zusätzlich integriert ToolRosetta eine Sicherheitsprüfschicht, um die inhärenten Risiken bei der Ausführung beliebigen Codes zu mindern. Umfangreiche Experimente in verschiedenen wissenschaftlichen Domänen zeigen, dass ToolRosetta eine große Anzahl von Open-Source-Werkzeugen automatisch standardisieren und den menschlichen Aufwand für Codereproduktion und Bereitstellung reduzieren kann. Bemerkenswerterweise verbessern ToolRosetta-gesteuerte Agenten durch nahtlose Nutzung spezialisierter Open-Source-Werkzeuge durchgängig die Leistung beim Aufgabenabschluss im Vergleich zu kommerziellen LLMs und bestehenden Agentensystemen.
English
Reusing and invoking existing code remains costly and unreliable, as most practical tools are embedded in heterogeneous code repositories and lack standardized, executable interfaces. Although large language models (LLMs) and Model Context Protocol (MCP)-based tool invocation frameworks enable natural language task execution, current approaches rely heavily on manual tool curation and standardization, which fundamentally limits scalability. In this paper, we propose ToolRosetta, a unified framework that automatically translates open-source code repositories and APIs into MCP-compatible tools that can be reliably invoked by LLMs. Given a user task, ToolRosetta autonomously plans toolchains, identifies relevant codebases, and converts them into executable MCP services, enabling end-to-end task completion with minimal human intervention. In addition, ToolRosetta incorporates a security inspection layer to mitigate risks inherent in executing arbitrary code. Extensive experiments across diverse scientific domains demonstrate that ToolRosetta can automatically standardize a large number of open-source tools and reduce the human effort required for code reproduction and deployment. Notably, by seamlessly leveraging specialized open-source tools, ToolRosetta-powered agents consistently improve task completion performance compared to commercial LLMs and existing agent systems.