ToolRosetta: Связывание открытых репозиториев и агентов больших языковых моделей через автоматическую стандартизацию инструментов
ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization
March 10, 2026
Авторы: Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong Rui
cs.AI
Аннотация
Повторное использование и вызов существующего кода остаются дорогостоящими и ненадежными, поскольку большинство практических инструментов встроены в гетерогенные репозитории кода и не имеют стандартизированных исполняемых интерфейсов. Хотя большие языковые модели (LLM) и фреймворки вызова инструментов на основе Model Context Protocol (MCP) позволяют выполнять задачи на естественном языке, современные подходы сильно зависят от ручной курации и стандартизации инструментов, что фундаментально ограничивает масштабируемость. В данной статье мы предлагаем ToolRosetta — унифицированную систему, которая автоматически преобразует репозитории открытого кода и API в совместимые с MCP инструменты, надежно вызываемые LLM. Для поставленной пользователем задачи ToolRosetta автономно планирует цепочки инструментов, идентифицирует релевантные кодобазы и конвертирует их в исполняемые MCP-сервисы, обеспечивая сквозное выполнение задачи при минимальном участии человека. Кроме того, ToolRosetta включает уровень проверки безопасности для снижения рисков, присущих выполнению произвольного кода. Масштабные эксперименты в различных научных областях демонстрируют, что ToolRosetta способна автоматически стандартизировать большое количество инструментов с открытым кодом и сократить трудозатраты на воспроизведение и развертывание кода. Примечательно, что за счет бесшовного использования специализированных open-source инструментов агенты на базе ToolRosetta стабильно повышают производительность выполнения задач по сравнению с коммерческими LLM и существующими агентскими системами.
English
Reusing and invoking existing code remains costly and unreliable, as most practical tools are embedded in heterogeneous code repositories and lack standardized, executable interfaces. Although large language models (LLMs) and Model Context Protocol (MCP)-based tool invocation frameworks enable natural language task execution, current approaches rely heavily on manual tool curation and standardization, which fundamentally limits scalability. In this paper, we propose ToolRosetta, a unified framework that automatically translates open-source code repositories and APIs into MCP-compatible tools that can be reliably invoked by LLMs. Given a user task, ToolRosetta autonomously plans toolchains, identifies relevant codebases, and converts them into executable MCP services, enabling end-to-end task completion with minimal human intervention. In addition, ToolRosetta incorporates a security inspection layer to mitigate risks inherent in executing arbitrary code. Extensive experiments across diverse scientific domains demonstrate that ToolRosetta can automatically standardize a large number of open-source tools and reduce the human effort required for code reproduction and deployment. Notably, by seamlessly leveraging specialized open-source tools, ToolRosetta-powered agents consistently improve task completion performance compared to commercial LLMs and existing agent systems.