ModelScope-Agent: Создание вашей настраиваемой системы агентов с использованием открытых больших языковых моделей

Аннотация

Крупные языковые модели (LLM) недавно продемонстрировали впечатляющие способности в понимании человеческих намерений, участии в рассуждениях и проектировании поведения, напоминающего планирование. Чтобы в полной мере раскрыть потенциал LLM для выполнения сложных задач, наблюдается растущая тенденция к созданию агентских фреймворков, которые наделяют LLM, такие как ChatGPT, способностью использовать инструменты для взаимодействия с многочисленными внешними API. В данной работе мы представляем ModelScope-Agent — универсальный и настраиваемый агентский фреймворк для реальных приложений, основанный на открытых LLM в качестве контроллеров. Он предоставляет удобную системную библиотеку с настраиваемым дизайном движка для поддержки обучения моделей на нескольких открытых LLM, а также обеспечивает бесшовную интеграцию как с модельными API, так и с общедоступными API в едином формате. Чтобы наделить LLM способностью использовать инструменты, предложен комплексный фреймворк, охватывающий сбор данных об использовании инструментов, их поиск, регистрацию, управление памятью, обучение настраиваемых моделей и оценку для практических применений в реальном мире. Наконец, мы демонстрируем ModelScopeGPT — интеллектуального помощника сообщества ModelScope, основанного на фреймворке ModelScope-Agent, который способен связывать открытые LLM с более чем 1000 публичными моделями ИИ и локальными знаниями сообщества в ModelScope. Библиотека ModelScope-Agent (https://github.com/modelscope/modelscope-agent) и онлайн-демонстрация (https://modelscope.cn/studios/damo/ModelScopeGPT/summary) теперь доступны для публичного использования.

English

Large language models (LLMs) have recently demonstrated remarkable capabilities to comprehend human intentions, engage in reasoning, and design planning-like behavior. To further unleash the power of LLMs to accomplish complex tasks, there is a growing trend to build agent framework that equips LLMs, such as ChatGPT, with tool-use abilities to connect with massive external APIs. In this work, we introduce ModelScope-Agent, a general and customizable agent framework for real-world applications, based on open-source LLMs as controllers. It provides a user-friendly system library, with customizable engine design to support model training on multiple open-source LLMs, while also enabling seamless integration with both model APIs and common APIs in a unified way. To equip the LLMs with tool-use abilities, a comprehensive framework has been proposed spanning over tool-use data collection, tool retrieval, tool registration, memory control, customized model training, and evaluation for practical real-world applications. Finally, we showcase ModelScopeGPT, a real-world intelligent assistant of ModelScope Community based on the ModelScope-Agent framework, which is able to connect open-source LLMs with more than 1000 public AI models and localized community knowledge in ModelScope. The ModelScope-Agent libraryhttps://github.com/modelscope/modelscope-agent and online demohttps://modelscope.cn/studios/damo/ModelScopeGPT/summary are now publicly available.

ModelScope-Agent: Создание вашей настраиваемой системы агентов с использованием открытых больших языковых моделей

ModelScope-Agent: Building Your Customizable Agent System with Open-source Large Language Models

Аннотация

Support