ChatPaper.aiChatPaper

ModelScope-Agent: Создание вашей настраиваемой системы агентов с использованием открытых больших языковых моделей

ModelScope-Agent: Building Your Customizable Agent System with Open-source Large Language Models

September 2, 2023
Авторы: Chenliang Li, Hehong Chen, Ming Yan, Weizhou Shen, Haiyang Xu, Zhikai Wu, Zhicheng Zhang, Wenmeng Zhou, Yingda Chen, Chen Cheng, Hongzhu Shi, Ji Zhang, Fei Huang, Jingren Zhou
cs.AI

Аннотация

Крупные языковые модели (LLM) недавно продемонстрировали впечатляющие способности в понимании человеческих намерений, участии в рассуждениях и проектировании поведения, напоминающего планирование. Чтобы в полной мере раскрыть потенциал LLM для выполнения сложных задач, наблюдается растущая тенденция к созданию агентских фреймворков, которые наделяют LLM, такие как ChatGPT, способностью использовать инструменты для взаимодействия с многочисленными внешними API. В данной работе мы представляем ModelScope-Agent — универсальный и настраиваемый агентский фреймворк для реальных приложений, основанный на открытых LLM в качестве контроллеров. Он предоставляет удобную системную библиотеку с настраиваемым дизайном движка для поддержки обучения моделей на нескольких открытых LLM, а также обеспечивает бесшовную интеграцию как с модельными API, так и с общедоступными API в едином формате. Чтобы наделить LLM способностью использовать инструменты, предложен комплексный фреймворк, охватывающий сбор данных об использовании инструментов, их поиск, регистрацию, управление памятью, обучение настраиваемых моделей и оценку для практических применений в реальном мире. Наконец, мы демонстрируем ModelScopeGPT — интеллектуального помощника сообщества ModelScope, основанного на фреймворке ModelScope-Agent, который способен связывать открытые LLM с более чем 1000 публичными моделями ИИ и локальными знаниями сообщества в ModelScope. Библиотека ModelScope-Agent (https://github.com/modelscope/modelscope-agent) и онлайн-демонстрация (https://modelscope.cn/studios/damo/ModelScopeGPT/summary) теперь доступны для публичного использования.
English
Large language models (LLMs) have recently demonstrated remarkable capabilities to comprehend human intentions, engage in reasoning, and design planning-like behavior. To further unleash the power of LLMs to accomplish complex tasks, there is a growing trend to build agent framework that equips LLMs, such as ChatGPT, with tool-use abilities to connect with massive external APIs. In this work, we introduce ModelScope-Agent, a general and customizable agent framework for real-world applications, based on open-source LLMs as controllers. It provides a user-friendly system library, with customizable engine design to support model training on multiple open-source LLMs, while also enabling seamless integration with both model APIs and common APIs in a unified way. To equip the LLMs with tool-use abilities, a comprehensive framework has been proposed spanning over tool-use data collection, tool retrieval, tool registration, memory control, customized model training, and evaluation for practical real-world applications. Finally, we showcase ModelScopeGPT, a real-world intelligent assistant of ModelScope Community based on the ModelScope-Agent framework, which is able to connect open-source LLMs with more than 1000 public AI models and localized community knowledge in ModelScope. The ModelScope-Agent libraryhttps://github.com/modelscope/modelscope-agent and online demohttps://modelscope.cn/studios/damo/ModelScopeGPT/summary are now publicly available.
PDF211December 15, 2024