ModelScope-Agent : Construisez votre système d'agent personnalisable avec des modèles de langage open-source à grande échelle
ModelScope-Agent: Building Your Customizable Agent System with Open-source Large Language Models
September 2, 2023
Auteurs: Chenliang Li, Hehong Chen, Ming Yan, Weizhou Shen, Haiyang Xu, Zhikai Wu, Zhicheng Zhang, Wenmeng Zhou, Yingda Chen, Chen Cheng, Hongzhu Shi, Ji Zhang, Fei Huang, Jingren Zhou
cs.AI
Résumé
Les grands modèles de langage (LLM) ont récemment démontré des capacités remarquables à comprendre les intentions humaines, à s'engager dans des raisonnements et à concevoir des comportements similaires à la planification. Pour libérer davantage le potentiel des LLM dans l'accomplissement de tâches complexes, une tendance croissante consiste à développer des frameworks d'agents qui équipent les LLM, tels que ChatGPT, de capacités d'utilisation d'outils pour se connecter à de nombreuses API externes. Dans ce travail, nous présentons ModelScope-Agent, un framework d'agent général et personnalisable pour des applications réelles, basé sur des LLM open-source en tant que contrôleurs. Il fournit une bibliothèque système conviviale, avec une conception de moteur personnalisable pour supporter l'entraînement de modèles sur plusieurs LLM open-source, tout en permettant une intégration fluide avec les API de modèles et les API communes de manière unifiée. Pour doter les LLM de capacités d'utilisation d'outils, un framework complet a été proposé, couvrant la collecte de données d'utilisation d'outils, la récupération d'outils, l'enregistrement d'outils, le contrôle de la mémoire, l'entraînement de modèles personnalisés et l'évaluation pour des applications pratiques dans le monde réel. Enfin, nous présentons ModelScopeGPT, un assistant intelligent réel de la communauté ModelScope basé sur le framework ModelScope-Agent, capable de connecter des LLM open-source à plus de 1000 modèles d'IA publics et à des connaissances locales de la communauté dans ModelScope. La bibliothèque ModelScope-Agent https://github.com/modelscope/modelscope-agent et la démo en ligne https://modelscope.cn/studios/damo/ModelScopeGPT/summary sont désormais publiquement disponibles.
English
Large language models (LLMs) have recently demonstrated remarkable
capabilities to comprehend human intentions, engage in reasoning, and design
planning-like behavior. To further unleash the power of LLMs to accomplish
complex tasks, there is a growing trend to build agent framework that equips
LLMs, such as ChatGPT, with tool-use abilities to connect with massive external
APIs. In this work, we introduce ModelScope-Agent, a general and customizable
agent framework for real-world applications, based on open-source LLMs as
controllers. It provides a user-friendly system library, with customizable
engine design to support model training on multiple open-source LLMs, while
also enabling seamless integration with both model APIs and common APIs in a
unified way. To equip the LLMs with tool-use abilities, a comprehensive
framework has been proposed spanning over tool-use data collection, tool
retrieval, tool registration, memory control, customized model training, and
evaluation for practical real-world applications. Finally, we showcase
ModelScopeGPT, a real-world intelligent assistant of ModelScope Community based
on the ModelScope-Agent framework, which is able to connect open-source LLMs
with more than 1000 public AI models and localized community knowledge in
ModelScope. The ModelScope-Agent
libraryhttps://github.com/modelscope/modelscope-agent and online
demohttps://modelscope.cn/studios/damo/ModelScopeGPT/summary are now
publicly available.