ChatPaper.aiChatPaper

ModelScope-Agent: Construyendo tu Sistema de Agentes Personalizable con Modelos de Lenguaje de Gran Escala de Código Abierto

ModelScope-Agent: Building Your Customizable Agent System with Open-source Large Language Models

September 2, 2023
Autores: Chenliang Li, Hehong Chen, Ming Yan, Weizhou Shen, Haiyang Xu, Zhikai Wu, Zhicheng Zhang, Wenmeng Zhou, Yingda Chen, Chen Cheng, Hongzhu Shi, Ji Zhang, Fei Huang, Jingren Zhou
cs.AI

Resumen

Los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) han demostrado recientemente capacidades notables para comprender las intenciones humanas, participar en razonamientos y diseñar comportamientos similares a la planificación. Para liberar aún más el poder de los LLMs y permitirles realizar tareas complejas, existe una tendencia creciente en la creación de marcos de agentes que equipan a los LLMs, como ChatGPT, con habilidades de uso de herramientas para conectarse con una gran cantidad de APIs externas. En este trabajo, presentamos ModelScope-Agent, un marco de agente general y personalizable para aplicaciones del mundo real, basado en LLMs de código abierto como controladores. Ofrece una biblioteca de sistema fácil de usar, con un diseño de motor personalizable para apoyar el entrenamiento de modelos en múltiples LLMs de código abierto, al mismo tiempo que permite una integración fluida tanto con APIs de modelos como con APIs comunes de manera unificada. Para dotar a los LLMs de habilidades de uso de herramientas, se ha propuesto un marco integral que abarca la recopilación de datos de uso de herramientas, la recuperación de herramientas, el registro de herramientas, el control de memoria, el entrenamiento personalizado de modelos y la evaluación para aplicaciones prácticas del mundo real. Finalmente, presentamos ModelScopeGPT, un asistente inteligente del mundo real para la Comunidad ModelScope basado en el marco ModelScope-Agent, capaz de conectar LLMs de código abierto con más de 1000 modelos públicos de IA y conocimiento localizado de la comunidad en ModelScope. La biblioteca ModelScope-Agent https://github.com/modelscope/modelscope-agent y la demostración en línea https://modelscope.cn/studios/damo/ModelScopeGPT/summary están ahora disponibles públicamente.
English
Large language models (LLMs) have recently demonstrated remarkable capabilities to comprehend human intentions, engage in reasoning, and design planning-like behavior. To further unleash the power of LLMs to accomplish complex tasks, there is a growing trend to build agent framework that equips LLMs, such as ChatGPT, with tool-use abilities to connect with massive external APIs. In this work, we introduce ModelScope-Agent, a general and customizable agent framework for real-world applications, based on open-source LLMs as controllers. It provides a user-friendly system library, with customizable engine design to support model training on multiple open-source LLMs, while also enabling seamless integration with both model APIs and common APIs in a unified way. To equip the LLMs with tool-use abilities, a comprehensive framework has been proposed spanning over tool-use data collection, tool retrieval, tool registration, memory control, customized model training, and evaluation for practical real-world applications. Finally, we showcase ModelScopeGPT, a real-world intelligent assistant of ModelScope Community based on the ModelScope-Agent framework, which is able to connect open-source LLMs with more than 1000 public AI models and localized community knowledge in ModelScope. The ModelScope-Agent libraryhttps://github.com/modelscope/modelscope-agent and online demohttps://modelscope.cn/studios/damo/ModelScopeGPT/summary are now publicly available.
PDF211December 15, 2024