ModelScope-Agent: Construyendo tu Sistema de Agentes Personalizable con Modelos de Lenguaje de Gran Escala de Código Abierto
ModelScope-Agent: Building Your Customizable Agent System with Open-source Large Language Models
September 2, 2023
Autores: Chenliang Li, Hehong Chen, Ming Yan, Weizhou Shen, Haiyang Xu, Zhikai Wu, Zhicheng Zhang, Wenmeng Zhou, Yingda Chen, Chen Cheng, Hongzhu Shi, Ji Zhang, Fei Huang, Jingren Zhou
cs.AI
Resumen
Los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) han demostrado recientemente capacidades notables para comprender las intenciones humanas, participar en razonamientos y diseñar comportamientos similares a la planificación. Para liberar aún más el poder de los LLMs y permitirles realizar tareas complejas, existe una tendencia creciente en la creación de marcos de agentes que equipan a los LLMs, como ChatGPT, con habilidades de uso de herramientas para conectarse con una gran cantidad de APIs externas. En este trabajo, presentamos ModelScope-Agent, un marco de agente general y personalizable para aplicaciones del mundo real, basado en LLMs de código abierto como controladores. Ofrece una biblioteca de sistema fácil de usar, con un diseño de motor personalizable para apoyar el entrenamiento de modelos en múltiples LLMs de código abierto, al mismo tiempo que permite una integración fluida tanto con APIs de modelos como con APIs comunes de manera unificada. Para dotar a los LLMs de habilidades de uso de herramientas, se ha propuesto un marco integral que abarca la recopilación de datos de uso de herramientas, la recuperación de herramientas, el registro de herramientas, el control de memoria, el entrenamiento personalizado de modelos y la evaluación para aplicaciones prácticas del mundo real. Finalmente, presentamos ModelScopeGPT, un asistente inteligente del mundo real para la Comunidad ModelScope basado en el marco ModelScope-Agent, capaz de conectar LLMs de código abierto con más de 1000 modelos públicos de IA y conocimiento localizado de la comunidad en ModelScope. La biblioteca ModelScope-Agent https://github.com/modelscope/modelscope-agent y la demostración en línea https://modelscope.cn/studios/damo/ModelScopeGPT/summary están ahora disponibles públicamente.
English
Large language models (LLMs) have recently demonstrated remarkable
capabilities to comprehend human intentions, engage in reasoning, and design
planning-like behavior. To further unleash the power of LLMs to accomplish
complex tasks, there is a growing trend to build agent framework that equips
LLMs, such as ChatGPT, with tool-use abilities to connect with massive external
APIs. In this work, we introduce ModelScope-Agent, a general and customizable
agent framework for real-world applications, based on open-source LLMs as
controllers. It provides a user-friendly system library, with customizable
engine design to support model training on multiple open-source LLMs, while
also enabling seamless integration with both model APIs and common APIs in a
unified way. To equip the LLMs with tool-use abilities, a comprehensive
framework has been proposed spanning over tool-use data collection, tool
retrieval, tool registration, memory control, customized model training, and
evaluation for practical real-world applications. Finally, we showcase
ModelScopeGPT, a real-world intelligent assistant of ModelScope Community based
on the ModelScope-Agent framework, which is able to connect open-source LLMs
with more than 1000 public AI models and localized community knowledge in
ModelScope. The ModelScope-Agent
libraryhttps://github.com/modelscope/modelscope-agent and online
demohttps://modelscope.cn/studios/damo/ModelScopeGPT/summary are now
publicly available.