ChatPaper.aiChatPaper

ModelScope-Agent: Entwicklung Ihres anpassbaren Agentensystems mit Open-Source-Großsprachmodellen

ModelScope-Agent: Building Your Customizable Agent System with Open-source Large Language Models

September 2, 2023
Autoren: Chenliang Li, Hehong Chen, Ming Yan, Weizhou Shen, Haiyang Xu, Zhikai Wu, Zhicheng Zhang, Wenmeng Zhou, Yingda Chen, Chen Cheng, Hongzhu Shi, Ji Zhang, Fei Huang, Jingren Zhou
cs.AI

Zusammenfassung

Große Sprachmodelle (LLMs) haben in letzter Zeit bemerkenswerte Fähigkeiten gezeigt, menschliche Absichten zu verstehen, in logisches Denken einzutreten und planungsähnliches Verhalten zu entwerfen. Um die Leistungsfähigkeit von LLMs weiter zu entfesseln und komplexe Aufgaben zu bewältigen, gibt es einen zunehmenden Trend, Agenten-Frameworks zu entwickeln, die LLMs wie ChatGPT mit Werkzeugnutzungsfähigkeiten ausstatten, um sie mit einer Vielzahl externer APIs zu verbinden. In dieser Arbeit stellen wir ModelScope-Agent vor, ein allgemeines und anpassbares Agenten-Framework für reale Anwendungen, das auf Open-Source-LLMs als Steuerungseinheiten basiert. Es bietet eine benutzerfreundliche Systembibliothek mit einem anpassbaren Engine-Design, das das Modelltraining auf mehreren Open-Source-LLMs unterstützt und gleichzeitig eine nahtlose Integration sowohl mit Modell-APIs als auch mit gängigen APIs auf einheitliche Weise ermöglicht. Um die LLMs mit Werkzeugnutzungsfähigkeiten auszustatten, wurde ein umfassendes Framework vorgeschlagen, das die Datensammlung für die Werkzeugnutzung, die Werkzeugrückgewinnung, die Werkzeugregistrierung, die Speichersteuerung, das angepasste Modelltraining und die Bewertung für praktische reale Anwendungen abdeckt. Schließlich präsentieren wir ModelScopeGPT, einen intelligenten Assistenten der ModelScope-Community, der auf dem ModelScope-Agent-Framework basiert und in der Lage ist, Open-Source-LLMs mit mehr als 1000 öffentlichen KI-Modellen und lokalisiertem Community-Wissen in ModelScope zu verbinden. Die ModelScope-Agent-Bibliothek https://github.com/modelscope/modelscope-agent und die Online-Demo https://modelscope.cn/studios/damo/ModelScopeGPT/summary sind nun öffentlich verfügbar.
English
Large language models (LLMs) have recently demonstrated remarkable capabilities to comprehend human intentions, engage in reasoning, and design planning-like behavior. To further unleash the power of LLMs to accomplish complex tasks, there is a growing trend to build agent framework that equips LLMs, such as ChatGPT, with tool-use abilities to connect with massive external APIs. In this work, we introduce ModelScope-Agent, a general and customizable agent framework for real-world applications, based on open-source LLMs as controllers. It provides a user-friendly system library, with customizable engine design to support model training on multiple open-source LLMs, while also enabling seamless integration with both model APIs and common APIs in a unified way. To equip the LLMs with tool-use abilities, a comprehensive framework has been proposed spanning over tool-use data collection, tool retrieval, tool registration, memory control, customized model training, and evaluation for practical real-world applications. Finally, we showcase ModelScopeGPT, a real-world intelligent assistant of ModelScope Community based on the ModelScope-Agent framework, which is able to connect open-source LLMs with more than 1000 public AI models and localized community knowledge in ModelScope. The ModelScope-Agent libraryhttps://github.com/modelscope/modelscope-agent and online demohttps://modelscope.cn/studios/damo/ModelScopeGPT/summary are now publicly available.
PDF211December 15, 2024