GenAgent: Aufbau von kollaborativen KI-Systemen mit automatisiertem Workflow - Generierung von Fallstudien zu ComfyUI.
GenAgent: Build Collaborative AI Systems with Automated Workflow Generation -- Case Studies on ComfyUI
September 2, 2024
Autoren: Xiangyuan Xue, Zeyu Lu, Di Huang, Wanli Ouyang, Lei Bai
cs.AI
Zusammenfassung
Viel frühere KI-Forschung konzentrierte sich darauf, monolithische Modelle zu entwickeln, um ihre Intelligenz und Leistungsfähigkeit zu maximieren, mit dem Hauptziel, die Leistung bei spezifischen Aufgaben zu verbessern. Im Gegensatz dazu erforscht dieser Artikel einen alternativen Ansatz: kollaborative KI-Systeme, die Workflows nutzen, um Modelle, Datenquellen und Pipelines zu integrieren, um komplexe und vielfältige Aufgaben zu lösen. Wir stellen GenAgent vor, ein auf LLM basierendes Framework, das automatisch komplexe Workflows generiert und im Vergleich zu monolithischen Modellen eine größere Flexibilität und Skalierbarkeit bietet. Die Kerninnovation von GenAgent besteht darin, Workflows mit Code zu repräsentieren und Workflows schrittweise mit kollaborativen Agenten zu erstellen. Wir implementieren GenAgent auf der Plattform ComfyUI und schlagen einen neuen Benchmark, OpenComfy, vor. Die Ergebnisse zeigen, dass GenAgent in sowohl Lauf- als auch Aufgabenevaluierungen Basismethoden übertrifft und somit seine Fähigkeit zeigt, komplexe Workflows mit überlegener Effektivität und Stabilität zu generieren.
English
Much previous AI research has focused on developing monolithic models to
maximize their intelligence and capability, with the primary goal of enhancing
performance on specific tasks. In contrast, this paper explores an alternative
approach: collaborative AI systems that use workflows to integrate models, data
sources, and pipelines to solve complex and diverse tasks. We introduce
GenAgent, an LLM-based framework that automatically generates complex
workflows, offering greater flexibility and scalability compared to monolithic
models. The core innovation of GenAgent lies in representing workflows with
code, alongside constructing workflows with collaborative agents in a
step-by-step manner. We implement GenAgent on the ComfyUI platform and propose
a new benchmark, OpenComfy. The results demonstrate that GenAgent outperforms
baseline approaches in both run-level and task-level evaluations, showing its
capability to generate complex workflows with superior effectiveness and
stability.Summary
AI-Generated Summary