GenAgent: Aufbau von kollaborativen KI-Systemen mit automatisiertem Workflow - Generierung von Fallstudien zu ComfyUI.

Zusammenfassung

Viel frühere KI-Forschung konzentrierte sich darauf, monolithische Modelle zu entwickeln, um ihre Intelligenz und Leistungsfähigkeit zu maximieren, mit dem Hauptziel, die Leistung bei spezifischen Aufgaben zu verbessern. Im Gegensatz dazu erforscht dieser Artikel einen alternativen Ansatz: kollaborative KI-Systeme, die Workflows nutzen, um Modelle, Datenquellen und Pipelines zu integrieren, um komplexe und vielfältige Aufgaben zu lösen. Wir stellen GenAgent vor, ein auf LLM basierendes Framework, das automatisch komplexe Workflows generiert und im Vergleich zu monolithischen Modellen eine größere Flexibilität und Skalierbarkeit bietet. Die Kerninnovation von GenAgent besteht darin, Workflows mit Code zu repräsentieren und Workflows schrittweise mit kollaborativen Agenten zu erstellen. Wir implementieren GenAgent auf der Plattform ComfyUI und schlagen einen neuen Benchmark, OpenComfy, vor. Die Ergebnisse zeigen, dass GenAgent in sowohl Lauf- als auch Aufgabenevaluierungen Basismethoden übertrifft und somit seine Fähigkeit zeigt, komplexe Workflows mit überlegener Effektivität und Stabilität zu generieren.

English

Much previous AI research has focused on developing monolithic models to maximize their intelligence and capability, with the primary goal of enhancing performance on specific tasks. In contrast, this paper explores an alternative approach: collaborative AI systems that use workflows to integrate models, data sources, and pipelines to solve complex and diverse tasks. We introduce GenAgent, an LLM-based framework that automatically generates complex workflows, offering greater flexibility and scalability compared to monolithic models. The core innovation of GenAgent lies in representing workflows with code, alongside constructing workflows with collaborative agents in a step-by-step manner. We implement GenAgent on the ComfyUI platform and propose a new benchmark, OpenComfy. The results demonstrate that GenAgent outperforms baseline approaches in both run-level and task-level evaluations, showing its capability to generate complex workflows with superior effectiveness and stability.