GenAgent: 자동화된 워크플로우로 협업하는 AI 시스템 구축 생성 - ComfyUI에 대한 사례 연구
GenAgent: Build Collaborative AI Systems with Automated Workflow Generation -- Case Studies on ComfyUI
September 2, 2024
저자: Xiangyuan Xue, Zeyu Lu, Di Huang, Wanli Ouyang, Lei Bai
cs.AI
초록
과거의 많은 AI 연구는 지능과 능력을 극대화하기 위해 통합적인 모델을 개발하는 데 초점을 맞추었으며, 주요 목표는 특정 작업의 성능을 향상시키는 것이었습니다. 이에 반해, 본 논문은 대안적 접근 방식을 탐구합니다: 복잡하고 다양한 작업을 해결하기 위해 모델, 데이터 소스 및 파이프라인을 통합하는 워크플로우를 활용하는 협력적인 AI 시스템입니다. 우리는 LLM 기반의 GenAgent를 소개합니다. 이는 복잡한 워크플로우를 자동으로 생성하여 통합 모델에 비해 더 큰 유연성과 확장성을 제공합니다. GenAgent의 핵심 혁신은 코드로 워크플로우를 표현하고, 협력적 에이전트를 이용하여 단계적으로 워크플로우를 구축하는 데 있습니다. 우리는 GenAgent를 ComfyUI 플랫폼에 구현하고 새로운 벤치마크인 OpenComfy를 제안합니다. 결과는 GenAgent가 실행 수준 및 작업 수준 평가 모두에서 기준선 접근 방식을 능가함을 보여주며, 우수한 효과적이고 안정적인 복잡한 워크플로우를 생성할 수 있는 능력을 보여줍니다.
English
Much previous AI research has focused on developing monolithic models to
maximize their intelligence and capability, with the primary goal of enhancing
performance on specific tasks. In contrast, this paper explores an alternative
approach: collaborative AI systems that use workflows to integrate models, data
sources, and pipelines to solve complex and diverse tasks. We introduce
GenAgent, an LLM-based framework that automatically generates complex
workflows, offering greater flexibility and scalability compared to monolithic
models. The core innovation of GenAgent lies in representing workflows with
code, alongside constructing workflows with collaborative agents in a
step-by-step manner. We implement GenAgent on the ComfyUI platform and propose
a new benchmark, OpenComfy. The results demonstrate that GenAgent outperforms
baseline approaches in both run-level and task-level evaluations, showing its
capability to generate complex workflows with superior effectiveness and
stability.Summary
AI-Generated Summary