GenAgent: Construcción de Sistemas de IA Colaborativos con Flujo de Trabajo Automatizado - Generación de Casos de Estudio sobre ComfyUI
GenAgent: Build Collaborative AI Systems with Automated Workflow Generation -- Case Studies on ComfyUI
September 2, 2024
Autores: Xiangyuan Xue, Zeyu Lu, Di Huang, Wanli Ouyang, Lei Bai
cs.AI
Resumen
Mucha de la investigación previa en IA se ha centrado en desarrollar modelos monolíticos para maximizar su inteligencia y capacidad, con el objetivo principal de mejorar el rendimiento en tareas específicas. En contraste, este documento explora un enfoque alternativo: sistemas colaborativos de IA que utilizan flujos de trabajo para integrar modelos, fuentes de datos y canalizaciones para resolver tareas complejas y diversas. Presentamos GenAgent, un marco basado en LLM que genera automáticamente flujos de trabajo complejos, ofreciendo mayor flexibilidad y escalabilidad en comparación con modelos monolíticos. La innovación central de GenAgent radica en representar flujos de trabajo con código, junto con la construcción de flujos de trabajo con agentes colaborativos de manera paso a paso. Implementamos GenAgent en la plataforma ComfyUI y proponemos un nuevo punto de referencia, OpenComfy. Los resultados demuestran que GenAgent supera a los enfoques de referencia tanto en evaluaciones a nivel de ejecución como a nivel de tarea, mostrando su capacidad para generar flujos de trabajo complejos con una efectividad y estabilidad superiores.
English
Much previous AI research has focused on developing monolithic models to
maximize their intelligence and capability, with the primary goal of enhancing
performance on specific tasks. In contrast, this paper explores an alternative
approach: collaborative AI systems that use workflows to integrate models, data
sources, and pipelines to solve complex and diverse tasks. We introduce
GenAgent, an LLM-based framework that automatically generates complex
workflows, offering greater flexibility and scalability compared to monolithic
models. The core innovation of GenAgent lies in representing workflows with
code, alongside constructing workflows with collaborative agents in a
step-by-step manner. We implement GenAgent on the ComfyUI platform and propose
a new benchmark, OpenComfy. The results demonstrate that GenAgent outperforms
baseline approaches in both run-level and task-level evaluations, showing its
capability to generate complex workflows with superior effectiveness and
stability.Summary
AI-Generated Summary