GenAgent: Construcción de Sistemas de IA Colaborativos con Flujo de Trabajo Automatizado - Generación de Casos de Estudio sobre ComfyUI

Resumen

Mucha de la investigación previa en IA se ha centrado en desarrollar modelos monolíticos para maximizar su inteligencia y capacidad, con el objetivo principal de mejorar el rendimiento en tareas específicas. En contraste, este documento explora un enfoque alternativo: sistemas colaborativos de IA que utilizan flujos de trabajo para integrar modelos, fuentes de datos y canalizaciones para resolver tareas complejas y diversas. Presentamos GenAgent, un marco basado en LLM que genera automáticamente flujos de trabajo complejos, ofreciendo mayor flexibilidad y escalabilidad en comparación con modelos monolíticos. La innovación central de GenAgent radica en representar flujos de trabajo con código, junto con la construcción de flujos de trabajo con agentes colaborativos de manera paso a paso. Implementamos GenAgent en la plataforma ComfyUI y proponemos un nuevo punto de referencia, OpenComfy. Los resultados demuestran que GenAgent supera a los enfoques de referencia tanto en evaluaciones a nivel de ejecución como a nivel de tarea, mostrando su capacidad para generar flujos de trabajo complejos con una efectividad y estabilidad superiores.

English

Much previous AI research has focused on developing monolithic models to maximize their intelligence and capability, with the primary goal of enhancing performance on specific tasks. In contrast, this paper explores an alternative approach: collaborative AI systems that use workflows to integrate models, data sources, and pipelines to solve complex and diverse tasks. We introduce GenAgent, an LLM-based framework that automatically generates complex workflows, offering greater flexibility and scalability compared to monolithic models. The core innovation of GenAgent lies in representing workflows with code, alongside constructing workflows with collaborative agents in a step-by-step manner. We implement GenAgent on the ComfyUI platform and propose a new benchmark, OpenComfy. The results demonstrate that GenAgent outperforms baseline approaches in both run-level and task-level evaluations, showing its capability to generate complex workflows with superior effectiveness and stability.