ChatPaper.aiChatPaper

Génération d'un flux de travail complet à faible code via la décomposition des tâches et RAG

Generating a Low-code Complete Workflow via Task Decomposition and RAG

November 29, 2024
Auteurs: Orlando Marquez Ayala, Patrice Béchard
cs.AI

Résumé

Les technologies de l'IA évoluent rapidement de la recherche à la production. Avec la popularité des Modèles Fondamentaux (MF) qui génèrent du texte, des images et des vidéos, les systèmes basés sur l'IA voient leur complexité augmenter. Comparés aux logiciels traditionnels basés sur l'IA, les systèmes utilisant des MF, ou les systèmes basés sur l'IA générative, sont plus difficiles à concevoir en raison de leur ampleur et de leur polyvalence. Cela rend nécessaire la documentation des meilleures pratiques, appelées motifs de conception en génie logiciel, pouvant être utilisées dans l'ensemble des applications basées sur l'IA générative. Notre première contribution consiste à formaliser deux techniques, la Décomposition des Tâches et la Génération Augmentée par Récupération (RAG), en tant que motifs de conception pour les systèmes basés sur l'IA générative. Nous discutons de leurs compromis en termes d'attributs de qualité logicielle et commentons les approches alternatives. Nous recommandons aux praticiens de l'IA de considérer ces techniques non seulement d'un point de vue scientifique, mais aussi du point de vue des propriétés d'ingénierie souhaitées telles que la flexibilité, la maintenabilité, la sécurité et la sûreté. En tant que deuxième contribution, nous décrivons notre expérience industrielle en appliquant la Décomposition des Tâches et la RAG pour construire une application GenAI complexe du monde réel pour les utilisateurs d'entreprise : la Génération de Flux de Travail. La tâche de génération de flux de travail consiste à élaborer un plan spécifique en utilisant des données de l'environnement du système, en prenant comme entrée une exigence utilisateur. Comme ces deux motifs affectent l'ensemble du cycle de développement de l'IA, nous expliquons comment ils ont impacté la création de jeux de données, l'entraînement des modèles, l'évaluation des modèles et les phases de déploiement.
English
AI technologies are moving rapidly from research to production. With the popularity of Foundation Models (FMs) that generate text, images, and video, AI-based systems are increasing their complexity. Compared to traditional AI-based software, systems employing FMs, or GenAI-based systems, are more difficult to design due to their scale and versatility. This makes it necessary to document best practices, known as design patterns in software engineering, that can be used across GenAI applications. Our first contribution is to formalize two techniques, Task Decomposition and Retrieval-Augmented Generation (RAG), as design patterns for GenAI-based systems. We discuss their trade-offs in terms of software quality attributes and comment on alternative approaches. We recommend to AI practitioners to consider these techniques not only from a scientific perspective but also from the standpoint of desired engineering properties such as flexibility, maintainability, safety, and security. As a second contribution, we describe our industry experience applying Task Decomposition and RAG to build a complex real-world GenAI application for enterprise users: Workflow Generation. The task of generating workflows entails generating a specific plan using data from the system environment, taking as input a user requirement. As these two patterns affect the entire AI development cycle, we explain how they impacted the dataset creation, model training, model evaluation, and deployment phases.

Summary

AI-Generated Summary

PDF52December 4, 2024