ChatPaper.aiChatPaper

FlowMind: LLMによる自動ワークフロー生成

FlowMind: Automatic Workflow Generation with LLMs

March 17, 2024
著者: Zhen Zeng, William Watson, Nicole Cho, Saba Rahimi, Shayleen Reynolds, Tucker Balch, Manuela Veloso
cs.AI

要旨

急速に進化するロボティック・プロセス・オートメーション(RPA)の分野は、反復的なプロセスの自動化において大きな進展を遂げてきたが、ユーザーが要求する自発的または予測不可能なタスクを必要とするシナリオではその効果が低下する。本論文では、この制限を克服し、自動ワークフロー生成システムを構築するために、Generative Pretrained Transformer(GPT)などの大規模言語モデル(LLM)の能力を活用した新しいアプローチであるFlowMindを紹介する。FlowMindでは、LLMの推論を信頼性のあるアプリケーション・プログラミング・インターフェース(API)に基づかせるための汎用的なプロンプトレシピを提案する。これにより、FlowMindはLLMにおける一般的な問題である「幻覚」を軽減するだけでなく、LLMと機密データやコードとの直接的な相互作用を排除し、金融サービスにおける情報の完全性と機密性を確保する。さらに、FlowMindは自動生成されたワークフローの高レベルな説明を提示することでユーザーインタラクションを簡素化し、ユーザーが効果的に検査しフィードバックを提供できるようにする。また、ファンドに関するN-CENレポートからの質問応答タスクをベンチマークするための新しい金融データセットであるNCEN-QAを紹介する。NCEN-QAを使用して、FlowMindによって生成されたワークフローのパフォーマンスをベースラインおよびFlowMindのアブレーションバリアントと比較評価した。FlowMindの成功、提案されたプロンプトレシピの各コンポーネントの重要性、およびFlowMindにおけるユーザーインタラクションとフィードバックの有効性を実証する。
English
The rapidly evolving field of Robotic Process Automation (RPA) has made significant strides in automating repetitive processes, yet its effectiveness diminishes in scenarios requiring spontaneous or unpredictable tasks demanded by users. This paper introduces a novel approach, FlowMind, leveraging the capabilities of Large Language Models (LLMs) such as Generative Pretrained Transformer (GPT), to address this limitation and create an automatic workflow generation system. In FlowMind, we propose a generic prompt recipe for a lecture that helps ground LLM reasoning with reliable Application Programming Interfaces (APIs). With this, FlowMind not only mitigates the common issue of hallucinations in LLMs, but also eliminates direct interaction between LLMs and proprietary data or code, thus ensuring the integrity and confidentiality of information - a cornerstone in financial services. FlowMind further simplifies user interaction by presenting high-level descriptions of auto-generated workflows, enabling users to inspect and provide feedback effectively. We also introduce NCEN-QA, a new dataset in finance for benchmarking question-answering tasks from N-CEN reports on funds. We used NCEN-QA to evaluate the performance of workflows generated by FlowMind against baseline and ablation variants of FlowMind. We demonstrate the success of FlowMind, the importance of each component in the proposed lecture recipe, and the effectiveness of user interaction and feedback in FlowMind.

Summary

AI-Generated Summary

PDF351December 15, 2024