TPTU : Planification de tâches et utilisation d'outils par les agents IA basés sur des modèles de langage de grande taille
TPTU: Task Planning and Tool Usage of Large Language Model-based AI Agents
August 7, 2023
Auteurs: Jingqing Ruan, Yihong Chen, Bin Zhang, Zhiwei Xu, Tianpeng Bao, Guoqing Du, Shiwei Shi, Hangyu Mao, Xingyu Zeng, Rui Zhao
cs.AI
Résumé
Avec les récents progrès en traitement du langage naturel, les modèles de langage de grande taille (LLMs) sont apparus comme des outils puissants pour diverses applications pratiques. Malgré leurs prouesses, les capacités génératives intrinsèques des LLMs peuvent s'avérer insuffisantes pour gérer des tâches complexes nécessitant une combinaison de planification de tâches et d'utilisation d'outils externes. Dans cet article, nous proposons d'abord un cadre structuré adapté aux agents d'IA basés sur des LLMs et discutons des capacités cruciales nécessaires pour résoudre des problèmes complexes. Dans ce cadre, nous concevons deux types distincts d'agents (à savoir, un agent à une étape et un agent séquentiel) pour exécuter le processus d'inférence. Par la suite, nous instancions ce cadre en utilisant divers LLMs et évaluons leurs capacités de Planification de Tâches et d'Utilisation d'Outils (TPTU) sur des tâches typiques. En mettant en lumière les principales découvertes et les défis, notre objectif est de fournir une ressource utile aux chercheurs et aux praticiens pour exploiter la puissance des LLMs dans leurs applications d'IA. Notre étude souligne le potentiel considérable de ces modèles, tout en identifiant les domaines nécessitant davantage d'investigation et d'amélioration.
English
With recent advancements in natural language processing, Large Language
Models (LLMs) have emerged as powerful tools for various real-world
applications. Despite their prowess, the intrinsic generative abilities of LLMs
may prove insufficient for handling complex tasks which necessitate a
combination of task planning and the usage of external tools. In this paper, we
first propose a structured framework tailored for LLM-based AI Agents and
discuss the crucial capabilities necessary for tackling intricate problems.
Within this framework, we design two distinct types of agents (i.e., one-step
agent and sequential agent) to execute the inference process. Subsequently, we
instantiate the framework using various LLMs and evaluate their Task Planning
and Tool Usage (TPTU) abilities on typical tasks. By highlighting key findings
and challenges, our goal is to provide a helpful resource for researchers and
practitioners to leverage the power of LLMs in their AI applications. Our study
emphasizes the substantial potential of these models, while also identifying
areas that need more investigation and improvement.