TPTU: Planificación de Tareas y Uso de Herramientas en Agentes de IA Basados en Modelos de Lenguaje de Gran Escala
TPTU: Task Planning and Tool Usage of Large Language Model-based AI Agents
August 7, 2023
Autores: Jingqing Ruan, Yihong Chen, Bin Zhang, Zhiwei Xu, Tianpeng Bao, Guoqing Du, Shiwei Shi, Hangyu Mao, Xingyu Zeng, Rui Zhao
cs.AI
Resumen
Con los recientes avances en el procesamiento del lenguaje natural, los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) han surgido como herramientas poderosas para diversas aplicaciones del mundo real. A pesar de su destreza, las capacidades generativas intrínsecas de los LLMs pueden resultar insuficientes para manejar tareas complejas que requieren una combinación de planificación de tareas y el uso de herramientas externas. En este artículo, primero proponemos un marco estructurado diseñado específicamente para Agentes de IA basados en LLMs y discutimos las capacidades cruciales necesarias para abordar problemas intrincados. Dentro de este marco, diseñamos dos tipos distintos de agentes (es decir, un agente de un solo paso y un agente secuencial) para ejecutar el proceso de inferencia. Posteriormente, instanciamos el marco utilizando varios LLMs y evaluamos sus habilidades de Planificación de Tareas y Uso de Herramientas (TPTU, por sus siglas en inglés) en tareas típicas. Al resaltar hallazgos clave y desafíos, nuestro objetivo es proporcionar un recurso útil para que investigadores y profesionales aprovechen el poder de los LLMs en sus aplicaciones de IA. Nuestro estudio enfatiza el potencial significativo de estos modelos, al mismo tiempo que identifica áreas que requieren más investigación y mejora.
English
With recent advancements in natural language processing, Large Language
Models (LLMs) have emerged as powerful tools for various real-world
applications. Despite their prowess, the intrinsic generative abilities of LLMs
may prove insufficient for handling complex tasks which necessitate a
combination of task planning and the usage of external tools. In this paper, we
first propose a structured framework tailored for LLM-based AI Agents and
discuss the crucial capabilities necessary for tackling intricate problems.
Within this framework, we design two distinct types of agents (i.e., one-step
agent and sequential agent) to execute the inference process. Subsequently, we
instantiate the framework using various LLMs and evaluate their Task Planning
and Tool Usage (TPTU) abilities on typical tasks. By highlighting key findings
and challenges, our goal is to provide a helpful resource for researchers and
practitioners to leverage the power of LLMs in their AI applications. Our study
emphasizes the substantial potential of these models, while also identifying
areas that need more investigation and improvement.