TPTU: Planejamento de Tarefas e Uso de Ferramentas por Agentes de IA Baseados em Modelos de Linguagem de Grande Escala
TPTU: Task Planning and Tool Usage of Large Language Model-based AI Agents
August 7, 2023
Autores: Jingqing Ruan, Yihong Chen, Bin Zhang, Zhiwei Xu, Tianpeng Bao, Guoqing Du, Shiwei Shi, Hangyu Mao, Xingyu Zeng, Rui Zhao
cs.AI
Resumo
Com os recentes avanços no processamento de linguagem natural, os Modelos de Linguagem de Grande Escala (LLMs, na sigla em inglês) surgiram como ferramentas poderosas para diversas aplicações do mundo real. Apesar de sua capacidade, as habilidades gerativas intrínsecas dos LLMs podem se mostrar insuficientes para lidar com tarefas complexas que exigem uma combinação de planejamento de tarefas e o uso de ferramentas externas. Neste artigo, propomos inicialmente uma estrutura estruturada adaptada para Agentes de IA baseados em LLMs e discutimos as capacidades cruciais necessárias para resolver problemas intrincados. Dentro dessa estrutura, projetamos dois tipos distintos de agentes (ou seja, agente de etapa única e agente sequencial) para executar o processo de inferência. Posteriormente, instanciamos a estrutura utilizando diversos LLMs e avaliamos suas habilidades de Planejamento de Tarefas e Uso de Ferramentas (TPTU, na sigla em inglês) em tarefas típicas. Ao destacar descobertas e desafios importantes, nosso objetivo é fornecer um recurso útil para pesquisadores e profissionais aproveitarem o poder dos LLMs em suas aplicações de IA. Nosso estudo enfatiza o potencial substancial desses modelos, ao mesmo tempo em que identifica áreas que precisam de mais investigação e aprimoramento.
English
With recent advancements in natural language processing, Large Language
Models (LLMs) have emerged as powerful tools for various real-world
applications. Despite their prowess, the intrinsic generative abilities of LLMs
may prove insufficient for handling complex tasks which necessitate a
combination of task planning and the usage of external tools. In this paper, we
first propose a structured framework tailored for LLM-based AI Agents and
discuss the crucial capabilities necessary for tackling intricate problems.
Within this framework, we design two distinct types of agents (i.e., one-step
agent and sequential agent) to execute the inference process. Subsequently, we
instantiate the framework using various LLMs and evaluate their Task Planning
and Tool Usage (TPTU) abilities on typical tasks. By highlighting key findings
and challenges, our goal is to provide a helpful resource for researchers and
practitioners to leverage the power of LLMs in their AI applications. Our study
emphasizes the substantial potential of these models, while also identifying
areas that need more investigation and improvement.