TPTU: Pianificazione delle Attività e Utilizzo degli Strumenti negli Agenti AI basati su Modelli Linguistici di Grande Scala
TPTU: Task Planning and Tool Usage of Large Language Model-based AI Agents
August 7, 2023
Autori: Jingqing Ruan, Yihong Chen, Bin Zhang, Zhiwei Xu, Tianpeng Bao, Guoqing Du, Shiwei Shi, Hangyu Mao, Xingyu Zeng, Rui Zhao
cs.AI
Abstract
Con i recenti progressi nell'elaborazione del linguaggio naturale, i Modelli Linguistici di Grande Scala (LLM) sono emersi come strumenti potenti per varie applicazioni nel mondo reale. Nonostante le loro capacità, le abilità generative intrinseche degli LLM potrebbero rivelarsi insufficienti per gestire compiti complessi che richiedono una combinazione di pianificazione delle attività e utilizzo di strumenti esterni. In questo articolo, proponiamo innanzitutto un framework strutturato specificamente per Agenti AI basati su LLM e discutiamo le capacità cruciali necessarie per affrontare problemi intricati. All'interno di questo framework, progettiamo due tipi distinti di agenti (ovvero, agente a un passo e agente sequenziale) per eseguire il processo di inferenza. Successivamente, istanziamo il framework utilizzando vari LLM e valutiamo le loro abilità di Pianificazione delle Attività e Utilizzo degli Strumenti (TPTU) su compiti tipici. Evidenziando i risultati chiave e le sfide, il nostro obiettivo è fornire una risorsa utile per ricercatori e professionisti per sfruttare il potere degli LLM nelle loro applicazioni AI. Il nostro studio sottolinea il notevole potenziale di questi modelli, identificando al contempo aree che necessitano di ulteriori indagini e miglioramenti.
English
With recent advancements in natural language processing, Large Language
Models (LLMs) have emerged as powerful tools for various real-world
applications. Despite their prowess, the intrinsic generative abilities of LLMs
may prove insufficient for handling complex tasks which necessitate a
combination of task planning and the usage of external tools. In this paper, we
first propose a structured framework tailored for LLM-based AI Agents and
discuss the crucial capabilities necessary for tackling intricate problems.
Within this framework, we design two distinct types of agents (i.e., one-step
agent and sequential agent) to execute the inference process. Subsequently, we
instantiate the framework using various LLMs and evaluate their Task Planning
and Tool Usage (TPTU) abilities on typical tasks. By highlighting key findings
and challenges, our goal is to provide a helpful resource for researchers and
practitioners to leverage the power of LLMs in their AI applications. Our study
emphasizes the substantial potential of these models, while also identifying
areas that need more investigation and improvement.