TPTU: Планирование задач и использование инструментов ИИ-агентов на основе больших языковых моделей
TPTU: Task Planning and Tool Usage of Large Language Model-based AI Agents
August 7, 2023
Авторы: Jingqing Ruan, Yihong Chen, Bin Zhang, Zhiwei Xu, Tianpeng Bao, Guoqing Du, Shiwei Shi, Hangyu Mao, Xingyu Zeng, Rui Zhao
cs.AI
Аннотация
Современные достижения в области обработки естественного языка привели к появлению крупных языковых моделей (LLM) как мощных инструментов для решения различных практических задач. Однако, несмотря на их выдающиеся способности, внутренние генеративные возможности LLM могут оказаться недостаточными для выполнения сложных задач, требующих сочетания планирования задач и использования внешних инструментов. В данной работе мы сначала предлагаем структурированную архитектуру, адаптированную для ИИ-агентов на основе LLM, и обсуждаем ключевые способности, необходимые для решения сложных проблем. В рамках этой архитектуры мы разрабатываем два типа агентов (одношаговый и последовательный) для выполнения процесса вывода. Затем мы реализуем эту архитектуру с использованием различных LLM и оцениваем их способности к планированию задач и использованию инструментов (TPTU) на типичных задачах. Подчеркивая ключевые результаты и вызовы, наша цель — предоставить полезный ресурс для исследователей и практиков, чтобы они могли эффективно использовать возможности LLM в своих ИИ-приложениях. Наше исследование подчеркивает значительный потенциал этих моделей, одновременно выявляя области, требующие дальнейшего изучения и улучшения.
English
With recent advancements in natural language processing, Large Language
Models (LLMs) have emerged as powerful tools for various real-world
applications. Despite their prowess, the intrinsic generative abilities of LLMs
may prove insufficient for handling complex tasks which necessitate a
combination of task planning and the usage of external tools. In this paper, we
first propose a structured framework tailored for LLM-based AI Agents and
discuss the crucial capabilities necessary for tackling intricate problems.
Within this framework, we design two distinct types of agents (i.e., one-step
agent and sequential agent) to execute the inference process. Subsequently, we
instantiate the framework using various LLMs and evaluate their Task Planning
and Tool Usage (TPTU) abilities on typical tasks. By highlighting key findings
and challenges, our goal is to provide a helpful resource for researchers and
practitioners to leverage the power of LLMs in their AI applications. Our study
emphasizes the substantial potential of these models, while also identifying
areas that need more investigation and improvement.