エージェント的知識的自己認識
Agentic Knowledgeable Self-awareness
April 4, 2025
著者: Shuofei Qiao, Zhisong Qiu, Baochang Ren, Xiaobin Wang, Xiangyuan Ru, Ningyu Zhang, Xiang Chen, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen
cs.AI
要旨
大規模言語モデル(LLMs)は、様々なエージェント計画タスクにおいて顕著な性能を発揮してきました。しかし、従来のエージェント計画アプローチは、「洪水灌漑」的な方法論を採用し、ゴールドトラジェクトリ、外部フィードバック、およびドメイン知識を無差別にエージェントモデルに注入しています。この手法は、意思決定における状況的自己認識という人間の基本的な認知原則を見落としています。状況的自己認識とは、状況の要求を動的に評価し、意思決定中に戦略的にリソースを活用する能力です。このギャップを埋めるために、我々はエージェントの知識的自己認識を提案します。これは、LLMベースのエージェントが知識の利用を自律的に調整することを可能にする新しいパラダイムです。具体的には、人間のように知識的自己認識を持つエージェントを適用するデータ中心のアプローチであるKnowSelfを提案します。具体的には、エージェントの自己探索トラジェクトリに特殊トークンをマークするためのヒューリスティックな状況判断基準を考案し、トレーニングデータを収集します。二段階のトレーニングプロセスを通じて、エージェントモデルは特定の特殊トークンを生成することで異なる状況間を切り替え、最小限のコストで最適な計画効果を達成します。我々の実験では、KnowSelfが外部知識を最小限に使用しながら、異なるタスクやモデルにおいて様々な強力なベースラインを上回ることを実証しています。コードはhttps://github.com/zjunlp/KnowSelfで公開されています。
English
Large Language Models (LLMs) have achieved considerable performance across
various agentic planning tasks. However, traditional agent planning approaches
adopt a "flood irrigation" methodology that indiscriminately injects gold
trajectories, external feedback, and domain knowledge into agent models. This
practice overlooks the fundamental human cognitive principle of situational
self-awareness during decision-making-the ability to dynamically assess
situational demands and strategically employ resources during decision-making.
We propose agentic knowledgeable self-awareness to address this gap, a novel
paradigm enabling LLM-based agents to autonomously regulate knowledge
utilization. Specifically, we propose KnowSelf, a data-centric approach that
applies agents with knowledgeable self-awareness like humans. Concretely, we
devise a heuristic situation judgement criterion to mark special tokens on the
agent's self-explored trajectories for collecting training data. Through a
two-stage training process, the agent model can switch between different
situations by generating specific special tokens, achieving optimal planning
effects with minimal costs. Our experiments demonstrate that KnowSelf can
outperform various strong baselines on different tasks and models with minimal
use of external knowledge. Code is available at
https://github.com/zjunlp/KnowSelf.Summary
AI-Generated Summary