ChatPaper.aiChatPaper

エージェント的知識的自己認識

Agentic Knowledgeable Self-awareness

April 4, 2025
著者: Shuofei Qiao, Zhisong Qiu, Baochang Ren, Xiaobin Wang, Xiangyuan Ru, Ningyu Zhang, Xiang Chen, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen
cs.AI

要旨

大規模言語モデル(LLMs)は、様々なエージェント計画タスクにおいて顕著な性能を発揮してきました。しかし、従来のエージェント計画アプローチは、「洪水灌漑」的な方法論を採用し、ゴールドトラジェクトリ、外部フィードバック、およびドメイン知識を無差別にエージェントモデルに注入しています。この手法は、意思決定における状況的自己認識という人間の基本的な認知原則を見落としています。状況的自己認識とは、状況の要求を動的に評価し、意思決定中に戦略的にリソースを活用する能力です。このギャップを埋めるために、我々はエージェントの知識的自己認識を提案します。これは、LLMベースのエージェントが知識の利用を自律的に調整することを可能にする新しいパラダイムです。具体的には、人間のように知識的自己認識を持つエージェントを適用するデータ中心のアプローチであるKnowSelfを提案します。具体的には、エージェントの自己探索トラジェクトリに特殊トークンをマークするためのヒューリスティックな状況判断基準を考案し、トレーニングデータを収集します。二段階のトレーニングプロセスを通じて、エージェントモデルは特定の特殊トークンを生成することで異なる状況間を切り替え、最小限のコストで最適な計画効果を達成します。我々の実験では、KnowSelfが外部知識を最小限に使用しながら、異なるタスクやモデルにおいて様々な強力なベースラインを上回ることを実証しています。コードはhttps://github.com/zjunlp/KnowSelfで公開されています。
English
Large Language Models (LLMs) have achieved considerable performance across various agentic planning tasks. However, traditional agent planning approaches adopt a "flood irrigation" methodology that indiscriminately injects gold trajectories, external feedback, and domain knowledge into agent models. This practice overlooks the fundamental human cognitive principle of situational self-awareness during decision-making-the ability to dynamically assess situational demands and strategically employ resources during decision-making. We propose agentic knowledgeable self-awareness to address this gap, a novel paradigm enabling LLM-based agents to autonomously regulate knowledge utilization. Specifically, we propose KnowSelf, a data-centric approach that applies agents with knowledgeable self-awareness like humans. Concretely, we devise a heuristic situation judgement criterion to mark special tokens on the agent's self-explored trajectories for collecting training data. Through a two-stage training process, the agent model can switch between different situations by generating specific special tokens, achieving optimal planning effects with minimal costs. Our experiments demonstrate that KnowSelf can outperform various strong baselines on different tasks and models with minimal use of external knowledge. Code is available at https://github.com/zjunlp/KnowSelf.

Summary

AI-Generated Summary

PDF282April 7, 2025