에이전트적 지식 기반 자기인식
Agentic Knowledgeable Self-awareness
April 4, 2025
저자: Shuofei Qiao, Zhisong Qiu, Baochang Ren, Xiaobin Wang, Xiangyuan Ru, Ningyu Zhang, Xiang Chen, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen
cs.AI
초록
대형 언어 모델(LLMs)은 다양한 에이전트 계획 작업에서 상당한 성능을 달성했습니다. 그러나 전통적인 에이전트 계획 접근법은 '홍수 관개' 방식으로, 금본위 궤적(gold trajectories), 외부 피드백, 도메인 지식을 에이전트 모델에 무차별적으로 주입합니다. 이러한 관행은 의사결정 과정에서 상황에 대한 자기 인식이라는 인간의 근본적인 인지 원리를 간과합니다. 이는 상황적 요구를 동적으로 평가하고 의사결정 과정에서 전략적으로 자원을 활용하는 능력을 말합니다. 이러한 격차를 해결하기 위해, 우리는 에이전트가 지식을 자율적으로 조절할 수 있도록 하는 새로운 패러다임인 '에이전트 지식 자기 인식(agentic knowledgeable self-awareness)'을 제안합니다. 구체적으로, 우리는 인간과 같이 지식 자기 인식을 갖춘 에이전트를 적용하는 데이터 중심 접근법인 KnowSelf를 제안합니다. 이를 위해, 우리는 에이전트의 자체 탐색 궤적에 특수 토큰을 표시하기 위한 휴리스틱 상황 판단 기준을 설계하여 훈련 데이터를 수집합니다. 두 단계의 훈련 과정을 통해, 에이전트 모델은 특정 특수 토큰을 생성하여 다양한 상황 간 전환을 가능하게 하고, 최소 비용으로 최적의 계획 효과를 달성합니다. 우리의 실험은 KnowSelf가 외부 지식을 최소한으로 사용하면서도 다양한 작업과 모델에서 강력한 베이스라인을 능가할 수 있음을 보여줍니다. 코드는 https://github.com/zjunlp/KnowSelf에서 확인할 수 있습니다.
English
Large Language Models (LLMs) have achieved considerable performance across
various agentic planning tasks. However, traditional agent planning approaches
adopt a "flood irrigation" methodology that indiscriminately injects gold
trajectories, external feedback, and domain knowledge into agent models. This
practice overlooks the fundamental human cognitive principle of situational
self-awareness during decision-making-the ability to dynamically assess
situational demands and strategically employ resources during decision-making.
We propose agentic knowledgeable self-awareness to address this gap, a novel
paradigm enabling LLM-based agents to autonomously regulate knowledge
utilization. Specifically, we propose KnowSelf, a data-centric approach that
applies agents with knowledgeable self-awareness like humans. Concretely, we
devise a heuristic situation judgement criterion to mark special tokens on the
agent's self-explored trajectories for collecting training data. Through a
two-stage training process, the agent model can switch between different
situations by generating specific special tokens, achieving optimal planning
effects with minimal costs. Our experiments demonstrate that KnowSelf can
outperform various strong baselines on different tasks and models with minimal
use of external knowledge. Code is available at
https://github.com/zjunlp/KnowSelf.Summary
AI-Generated Summary