대규모 언어 모델의 지식 메커니즘: 연구 현황과 전망
Knowledge Mechanisms in Large Language Models: A Survey and Perspective
July 22, 2024
저자: Mengru Wang, Yunzhi Yao, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang, Xiang Chen, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI
초록
대규모 언어 모델(LLM)의 지식 메커니즘을 이해하는 것은 신뢰할 수 있는 인공 일반 지능(AGI)으로 나아가기 위해 필수적입니다. 본 논문은 지식 활용과 진화를 포함한 새로운 분류 체계를 통해 지식 메커니즘 분석을 검토합니다. 지식 활용은 기억, 이해 및 적용, 창조의 메커니즘을 심층적으로 탐구합니다. 지식 진화는 개별 및 그룹 LLM 내에서 지식의 동적 진행에 초점을 맞춥니다. 또한, 우리는 LLM이 학습한 지식이 무엇인지, 파라미터적 지식의 취약성 원인, 그리고 해결하기 어려울 잠재적 암묵 지식(가설)에 대해 논의합니다. 이 연구가 LLM의 지식을 이해하고 향후 연구에 통찰을 제공하는 데 도움이 되기를 바랍니다.
English
Understanding knowledge mechanisms in Large Language Models (LLMs) is crucial
for advancing towards trustworthy AGI. This paper reviews knowledge mechanism
analysis from a novel taxonomy including knowledge utilization and evolution.
Knowledge utilization delves into the mechanism of memorization, comprehension
and application, and creation. Knowledge evolution focuses on the dynamic
progression of knowledge within individual and group LLMs. Moreover, we discuss
what knowledge LLMs have learned, the reasons for the fragility of parametric
knowledge, and the potential dark knowledge (hypothesis) that will be
challenging to address. We hope this work can help understand knowledge in LLMs
and provide insights for future research.Summary
AI-Generated Summary