Kennismechanismen in Grote Taalmodellen: Een Overzicht en Perspectief
Knowledge Mechanisms in Large Language Models: A Survey and Perspective
July 22, 2024
Auteurs: Mengru Wang, Yunzhi Yao, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang, Xiang Chen, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI
Samenvatting
Het begrijpen van kennismechanismen in Large Language Models (LLMs) is cruciaal voor de vooruitgang naar betrouwbare AGI. Dit artikel bespreekt de analyse van kennismechanismen vanuit een nieuwe taxonomie, inclusief kennisbenutting en -evolutie. Kennisbenutting verdiept zich in het mechanisme van memorisatie, begrip en toepassing, en creatie. Kennis evolutie richt zich op de dynamische voortgang van kennis binnen individuele en groeps-LLMs. Bovendien bespreken we welke kennis LLMs hebben geleerd, de redenen voor de kwetsbaarheid van parametrische kennis, en de potentiële donkere kennis (hypothese) die moeilijk aan te pakken zal zijn. We hopen dat dit werk kan bijdragen aan het begrijpen van kennis in LLMs en inzichten kan bieden voor toekomstig onderzoek.
English
Understanding knowledge mechanisms in Large Language Models (LLMs) is crucial
for advancing towards trustworthy AGI. This paper reviews knowledge mechanism
analysis from a novel taxonomy including knowledge utilization and evolution.
Knowledge utilization delves into the mechanism of memorization, comprehension
and application, and creation. Knowledge evolution focuses on the dynamic
progression of knowledge within individual and group LLMs. Moreover, we discuss
what knowledge LLMs have learned, the reasons for the fragility of parametric
knowledge, and the potential dark knowledge (hypothesis) that will be
challenging to address. We hope this work can help understand knowledge in LLMs
and provide insights for future research.