Wissensmechanismen in großen Sprachmodellen: Eine Übersicht und Perspektive
Knowledge Mechanisms in Large Language Models: A Survey and Perspective
July 22, 2024
Autoren: Mengru Wang, Yunzhi Yao, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang, Xiang Chen, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI
Zusammenfassung
Das Verständnis der Wissensmechanismen in Large Language Models (LLMs) ist entscheidend für die Weiterentwicklung hin zu vertrauenswürdiger KI. Diese Arbeit überprüft die Analyse der Wissensmechanismen anhand einer neuen Taxonomie, die die Wissensnutzung und -entwicklung umfasst. Die Wissensnutzung untersucht den Mechanismus der Memorierung, des Verstehens und der Anwendung sowie der Erstellung von Wissen. Die Wissensentwicklung konzentriert sich auf die dynamische Progression des Wissens innerhalb einzelner und Gruppen von LLMs. Darüber hinaus diskutieren wir, welches Wissen LLMs erlangt haben, die Gründe für die Fragilität des parametrischen Wissens und das potenzielle dunkle Wissen (Hypothese), das schwierig zu bewältigen sein wird. Wir hoffen, dass diese Arbeit dazu beitragen kann, das Wissen in LLMs zu verstehen und Einblicke für zukünftige Forschung zu liefern.
English
Understanding knowledge mechanisms in Large Language Models (LLMs) is crucial
for advancing towards trustworthy AGI. This paper reviews knowledge mechanism
analysis from a novel taxonomy including knowledge utilization and evolution.
Knowledge utilization delves into the mechanism of memorization, comprehension
and application, and creation. Knowledge evolution focuses on the dynamic
progression of knowledge within individual and group LLMs. Moreover, we discuss
what knowledge LLMs have learned, the reasons for the fragility of parametric
knowledge, and the potential dark knowledge (hypothesis) that will be
challenging to address. We hope this work can help understand knowledge in LLMs
and provide insights for future research.Summary
AI-Generated Summary