ChatPaper.aiChatPaper

Механизмы Знаний в Больших Языковых Моделях: Обзор и Перспективы

Knowledge Mechanisms in Large Language Models: A Survey and Perspective

July 22, 2024
Авторы: Mengru Wang, Yunzhi Yao, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang, Xiang Chen, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI

Аннотация

Понимание механизмов знаний в больших языковых моделях (LLM) критически важно для продвижения в сторону надежного ИИ общего интеллекта. В данной статье рассматривается анализ механизмов знаний с использованием новой таксономии, включающей использование и эволюцию знаний. Использование знаний углубляется в механизм запоминания, понимания и применения, а также создания. Эволюция знаний фокусируется на динамическом развитии знаний внутри индивидуальных и групповых LLM. Более того, мы обсуждаем, что LLM узнали, причины хрупкости параметрических знаний и потенциальные "тёмные знания" (гипотезы), которые будут вызывать трудности в решении. Мы надеемся, что данная работа поможет понять знания в LLM и предоставит идеи для будущих исследований.
English
Understanding knowledge mechanisms in Large Language Models (LLMs) is crucial for advancing towards trustworthy AGI. This paper reviews knowledge mechanism analysis from a novel taxonomy including knowledge utilization and evolution. Knowledge utilization delves into the mechanism of memorization, comprehension and application, and creation. Knowledge evolution focuses on the dynamic progression of knowledge within individual and group LLMs. Moreover, we discuss what knowledge LLMs have learned, the reasons for the fragility of parametric knowledge, and the potential dark knowledge (hypothesis) that will be challenging to address. We hope this work can help understand knowledge in LLMs and provide insights for future research.
PDF352November 28, 2024