ChatPaper.aiChatPaper

Mécanismes de connaissance dans les grands modèles de langage : une synthèse et une perspective

Knowledge Mechanisms in Large Language Models: A Survey and Perspective

July 22, 2024
Auteurs: Mengru Wang, Yunzhi Yao, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang, Xiang Chen, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI

Résumé

Comprendre les mécanismes de connaissance dans les modèles de langage de grande taille (LLMs) est crucial pour progresser vers une intelligence artificielle générale (IAG) digne de confiance. Cet article examine l'analyse des mécanismes de connaissance à travers une taxonomie novatrice incluant l'utilisation et l'évolution de la connaissance. L'utilisation de la connaissance explore les mécanismes de mémorisation, de compréhension, d'application et de création. L'évolution de la connaissance se concentre sur la progression dynamique des connaissances au sein des LLMs individuels et collectifs. De plus, nous discutons de ce que les LLMs ont appris, des raisons de la fragilité des connaissances paramétriques, et de la connaissance sombre potentielle (hypothèse) qui sera difficile à aborder. Nous espérons que ce travail contribuera à mieux comprendre la connaissance dans les LLMs et fournira des pistes pour les recherches futures.
English
Understanding knowledge mechanisms in Large Language Models (LLMs) is crucial for advancing towards trustworthy AGI. This paper reviews knowledge mechanism analysis from a novel taxonomy including knowledge utilization and evolution. Knowledge utilization delves into the mechanism of memorization, comprehension and application, and creation. Knowledge evolution focuses on the dynamic progression of knowledge within individual and group LLMs. Moreover, we discuss what knowledge LLMs have learned, the reasons for the fragility of parametric knowledge, and the potential dark knowledge (hypothesis) that will be challenging to address. We hope this work can help understand knowledge in LLMs and provide insights for future research.

Summary

AI-Generated Summary

PDF352November 28, 2024