ChatPaper.aiChatPaper

Mecanismos de Conhecimento em Modelos de Linguagem de Grande Escala: Uma Pesquisa e Perspectiva

Knowledge Mechanisms in Large Language Models: A Survey and Perspective

July 22, 2024
Autores: Mengru Wang, Yunzhi Yao, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang, Xiang Chen, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI

Resumo

Compreender os mecanismos de conhecimento em Modelos de Linguagem de Grande Escala (LLMs) é crucial para avançar em direção a uma AGI confiável. Este artigo revisa a análise dos mecanismos de conhecimento a partir de uma nova taxonomia que inclui a utilização e evolução do conhecimento. A utilização do conhecimento investiga o mecanismo de memorização, compreensão e aplicação, e criação. A evolução do conhecimento foca na progressão dinâmica do conhecimento dentro de LLMs individuais e em grupo. Além disso, discutimos o que os LLMs aprenderam, as razões para a fragilidade do conhecimento paramétrico e o potencial conhecimento obscuro (hipótese) que será desafiador de abordar. Esperamos que este trabalho possa ajudar a compreender o conhecimento em LLMs e fornecer insights para pesquisas futuras.
English
Understanding knowledge mechanisms in Large Language Models (LLMs) is crucial for advancing towards trustworthy AGI. This paper reviews knowledge mechanism analysis from a novel taxonomy including knowledge utilization and evolution. Knowledge utilization delves into the mechanism of memorization, comprehension and application, and creation. Knowledge evolution focuses on the dynamic progression of knowledge within individual and group LLMs. Moreover, we discuss what knowledge LLMs have learned, the reasons for the fragility of parametric knowledge, and the potential dark knowledge (hypothesis) that will be challenging to address. We hope this work can help understand knowledge in LLMs and provide insights for future research.
PDF352November 28, 2024