ChatPaper.aiChatPaper

Mecanismos de Conocimiento en Modelos de Lenguaje Grandes: Una Encuesta y Perspectiva

Knowledge Mechanisms in Large Language Models: A Survey and Perspective

July 22, 2024
Autores: Mengru Wang, Yunzhi Yao, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang, Xiang Chen, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI

Resumen

Comprender los mecanismos de conocimiento en Modelos de Lenguaje Grandes (LLMs) es crucial para avanzar hacia una IA general confiable. Este documento revisa el análisis de mecanismos de conocimiento desde una nueva taxonomía que incluye la utilización y evolución del conocimiento. La utilización del conocimiento profundiza en el mecanismo de memorización, comprensión y aplicación, y creación. La evolución del conocimiento se centra en la progresión dinámica del conocimiento dentro de LLMs individuales y de grupo. Además, discutimos qué conocimiento han adquirido los LLMs, las razones de la fragilidad del conocimiento paramétrico y el potencial conocimiento oscuro (hipótesis) que será difícil de abordar. Esperamos que este trabajo pueda ayudar a comprender el conocimiento en LLMs y proporcionar ideas para investigaciones futuras.
English
Understanding knowledge mechanisms in Large Language Models (LLMs) is crucial for advancing towards trustworthy AGI. This paper reviews knowledge mechanism analysis from a novel taxonomy including knowledge utilization and evolution. Knowledge utilization delves into the mechanism of memorization, comprehension and application, and creation. Knowledge evolution focuses on the dynamic progression of knowledge within individual and group LLMs. Moreover, we discuss what knowledge LLMs have learned, the reasons for the fragility of parametric knowledge, and the potential dark knowledge (hypothesis) that will be challenging to address. We hope this work can help understand knowledge in LLMs and provide insights for future research.

Summary

AI-Generated Summary

PDF352November 28, 2024