Los Modelos de Lenguaje Modelan el Lenguaje.
Language Models Model Language
October 14, 2025
Autores: Łukasz Borchmann
cs.AI
Resumen
El comentario lingüístico sobre los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés), fuertemente influenciado por los marcos teóricos de Saussure y Chomsky, suele ser especulativo e improductivo. Los críticos cuestionan si los LLMs pueden modelar el lenguaje de manera legítima, citando la necesidad de una "estructura profunda" o de un "anclaje" para alcanzar una "competencia" lingüística idealizada. Argumentamos a favor de un cambio radical de perspectiva hacia los principios empiristas de Witold Mańczak, un destacado lingüista general e histórico. Él define el lenguaje no como un "sistema de signos" ni como un "sistema computacional del cerebro", sino como la totalidad de todo lo que se dice y se escribe. Sobre todo, identifica la frecuencia de uso de elementos lingüísticos particulares como el principio rector primario del lenguaje. Utilizando su marco teórico, desafiamos las críticas previas a los LLMs y ofrecemos una guía constructiva para diseñar, evaluar e interpretar los modelos de lenguaje.
English
Linguistic commentary on LLMs, heavily influenced by the theoretical
frameworks of de Saussure and Chomsky, is often speculative and unproductive.
Critics challenge whether LLMs can legitimately model language, citing the need
for "deep structure" or "grounding" to achieve an idealized linguistic
"competence." We argue for a radical shift in perspective towards the
empiricist principles of Witold Ma\'nczak, a prominent general and historical
linguist. He defines language not as a "system of signs" or a "computational
system of the brain" but as the totality of all that is said and written. Above
all, he identifies frequency of use of particular language elements as
language's primary governing principle. Using his framework, we challenge prior
critiques of LLMs and provide a constructive guide for designing, evaluating,
and interpreting language models.