Taalmodellen Modelleren Taal
Language Models Model Language
October 14, 2025
Auteurs: Łukasz Borchmann
cs.AI
Samenvatting
Taalkundig commentaar op LLM's, sterk beïnvloed door de theoretische kaders van De Saussure en Chomsky, is vaak speculatief en onproductief. Critici betwisten of LLM's taal legitiem kunnen modelleren, waarbij ze de noodzaak van "dieptestructuur" of "verankering" aanvoeren om een geïdealiseerde taalkundige "competentie" te bereiken. Wij pleiten voor een radicale verschuiving in perspectief naar de empiristische principes van Witold Mańczak, een prominente algemene en historische taalkundige. Hij definieert taal niet als een "systeem van tekens" of een "computersysteem van de hersenen", maar als de totaliteit van alles wat gezegd en geschreven wordt. Bovenal identificeert hij de gebruiksfrequentie van specifieke taalelementen als het primaire sturende principe van taal. Met zijn kader dagen we eerdere kritieken op LLM's uit en bieden we een constructieve handleiding voor het ontwerpen, evalueren en interpreteren van taalmodelle
English
Linguistic commentary on LLMs, heavily influenced by the theoretical
frameworks of de Saussure and Chomsky, is often speculative and unproductive.
Critics challenge whether LLMs can legitimately model language, citing the need
for "deep structure" or "grounding" to achieve an idealized linguistic
"competence." We argue for a radical shift in perspective towards the
empiricist principles of Witold Ma\'nczak, a prominent general and historical
linguist. He defines language not as a "system of signs" or a "computational
system of the brain" but as the totality of all that is said and written. Above
all, he identifies frequency of use of particular language elements as
language's primary governing principle. Using his framework, we challenge prior
critiques of LLMs and provide a constructive guide for designing, evaluating,
and interpreting language models.