Taalmodellen Modelleren Taal

Samenvatting

Taalkundig commentaar op LLM's, sterk beïnvloed door de theoretische kaders van De Saussure en Chomsky, is vaak speculatief en onproductief. Critici betwisten of LLM's taal legitiem kunnen modelleren, waarbij ze de noodzaak van "dieptestructuur" of "verankering" aanvoeren om een geïdealiseerde taalkundige "competentie" te bereiken. Wij pleiten voor een radicale verschuiving in perspectief naar de empiristische principes van Witold Mańczak, een prominente algemene en historische taalkundige. Hij definieert taal niet als een "systeem van tekens" of een "computersysteem van de hersenen", maar als de totaliteit van alles wat gezegd en geschreven wordt. Bovenal identificeert hij de gebruiksfrequentie van specifieke taalelementen als het primaire sturende principe van taal. Met zijn kader dagen we eerdere kritieken op LLM's uit en bieden we een constructieve handleiding voor het ontwerpen, evalueren en interpreteren van taalmodelle

English

Linguistic commentary on LLMs, heavily influenced by the theoretical frameworks of de Saussure and Chomsky, is often speculative and unproductive. Critics challenge whether LLMs can legitimately model language, citing the need for "deep structure" or "grounding" to achieve an idealized linguistic "competence." We argue for a radical shift in perspective towards the empiricist principles of Witold Ma\'nczak, a prominent general and historical linguist. He defines language not as a "system of signs" or a "computational system of the brain" but as the totality of all that is said and written. Above all, he identifies frequency of use of particular language elements as language's primary governing principle. Using his framework, we challenge prior critiques of LLMs and provide a constructive guide for designing, evaluating, and interpreting language models.

Taalmodellen Modelleren Taal

Language Models Model Language

Samenvatting

Support