ChatPaper.aiChatPaper

Sprachmodelle modellieren Sprache.

Language Models Model Language

October 14, 2025
papers.authors: Łukasz Borchmann
cs.AI

papers.abstract

Sprachwissenschaftliche Kommentare zu LLMs, die stark von den theoretischen Rahmenwerken de Saussures und Chomskys beeinflusst sind, sind oft spekulativ und wenig produktiv. Kritiker stellen infrage, ob LLMs Sprache legitim modellieren können, indem sie die Notwendigkeit von „Tiefenstruktur“ oder „Verankerung“ betonen, um eine idealisierte linguistische „Kompetenz“ zu erreichen. Wir plädieren für einen radikalen Perspektivwechsel hin zu den empiristischen Prinzipien von Witold Mańczak, einem bedeutenden Allgemein- und Historiolinguisten. Er definiert Sprache nicht als ein „System von Zeichen“ oder ein „computationales System des Gehirns“, sondern als die Gesamtheit alles Gesagten und Geschriebenen. Vor allem identifiziert er die Häufigkeit der Verwendung bestimmter Sprachelemente als das primäre Steuerungsprinzip der Sprache. Unter Verwendung seines Rahmenwerks hinterfragen wir frühere Kritiken an LLMs und bieten einen konstruktiven Leitfaden für die Gestaltung, Bewertung und Interpretation von Sprachmodellen.
English
Linguistic commentary on LLMs, heavily influenced by the theoretical frameworks of de Saussure and Chomsky, is often speculative and unproductive. Critics challenge whether LLMs can legitimately model language, citing the need for "deep structure" or "grounding" to achieve an idealized linguistic "competence." We argue for a radical shift in perspective towards the empiricist principles of Witold Ma\'nczak, a prominent general and historical linguist. He defines language not as a "system of signs" or a "computational system of the brain" but as the totality of all that is said and written. Above all, he identifies frequency of use of particular language elements as language's primary governing principle. Using his framework, we challenge prior critiques of LLMs and provide a constructive guide for designing, evaluating, and interpreting language models.
PDF233October 20, 2025