ChatPaper.aiChatPaper

言語モデルは言語をモデル化する

Language Models Model Language

October 14, 2025
著者: Łukasz Borchmann
cs.AI

要旨

ソシュールやチョムスキーの理論的枠組みに強く影響を受けた大規模言語モデル(LLM)に対する言語学的評論は、しばしば推測的で非生産的である。批評家たちは、理想化された言語的「能力」を達成するためには「深層構造」や「基盤付け」が必要であると指摘し、LLMが言語を正当にモデル化できるかどうかに疑問を投げかける。我々は、著名な一般言語学者かつ歴史言語学者であるヴィトルト・マンチャックの経験主義的原則に向けた視点の根本的な転換を主張する。彼は言語を「記号の体系」や「脳の計算システム」としてではなく、語られ書かれたものの総体として定義する。特に、彼は特定の言語要素の使用頻度を言語の主要な支配原理として位置づけている。彼の枠組みを用いて、我々はこれまでのLLMに対する批判に異議を唱え、言語モデルの設計、評価、解釈のための建設的な指針を提供する。
English
Linguistic commentary on LLMs, heavily influenced by the theoretical frameworks of de Saussure and Chomsky, is often speculative and unproductive. Critics challenge whether LLMs can legitimately model language, citing the need for "deep structure" or "grounding" to achieve an idealized linguistic "competence." We argue for a radical shift in perspective towards the empiricist principles of Witold Ma\'nczak, a prominent general and historical linguist. He defines language not as a "system of signs" or a "computational system of the brain" but as the totality of all that is said and written. Above all, he identifies frequency of use of particular language elements as language's primary governing principle. Using his framework, we challenge prior critiques of LLMs and provide a constructive guide for designing, evaluating, and interpreting language models.
PDF233October 20, 2025