ChatPaper.aiChatPaper

Modelos de Linguagem Modelam a Linguagem

Language Models Model Language

October 14, 2025
Autores: Łukasz Borchmann
cs.AI

Resumo

O comentário linguístico sobre LLMs, fortemente influenciado pelos quadros teóricos de de Saussure e Chomsky, é frequentemente especulativo e improdutivo. Críticos questionam se os LLMs podem legitimamente modelar a linguagem, citando a necessidade de "estrutura profunda" ou "ancoragem" para alcançar uma "competência" linguística idealizada. Argumentamos por uma mudança radical de perspectiva em direção aos princípios empiristas de Witold Mańczak, um proeminente linguista geral e histórico. Ele define a linguagem não como um "sistema de signos" ou um "sistema computacional do cérebro", mas como a totalidade de tudo o que é dito e escrito. Acima de tudo, ele identifica a frequência de uso de elementos linguísticos específicos como o princípio governante primário da linguagem. Utilizando seu quadro teórico, desafiamos críticas anteriores aos LLMs e fornecemos um guia construtivo para projetar, avaliar e interpretar modelos de linguagem.
English
Linguistic commentary on LLMs, heavily influenced by the theoretical frameworks of de Saussure and Chomsky, is often speculative and unproductive. Critics challenge whether LLMs can legitimately model language, citing the need for "deep structure" or "grounding" to achieve an idealized linguistic "competence." We argue for a radical shift in perspective towards the empiricist principles of Witold Ma\'nczak, a prominent general and historical linguist. He defines language not as a "system of signs" or a "computational system of the brain" but as the totality of all that is said and written. Above all, he identifies frequency of use of particular language elements as language's primary governing principle. Using his framework, we challenge prior critiques of LLMs and provide a constructive guide for designing, evaluating, and interpreting language models.
PDF233October 20, 2025