Uma Visão Geral dos Modelos de Linguagem de Grande Escala para Estatísticos
An Overview of Large Language Models for Statisticians
February 25, 2025
Autores: Wenlong Ji, Weizhe Yuan, Emily Getzen, Kyunghyun Cho, Michael I. Jordan, Song Mei, Jason E Weston, Weijie J. Su, Jing Xu, Linjun Zhang
cs.AI
Resumo
Os Modelos de Linguagem de Grande Escala (LLMs, na sigla em inglês) surgiram como ferramentas transformadoras na inteligência artificial (IA), exibindo capacidades notáveis em diversas tarefas, como geração de texto, raciocínio e tomada de decisões. Embora seu sucesso tenha sido impulsionado principalmente por avanços no poder computacional e nas arquiteturas de aprendizado profundo, problemas emergentes — em áreas como quantificação de incerteza, tomada de decisões, inferência causal e mudanças de distribuição — exigem um engajamento mais profundo com o campo da estatística. Este artigo explora áreas potenciais onde estatísticos podem fazer contribuições importantes para o desenvolvimento de LLMs, especialmente aqueles que visam promover confiabilidade e transparência para usuários humanos. Assim, focamos em questões como quantificação de incerteza, interpretabilidade, justiça, privacidade, marcação d'água e adaptação de modelos. Também consideramos possíveis papéis para LLMs na análise estatística. Ao unir IA e estatística, buscamos promover uma colaboração mais profunda que avance tanto os fundamentos teóricos quanto as aplicações práticas dos LLMs, moldando, em última instância, seu papel na abordagem de desafios sociais complexos.
English
Large Language Models (LLMs) have emerged as transformative tools in
artificial intelligence (AI), exhibiting remarkable capabilities across diverse
tasks such as text generation, reasoning, and decision-making. While their
success has primarily been driven by advances in computational power and deep
learning architectures, emerging problems -- in areas such as uncertainty
quantification, decision-making, causal inference, and distribution shift --
require a deeper engagement with the field of statistics. This paper explores
potential areas where statisticians can make important contributions to the
development of LLMs, particularly those that aim to engender trustworthiness
and transparency for human users. Thus, we focus on issues such as uncertainty
quantification, interpretability, fairness, privacy, watermarking and model
adaptation. We also consider possible roles for LLMs in statistical analysis.
By bridging AI and statistics, we aim to foster a deeper collaboration that
advances both the theoretical foundations and practical applications of LLMs,
ultimately shaping their role in addressing complex societal challenges.