Sobre o Escalonamento do PEFT: Rumo a Milhões de Modelos Pessoais de Trilhões de Parâmetros

Resumo

O ajuste fino eficiente em parâmetros (PEFT) é geralmente tratado como uma alternativa mais barata ao ajuste fino completo. Estudamos um papel mais amplo: pequenos adaptadores treináveis como estado local persistente sobre modelos de base compartilhados e robustos. Nesse enquadramento, o modelo base fornece competência compartilhada, enquanto os adaptadores carregam comportamentos específicos da instância, como preferências, habilidades, hábitos de ferramentas e atualizações semelhantes à memória. Organizamos o problema em torno de três eixos de escalabilidade: Aumento de Escala (Scale Up), onde prioridades compartilhadas mais fortes tornam pequenas atualizações locais mais úteis; Redução de Escala (Scale Down), onde estudamos quão pequenos os adaptadores podem ser enquanto permanecem confiáveis; e Expansão de Escala (Scale Out), onde muitas instâncias adaptadas persistentes coexistem. O MinT fornece um exemplo de infraestrutura para gerenciar identidade, revisão, proveniência, avaliação e residência de serviço do adaptador. Em conjunto, os resultados sugerem que o PEFT pode ser um substrato compacto para modelos pessoais persistentes, em vez de apenas um substituto econômico para o ajuste fino completo.

English

Parameter-efficient fine-tuning (PEFT) is usually treated as a cheaper alternative to full fine-tuning. We study a broader role: small trainable adapters as persistent local state on top of strong shared foundation models. In this framing, the base model provides shared competence while adapters carry instance-specific behavior such as preferences, skills, tool habits, and memory-like updates. We organize the problem around three scaling axes: Scale Up, where stronger shared priors make small local updates more useful; Scale Down, where we study how small adapters can be while remaining reliable; and Scale Out, where many persistent adapted instances coexist. MinT provides one infrastructure example for managing adapter identity, revision, provenance, evaluation, and serving residency. Together, the results suggest that PEFT can be a compact substrate for persistent personal models rather than only a budget substitute for full fine-tuning.