Over de schaling van PEFT: Naar miljoen persoonlijke modellen van biljoen parameters.

Samenvatting

Parameter-efficiënte fine-tuning (PEFT) wordt gewoonlijk beschouwd als een goedkoper alternatief voor volledige fine-tuning. Wij onderzoeken een bredere rol: kleine trainbare adapters als persistente lokale toestand bovenop sterke gedeelde funderingsmodellen. In deze benadering biedt het basismodel gedeelde competentie, terwijl adapters instantiespecifiek gedrag dragen, zoals voorkeuren, vaardigheden, gereedschapsgewoonten en geheugenachtige updates. We organiseren het probleem rond drie schaalassen: 'Scale Up', waarbij sterkere gedeelde prioria kleine lokale aanpassingen nuttiger maken; 'Scale Down', waarin we bestuderen hoe klein adapters kunnen zijn terwijl ze betrouwbaar blijven; en 'Scale Out', waarbij veel persistente aangepaste instanties naast elkaar bestaan. MinT biedt een voorbeeldinfrastructuur voor het beheren van adapter-identiteit, -revisie, -herkomst, -evaluatie en -serving-residentie. Samen suggereren de resultaten dat PEFT een compacte ondergrond kan zijn voor persistente persoonlijke modellen, in plaats van slechts een budgetvriendelijke vervanger voor volledige fine-tuning.

English

Parameter-efficient fine-tuning (PEFT) is usually treated as a cheaper alternative to full fine-tuning. We study a broader role: small trainable adapters as persistent local state on top of strong shared foundation models. In this framing, the base model provides shared competence while adapters carry instance-specific behavior such as preferences, skills, tool habits, and memory-like updates. We organize the problem around three scaling axes: Scale Up, where stronger shared priors make small local updates more useful; Scale Down, where we study how small adapters can be while remaining reliable; and Scale Out, where many persistent adapted instances coexist. MinT provides one infrastructure example for managing adapter identity, revision, provenance, evaluation, and serving residency. Together, the results suggest that PEFT can be a compact substrate for persistent personal models rather than only a budget substitute for full fine-tuning.