О масштабировании PEFT: к миллиону персональных моделей с триллионами параметров

Аннотация

Параметрически эффективная тонкая настройка (PEFT) обычно рассматривается как более дешевая альтернатива полной тонкой настройке. Мы изучаем более широкую роль: небольшие обучаемые адаптеры в качестве постоянного локального состояния поверх мощных общих фундаментальных моделей. В такой трактовке базовая модель обеспечивает общую компетентность, в то время как адаптеры несут поведение, специфичное для конкретного экземпляра, такое как предпочтения, навыки, привычки использования инструментов и обновления, напоминающие память. Мы организуем задачу вокруг трех осей масштабирования: масштабирование вверх (Scale Up), где более сильные общие априорные знания делают небольшие локальные обновления более полезными; масштабирование вниз (Scale Down), где мы изучаем, насколько малыми могут быть адаптеры, оставаясь при этом надежными; и масштабирование наружу (Scale Out), где сосуществует множество постоянных адаптированных экземпляров. MinT предоставляет один пример инфраструктуры для управления идентичностью адаптера, ревизией, происхождением, оценкой и резидентностью обслуживания. В совокупности результаты показывают, что PEFT может быть компактным субстратом для постоянных персональных моделей, а не только бюджетной заменой полной тонкой настройки.

English

Parameter-efficient fine-tuning (PEFT) is usually treated as a cheaper alternative to full fine-tuning. We study a broader role: small trainable adapters as persistent local state on top of strong shared foundation models. In this framing, the base model provides shared competence while adapters carry instance-specific behavior such as preferences, skills, tool habits, and memory-like updates. We organize the problem around three scaling axes: Scale Up, where stronger shared priors make small local updates more useful; Scale Down, where we study how small adapters can be while remaining reliable; and Scale Out, where many persistent adapted instances coexist. MinT provides one infrastructure example for managing adapter identity, revision, provenance, evaluation, and serving residency. Together, the results suggest that PEFT can be a compact substrate for persistent personal models rather than only a budget substitute for full fine-tuning.