Zur Skalierung von PEFT: Auf dem Weg zu Millionen persönlicher Modelle mit Billionen Parametern

Zusammenfassung

Parametereffizientes Feintuning (PEFT) wird in der Regel als kostengünstigere Alternative zum vollständigen Feintuning betrachtet. Wir untersuchen eine breitere Rolle: kleine trainierbare Adapter als persistenter lokaler Zustand über leistungsstarken, gemeinsam genutzten Basismodellen. In diesem Rahmen stellt das Basismodell eine gemeinsame Kompetenz bereit, während die Adapter instanzspezifisches Verhalten tragen, wie etwa Präferenzen, Fähigkeiten, Werkzeuggewohnheiten und gedächtnisähnliche Aktualisierungen. Wir gliedern das Problem entlang dreier Skalierungsachsen: Hochskalierung, bei der stärkere gemeinsame A-priori-Wissen kleine lokale Aktualisierungen nützlicher macht; Herunterskalierung, bei der wir untersuchen, wie klein Adapter sein können, während sie zuverlässig bleiben; und Ausweitung, bei der viele persistente adaptierte Instanzen nebeneinander existieren. MinT bietet ein Beispiel für eine Infrastruktur zur Verwaltung von Adapter-Identität, Revision, Herkunft, Evaluierung und Serving-Residenz. Zusammengenommen deuten die Ergebnisse darauf hin, dass PEFT ein kompaktes Substrat für persistente persönliche Modelle darstellen kann und nicht nur einen kostengünstigen Ersatz für vollständiges Feintuning.

English

Parameter-efficient fine-tuning (PEFT) is usually treated as a cheaper alternative to full fine-tuning. We study a broader role: small trainable adapters as persistent local state on top of strong shared foundation models. In this framing, the base model provides shared competence while adapters carry instance-specific behavior such as preferences, skills, tool habits, and memory-like updates. We organize the problem around three scaling axes: Scale Up, where stronger shared priors make small local updates more useful; Scale Down, where we study how small adapters can be while remaining reliable; and Scale Out, where many persistent adapted instances coexist. MinT provides one infrastructure example for managing adapter identity, revision, provenance, evaluation, and serving residency. Together, the results suggest that PEFT can be a compact substrate for persistent personal models rather than only a budget substitute for full fine-tuning.