PEFT-Arena: Parameter-efficiënt finetunen begrijpen vanuit een stabiliteit-plasticiteitsperspectief

Samenvatting

Parameter-efficiënte finetuning (PEFT) is de standaardbenadering geworden voor het aanpassen van grote taalmodellen, maar evaluaties leggen grotendeels de nadruk op downstream-nauwkeurigheid, terwijl het behoud van voorgetrainde capaciteiten over het hoofd wordt gezien. Wij stellen dat PEFT moet worden beoordeeld aan de hand van het stabiliteits-plasticiteitsdilemma: de afweging tussen aanpassing aan de doeltaak en weerstand tegen vergeten. We introduceren PEFT-Arena, een benchmark die zowel downstream-prestaties als het behoud van algemene capaciteiten gezamenlijk meet. Over methoden heen vinden we duidelijke stabiliteits-plasticiteitsprofielen; onder vergelijkbare parameterbudgetten bereikt orthogonale finetuning de meest gunstige Pareto-grens. Om deze verschillen te verklaren, analyseren we PEFT-updates vanuit twee geometrische perspectieven. In de gewichtsruimte onthult spectrale analyse hoe parametrisaties interageren met de voorgetrainde singuliere-waardenstructuur. In de activatieruimte geven retentiemetrics aan of finetuning representaties van algemene capaciteiten behoudt of vervormt, waarbij vergeten in verband wordt gebracht met niet-isometrische representatievervorming. Tot slot toont een analyse aan dat definitieve SFT-checkpoints vaak voorbij een beter doel-retentie-operatiepunt schieten. Geïnspireerd hierdoor presenteren we casestudies van een verbetering achteraf met padgewijze terugspoeling.

English

Parameter-efficient finetuning (PEFT) has become the standard approach for adapting large language models, yet evaluations largely emphasize downstream accuracy while overlooking the retention of pretrained capabilities. We argue that PEFT should be assessed through the stability-plasticity dilemma: the trade-off between target-task adaptation and resistance to forgetting. We introduce PEFT-Arena, a benchmark that jointly measures downstream performance and general capability retention. Across methods, we find distinct stability-plasticity profiles; under comparable parameter budgets, orthogonal finetuning achieves the most favorable Pareto frontier. To explain these differences, we analyze PEFT updates from two geometric perspectives. In weight space, spectral analysis reveals how parameterizations interact with the pretrained singular-value structure. In activation space, retention metrics show whether finetuning preserves or distorts general-capability representations, with forgetting linked to non-isometric representation distortion. Finally, an analysis shows that final SFT checkpoints often overshoot a better target-retention operating point. Inspired by this, we present case studies of a post-hoc improvement with path-wise rewinding.