ChatPaper.aiChatPaper

Locket: Robuste Feature-Locking-Technik für Sprachmodelle

Locket: Robust Feature-Locking Technique for Language Models

October 14, 2025
papers.authors: Lipeng He, Vasisht Duddu, N. Asokan
cs.AI

papers.abstract

Chatbot-Anbieter (z. B. OpenAI) setzen auf gestaffelte Abonnementmodelle, um Einnahmen zu generieren, indem sie Basismodelle für kostenlose Nutzer und erweiterte Modelle für zahlende Abonnenten anbieten. Ein feiner abgestuftes Bezahl-zu-Freischalten-Schema für Premium-Funktionen (z. B. Mathematik, Programmierung) wird jedoch als wirtschaftlich tragfähiger für die Anbieter angesehen. Ein solches Schema erfordert eine Feature-Sperrtechnik (FLoTE), die (i) effektiv gesperrte Funktionen verweigert, (ii) die Nutzbarkeit freigeschalteter Funktionen erhält, (iii) robust gegen Umgehung oder unbefugte Weitergabe von Zugangsdaten ist und (iv) skalierbar für mehrere Funktionen und Nutzer ist. Bisherige FLoTEs (z. B. passwortgeschützte Modelle) sind jedoch weder robust noch skalierbar. Wir stellen Locket vor, die erste robuste und skalierbare FLoTE, die Bezahl-zu-Freischalten-Schemata ermöglicht. Locket verwendet einen neuartigen Merging-Ansatz, um Adapter an ein LLM anzuhängen, um unbefugte Funktionen zu verweigern. Unsere umfassende Auswertung zeigt, dass Locket effektiv (100 % Verweigerung bei gesperrten Funktionen), nutzungsbewahrend (≤ 7 % Nutzungseinbußen bei freigeschalteten Funktionen), robust (≤ 5 % Angriffserfolgsrate) und skalierbar für mehrere Funktionen und Clients ist.
English
Chatbot providers (e.g., OpenAI) rely on tiered subscription schemes to generate revenue, offering basic models for free users, and advanced models for paying subscribers. However, a finer-grained pay-to-unlock scheme for premium features (e.g., math, coding) is thought to be more economically viable for the providers. Such a scheme requires a feature-locking technique (FLoTE) which is (i) effective in refusing locked features, (ii) utility-preserving for unlocked features, (iii) robust against evasion or unauthorized credential sharing, and (iv) scalable to multiple features and users. However, existing FLoTEs (e.g., password-locked models) are not robust or scalable. We present Locket, the first robust and scalable FLoTE to enable pay-to-unlock schemes. Locket uses a novel merging approach to attach adapters to an LLM for refusing unauthorized features. Our comprehensive evaluation shows that Locket is effective (100% refusal on locked features), utility-preserving (leq 7% utility degradation in unlocked features), robust (leq 5% attack success rate), and scales to multiple features and clients.
PDF12October 15, 2025