AutoMIA: Verbesserte Baselines für Membership Inference Attacks durch agentische Selbsterkundung

Zusammenfassung

Membership Inference Attacks (MIAs) dienen als grundlegendes Prüfwerkzeug zur Bewertung von Trainingsdatenlecks in Machine-Learning-Modellen. Bisherige Methoden basieren jedoch überwiegend auf statischen, manuell erstellten Heuristiken, die Anpassungsfähigkeit vermissen lassen und häufig zu suboptimaler Performance führen, wenn sie über verschiedene große Modelle übertragen werden. In dieser Arbeit stellen wir AutoMIA vor, ein agentenbasiertes Framework, das Membership Inference als automatisierten Prozess der Selbsterkundung und Strategieevolution neu formuliert. Auf der Grundlage hochrangiger Szenariospezifikationen erkundet AutoMIA den Angriffsraum selbstständig, indem es ausführbare Logits-Level-Strategien generiert und diese schrittweise durch Closed-Loop-Evaluierungsfeedback verfeinert. Durch die Entkopplung abstrakter Strategieüberlegungen von der Low-Level-Ausführung ermöglicht unser Framework eine systematische, modellagnostische Durchquerung des Suchraums für Angriffe. Umfangreiche Experimente zeigen, dass AutoMIA durchgängig state-of-the-art Baseline-Methoden erreicht oder übertrifft, während gleichzeitig manuelle Feature-Engineerings überflüssig werden.

English

Membership Inference Attacks (MIAs) serve as a fundamental auditing tool for evaluating training data leakage in machine learning models. However, existing methodologies predominantly rely on static, handcrafted heuristics that lack adaptability, often leading to suboptimal performance when transferred across different large models. In this work, we propose AutoMIA, an agentic framework that reformulates membership inference as an automated process of self-exploration and strategy evolution. Given high-level scenario specifications, AutoMIA self-explores the attack space by generating executable logits-level strategies and progressively refining them through closed-loop evaluation feedback. By decoupling abstract strategy reasoning from low-level execution, our framework enables a systematic, model-agnostic traversal of the attack search space. Extensive experiments demonstrate that AutoMIA consistently matches or outperforms state-of-the-art baselines while eliminating the need for manual feature engineering.

AutoMIA: Verbesserte Baselines für Membership Inference Attacks durch agentische Selbsterkundung

AutoMIA: Improved Baselines for Membership Inference Attack via Agentic Self-Exploration

Zusammenfassung

Support