AutoMIA: Mejora de las Líneas Base para el Ataque de Inferencia de Membresía mediante Autoexploración Agéntica

Resumen

Los Ataques de Inferencia de Membresía (MIAs) constituyen una herramienta fundamental de auditoría para evaluar la filtración de datos de entrenamiento en modelos de aprendizaje automático. Sin embargo, las metodologías existentes se basan predominantemente en heurísticas estáticas y artesanales que carecen de adaptabilidad, lo que a menudo conduce a un rendimiento subóptimo cuando se transfieren entre diferentes modelos grandes. En este trabajo, proponemos AutoMIA, un marco agéntico que reformula la inferencia de membresía como un proceso automatizado de autoexploración y evolución de estrategias. Dadas especificaciones de escenario de alto nivel, AutoMIA autoexplora el espacio de ataque generando estrategias ejecutables a nivel de logits y refinándolas progresivamente mediante retroalimentación de evaluación de bucle cerrado. Al desacoplar el razonamiento estratégico abstracto de la ejecución de bajo nivel, nuestro marco permite un recorrido sistemático e independiente del modelo en el espacio de búsqueda de ataques. Experimentos exhaustivos demuestran que AutoMIA iguala o supera consistentemente los métodos de referencia más avanzados, al mismo tiempo que elimina la necesidad de ingeniería manual de características.

English

Membership Inference Attacks (MIAs) serve as a fundamental auditing tool for evaluating training data leakage in machine learning models. However, existing methodologies predominantly rely on static, handcrafted heuristics that lack adaptability, often leading to suboptimal performance when transferred across different large models. In this work, we propose AutoMIA, an agentic framework that reformulates membership inference as an automated process of self-exploration and strategy evolution. Given high-level scenario specifications, AutoMIA self-explores the attack space by generating executable logits-level strategies and progressively refining them through closed-loop evaluation feedback. By decoupling abstract strategy reasoning from low-level execution, our framework enables a systematic, model-agnostic traversal of the attack search space. Extensive experiments demonstrate that AutoMIA consistently matches or outperforms state-of-the-art baselines while eliminating the need for manual feature engineering.

AutoMIA: Mejora de las Líneas Base para el Ataque de Inferencia de Membresía mediante Autoexploración Agéntica

AutoMIA: Improved Baselines for Membership Inference Attack via Agentic Self-Exploration

Resumen

Support