AutoMIA: Melhorias nas Linhas de Base para Ataques de Inferência de Associação via Autoexploração Agente
AutoMIA: Improved Baselines for Membership Inference Attack via Agentic Self-Exploration
April 1, 2026
Autores: Ruhao Liu, Weiqi Huang, Qi Li, Xinchao Wang
cs.AI
Resumo
Os Ataques de Inferência de Associação (MIAs) servem como uma ferramenta fundamental de auditoria para avaliar o vazamento de dados de treinamento em modelos de aprendizado de máquina. No entanto, as metodologias existentes dependem predominantemente de heurísticas estáticas e manuais que carecem de adaptabilidade, frequentemente resultando em desempenho abaixo do ideal quando transferidas entre diferentes modelos de grande escala. Neste trabalho, propomos o AutoMIA, uma estrutura agentiva que reformula a inferência de associação como um processo automatizado de autoexploração e evolução de estratégias. Dadas especificações de cenário de alto nível, o AutoMIA autoexplora o espaço de ataque gerando estratégias executáveis a nível de *logits* e refinando-as progressivamente por meio de *feedback* de avaliação em circuito fechado. Ao desacoplar o raciocínio de estratégia abstrata da execução de baixo nível, nossa estrutura permite uma travessia sistemática e agnóstica ao modelo no espaço de busca de ataques. Experimentos extensivos demonstram que o AutoMIA corresponde ou supera consistentemente os métodos state-of-the-art, eliminando a necessidade de engenharia de características manual.
English
Membership Inference Attacks (MIAs) serve as a fundamental auditing tool for evaluating training data leakage in machine learning models. However, existing methodologies predominantly rely on static, handcrafted heuristics that lack adaptability, often leading to suboptimal performance when transferred across different large models. In this work, we propose AutoMIA, an agentic framework that reformulates membership inference as an automated process of self-exploration and strategy evolution. Given high-level scenario specifications, AutoMIA self-explores the attack space by generating executable logits-level strategies and progressively refining them through closed-loop evaluation feedback. By decoupling abstract strategy reasoning from low-level execution, our framework enables a systematic, model-agnostic traversal of the attack search space. Extensive experiments demonstrate that AutoMIA consistently matches or outperforms state-of-the-art baselines while eliminating the need for manual feature engineering.