PersonalAlign: Alinhamento Hierárquico de Intenções Implícitas para Agentes de Interface Gráfica Personalizados com Registros Centrados no Usuário de Longo Prazo
PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
January 14, 2026
Autores: Yibo Lyu, Gongwei Chen, Rui Shao, Weili Guan, Liqiang Nie
cs.AI
Resumo
Embora os agentes de interface gráfica (GUI) tenham demonstrado um desempenho sólido sob instruções explícitas e de conclusão, a implantação no mundo real exige o alinhamento com as intenções implícitas mais complexas dos utilizadores. Neste trabalho, destacamos o Alinhamento Hierárquico de Intenções Implícitas para Agentes GUI Personalizados (PersonalAlign), uma nova tarefa para agentes que exige que estes utilizem registos de utilizador de longo prazo como contexto persistente para resolver preferências omitidas em instruções vagas e antecipar rotinas latentes com base no estado do utilizador para uma assistência proativa. Para facilitar este estudo, introduzimos o AndroidIntent, um *benchmark* concebido para avaliar a capacidade dos agentes em resolver instruções vagas e fornecer sugestões proativas através do raciocínio sobre registos de utilizador de longo prazo. Anotámos 775 preferências específicas do utilizador e 215 rotinas a partir de 20 mil registos de longo prazo de diferentes utilizadores para avaliação. Adicionalmente, introduzimos o Agente de Memória de Intenções Hierárquicas (HIM-Agent), que mantém uma memória pessoal em atualização contínua e organiza hierarquicamente as preferências e rotinas do utilizador para personalização. Por fim, avaliamos uma série de agentes GUI no AndroidIntent, incluindo GPT-5, Qwen3-VL e UI-TARS; os resultados adicionais mostram que o HIM-Agent melhora significativamente o desempenho de execução e proativo em 15,7% e 7,3%, respetivamente.
English
While GUI agents have shown strong performance under explicit and completion instructions, real-world deployment requires aligning with users' more complex implicit intents. In this work, we highlight Hierarchical Implicit Intent Alignment for Personalized GUI Agent (PersonalAlign), a new agent task that requires agents to leverage long-term user records as persistent context to resolve omitted preferences in vague instructions and anticipate latent routines by user state for proactive assistance. To facilitate this study, we introduce AndroidIntent, a benchmark designed to evaluate agents' ability in resolving vague instructions and providing proactive suggestions through reasoning over long-term user records. We annotated 775 user-specific preferences and 215 routines from 20k long-term records across different users for evaluation. Furthermore, we introduce Hierarchical Intent Memory Agent (HIM-Agent), which maintains a continuously updating personal memory and hierarchically organizes user preferences and routines for personalization. Finally, we evaluate a range of GUI agents on AndroidIntent, including GPT-5, Qwen3-VL, and UI-TARS, further results show that HIM-Agent significantly improves both execution and proactive performance by 15.7% and 7.3%.