PersonalAlign : Alignement hiérarchique implicite des intentions pour un agent d'interface graphique personnalisé avec des enregistrement centrés sur l'utilisateur à long terme
PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
January 14, 2026
papers.authors: Yibo Lyu, Gongwei Chen, Rui Shao, Weili Guan, Liqiang Nie
cs.AI
papers.abstract
Si les agents d'interface graphique ont démontré de solides performances avec des instructions explicites et de complétion, leur déploiement réel nécessite un alignement sur les intentions implicites plus complexes des utilisateurs. Dans ce travail, nous mettons en lumière l'Alignement Hiérarchique des Intentions Implicites pour Agent GUI Personnalisé (PersonalAlign), une nouvelle tâche d'agent qui exige de celui-ci qu'il exploite les historiques utilisateur à long terme comme contexte persistant pour résoudre les préférences omises dans des instructions vagues et qu'il anticipe les routines latentes selon l'état de l'utilisateur pour une assistance proactive. Pour faciliter cette étude, nous présentons AndroidIntent, un benchmark conçu pour évaluer la capacité des agents à résoudre des instructions vagues et à fournir des suggestions proactives en raisonnant sur des historiques utilisateur à long terme. Nous avons annoté 775 préférences spécifiques aux utilisateurs et 215 routines à partir de 20 000 enregistrements à long terme provenant de différents utilisateurs pour l'évaluation. De plus, nous présentons le Hierarchical Intent Memory Agent (HIM-Agent), qui maintient une mémoire personnelle mise à jour continuellement et organise hiérarchiquement les préférences et routines utilisateur pour la personnalisation. Enfin, nous évaluons une série d'agents GUI sur AndroidIntent, incluant GPT-5, Qwen3-VL et UI-TARS ; les résultats montrent que HIM-Agent améliore significativement les performances d'exécution et proactives de 15,7 % et 7,3 % respectivement.
English
While GUI agents have shown strong performance under explicit and completion instructions, real-world deployment requires aligning with users' more complex implicit intents. In this work, we highlight Hierarchical Implicit Intent Alignment for Personalized GUI Agent (PersonalAlign), a new agent task that requires agents to leverage long-term user records as persistent context to resolve omitted preferences in vague instructions and anticipate latent routines by user state for proactive assistance. To facilitate this study, we introduce AndroidIntent, a benchmark designed to evaluate agents' ability in resolving vague instructions and providing proactive suggestions through reasoning over long-term user records. We annotated 775 user-specific preferences and 215 routines from 20k long-term records across different users for evaluation. Furthermore, we introduce Hierarchical Intent Memory Agent (HIM-Agent), which maintains a continuously updating personal memory and hierarchically organizes user preferences and routines for personalization. Finally, we evaluate a range of GUI agents on AndroidIntent, including GPT-5, Qwen3-VL, and UI-TARS, further results show that HIM-Agent significantly improves both execution and proactive performance by 15.7% and 7.3%.