PersonalAlign: Hiërarchische Impliciete Intentie-afstemming voor Gepersonaliseerde GUI-agent met Langetermijn Gebruikersgerichte Gegevens
PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
January 14, 2026
Auteurs: Yibo Lyu, Gongwei Chen, Rui Shao, Weili Guan, Liqiang Nie
cs.AI
Samenvatting
Hoewel GUI-agenten sterke prestaties leveren bij expliciete en complete instructies, vereist real-world implementatie afstemming op de complexere impliciete intenties van gebruikers. In dit werk belichten we Hiërarchische Impliciete Intentie-Afstemming voor Gepersonaliseerde GUI-Agenten (PersonalAlign), een nieuwe agententaak die vereist dat agenten langetermijngebruikersgegevens als persistente context benutten om weggelaten voorkeuren in vage instructies op te lossen en latente routines te anticiperen op basis van de gebruikersstatus voor proactieve ondersteuning. Om deze studie te faciliteren, introduceren we AndroidIntent, een benchmark ontworpen om het vermogen van agenten te evalueren in het oplossen van vage instructies en het bieden van proactieve suggesties door redeneren over langetermijngebruikersgegevens. We hebben 775 gebruikersspecifieke voorkeuren en 215 routines geannoteerd uit 20.000 langetermijngegevens van verschillende gebruikers voor evaluatie. Verder introduceren we de Hiërarchische Intentie-Geheugen-Agent (HIM-Agent), die een continu bijgewerkt persoonlijk geheugen onderhoudt en gebruikersvoorkeuren en routines hiërarchisch organiseert voor personalisatie. Ten slotte evalueren we een reeks GUI-agenten op AndroidIntent, waaronder GPT-5, Qwen3-VL en UI-TARS. De resultaten tonen aan dat HIM-Agent zowel de uitvoerings- als proactieve prestaties significant verbetert met respectievelijk 15,7% en 7,3%.
English
While GUI agents have shown strong performance under explicit and completion instructions, real-world deployment requires aligning with users' more complex implicit intents. In this work, we highlight Hierarchical Implicit Intent Alignment for Personalized GUI Agent (PersonalAlign), a new agent task that requires agents to leverage long-term user records as persistent context to resolve omitted preferences in vague instructions and anticipate latent routines by user state for proactive assistance. To facilitate this study, we introduce AndroidIntent, a benchmark designed to evaluate agents' ability in resolving vague instructions and providing proactive suggestions through reasoning over long-term user records. We annotated 775 user-specific preferences and 215 routines from 20k long-term records across different users for evaluation. Furthermore, we introduce Hierarchical Intent Memory Agent (HIM-Agent), which maintains a continuously updating personal memory and hierarchically organizes user preferences and routines for personalization. Finally, we evaluate a range of GUI agents on AndroidIntent, including GPT-5, Qwen3-VL, and UI-TARS, further results show that HIM-Agent significantly improves both execution and proactive performance by 15.7% and 7.3%.