PersonalAlign: 長期ユーザー中心記録に基づくパーソナライズドGUIエージェントのための階層的暗黙的意図整合
PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
January 14, 2026
著者: Yibo Lyu, Gongwei Chen, Rui Shao, Weili Guan, Liqiang Nie
cs.AI
要旨
GUIエージェントは明示的・完了型の指示において高い性能を示すが、実世界での展開にはユーザーのより複雑な暗黙的意図との整合が求められる。本研究では、パーソナライズドGUIエージェントのための階層的暗黙的意図整合(PersonalAlign)という新たなエージェントタスクに焦点を当てる。このタスクでは、エージェントが長期的なユーザー記録を永続的コンテキストとして活用し、曖昧な指示における省略された選好を解決するとともに、ユーザー状態に基づいて潜在的なルーチンを予測し、能動的支援を提供する必要がある。この研究を促進するため、長期的なユーザー記録に基づく推論を通じて、エージェントの曖昧な指示解決能力と能動的提案能力を評価するベンチマークAndroidIntentを導入した。異なるユーザーにわたる2万件の長期的記録から、775のユーザー固有の選好と215のルーチンを評価用に注釈付けた。さらに、継続的に更新される個人メモリを維持し、ユーザーの選好とルーチンを階層的に整理してパーソナライズ化を行うHierarchical Intent Memory Agent(HIM-Agent)を提案する。最後に、GPT-5、Qwen3-VL、UI-TARSなどの様々なGUIエージェントをAndroidIntentで評価した結果、HIM-Agentは実行性能と能動的性能をそれぞれ15.7%、7.3%大幅に向上させることが示された。
English
While GUI agents have shown strong performance under explicit and completion instructions, real-world deployment requires aligning with users' more complex implicit intents. In this work, we highlight Hierarchical Implicit Intent Alignment for Personalized GUI Agent (PersonalAlign), a new agent task that requires agents to leverage long-term user records as persistent context to resolve omitted preferences in vague instructions and anticipate latent routines by user state for proactive assistance. To facilitate this study, we introduce AndroidIntent, a benchmark designed to evaluate agents' ability in resolving vague instructions and providing proactive suggestions through reasoning over long-term user records. We annotated 775 user-specific preferences and 215 routines from 20k long-term records across different users for evaluation. Furthermore, we introduce Hierarchical Intent Memory Agent (HIM-Agent), which maintains a continuously updating personal memory and hierarchically organizes user preferences and routines for personalization. Finally, we evaluate a range of GUI agents on AndroidIntent, including GPT-5, Qwen3-VL, and UI-TARS, further results show that HIM-Agent significantly improves both execution and proactive performance by 15.7% and 7.3%.