PersonalAlign: Hierarchische implizite Intent-Abgleichung für personalisierte GUI-Agenten mit langfristigen nutzerzentrierten Aufzeichnungen
PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
January 14, 2026
papers.authors: Yibo Lyu, Gongwei Chen, Rui Shao, Weili Guan, Liqiang Nie
cs.AI
papers.abstract
Während GUI-Agenten bei expliziten und vollständigen Anweisungen starke Leistung gezeigt haben, erfordert der reale Einsatz eine Ausrichtung an den komplexeren impliziten Intentionen der Nutzer. In dieser Arbeit stellen wir Hierarchical Implicit Intent Alignment for Personalized GUI Agent (PersonalAlign) vor – eine neue Agentenaufgabe, die es Agenten abverlangt, langfristige Nutzeraufzeichnungen als persistierenden Kontext zu nutzen, um ausgelassene Präferenzen in vagen Anweisungen aufzulösen und latente Routinen basierend auf dem Nutzerzustand für proaktive Unterstützung vorherzusehen. Um diese Forschung zu ermöglichen, führen wir AndroidIntent ein, einen Benchmark, der darauf ausgelegt ist, die Fähigkeit von Agenten zu bewerten, vage Anweisungen aufzulösen und proaktive Vorschläge durch Schlussfolgerungen aus langfristigen Nutzeraufzeichnungen zu liefern. Wir haben 775 nutzerspezifische Präferenzen und 215 Routinen aus 20.000 langfristigen Datensätzen verschiedener Nutzer zur Evaluation annotiert. Darüber hinaus stellen wir den Hierarchical Intent Memory Agent (HIM-Agent) vor, der einen sich kontinuierlich aktualisierenden persönlichen Speicher verwaltet und Nutzerpräferenzen sowie Routinen hierarchisch für die Personalisierung organisiert. Abschließend evaluieren wir eine Reihe von GUI-Agenten auf AndroidIntent, darunter GPT-5, Qwen3-VL und UI-TARS. Die weiteren Ergebnisse zeigen, dass HIM-Agent die Ausführungs- und Proaktivleistung signifikant um 15,7 % bzw. 7,3 % verbessert.
English
While GUI agents have shown strong performance under explicit and completion instructions, real-world deployment requires aligning with users' more complex implicit intents. In this work, we highlight Hierarchical Implicit Intent Alignment for Personalized GUI Agent (PersonalAlign), a new agent task that requires agents to leverage long-term user records as persistent context to resolve omitted preferences in vague instructions and anticipate latent routines by user state for proactive assistance. To facilitate this study, we introduce AndroidIntent, a benchmark designed to evaluate agents' ability in resolving vague instructions and providing proactive suggestions through reasoning over long-term user records. We annotated 775 user-specific preferences and 215 routines from 20k long-term records across different users for evaluation. Furthermore, we introduce Hierarchical Intent Memory Agent (HIM-Agent), which maintains a continuously updating personal memory and hierarchically organizes user preferences and routines for personalization. Finally, we evaluate a range of GUI agents on AndroidIntent, including GPT-5, Qwen3-VL, and UI-TARS, further results show that HIM-Agent significantly improves both execution and proactive performance by 15.7% and 7.3%.