ChatPaper.aiChatPaper

PersonalAlign: Alineación Jerárquica Implícita de Intenciones para Agentes GUI Personalizados con Registros Centrados en el Usuario a Largo Plazo

PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records

January 14, 2026
Autores: Yibo Lyu, Gongwei Chen, Rui Shao, Weili Guan, Liqiang Nie
cs.AI

Resumen

Si bien los agentes de interfaz gráfica han demostrado un rendimiento sólido bajo instrucciones explícitas y de completado, su implementación en entornos reales requiere alinearse con las intenciones implícitas más complejas de los usuarios. En este trabajo, destacamos la Alineación Jerárquica de Intenciones Implícitas para Agentes de Interfaz Gráfica Personalizados (PersonalAlign), una nueva tarea para agentes que requiere que estos aprovechen los registros de usuario a largo plazo como contexto persistente para resolver preferencias omitidas en instrucciones vagas y anticipar rutinas latentes según el estado del usuario para brindar asistencia proactiva. Para facilitar este estudio, presentamos AndroidIntent, un punto de referencia diseñado para evaluar la capacidad de los agentes para resolver instrucciones vagas y proporcionar sugerencias proactivas mediante el razonamiento sobre registros de usuario a largo plazo. Anotamos 775 preferencias específicas de usuario y 215 rutinas a partir de 20,000 registros a largo plazo de diferentes usuarios para la evaluación. Además, presentamos el Agente de Memoria de Intención Jerárquica (HIM-Agent), que mantiene una memoria personal en actualización continua y organiza jerárquicamente las preferencias y rutinas del usuario para la personalización. Finalmente, evaluamos una serie de agentes de interfaz gráfica en AndroidIntent, incluyendo GPT-5, Qwen3-VL y UI-TARS; los resultados adicionales muestran que HIM-Agent mejora significativamente el rendimiento tanto de ejecución como proactivo en un 15.7% y un 7.3%, respectivamente.
English
While GUI agents have shown strong performance under explicit and completion instructions, real-world deployment requires aligning with users' more complex implicit intents. In this work, we highlight Hierarchical Implicit Intent Alignment for Personalized GUI Agent (PersonalAlign), a new agent task that requires agents to leverage long-term user records as persistent context to resolve omitted preferences in vague instructions and anticipate latent routines by user state for proactive assistance. To facilitate this study, we introduce AndroidIntent, a benchmark designed to evaluate agents' ability in resolving vague instructions and providing proactive suggestions through reasoning over long-term user records. We annotated 775 user-specific preferences and 215 routines from 20k long-term records across different users for evaluation. Furthermore, we introduce Hierarchical Intent Memory Agent (HIM-Agent), which maintains a continuously updating personal memory and hierarchically organizes user preferences and routines for personalization. Finally, we evaluate a range of GUI agents on AndroidIntent, including GPT-5, Qwen3-VL, and UI-TARS, further results show that HIM-Agent significantly improves both execution and proactive performance by 15.7% and 7.3%.
PDF43January 20, 2026