MobiAgent : Un cadre systématique pour des agents mobiles personnalisables
MobiAgent: A Systematic Framework for Customizable Mobile Agents
August 30, 2025
papers.authors: Cheng Zhang, Erhu Feng, Xi Zhao, Yisheng Zhao, Wangbo Gong, Jiahui Sun, Dong Du, Zhichao Hua, Yubin Xia, Haibo Chen
cs.AI
papers.abstract
Avec l'avancée rapide des modèles vision-langage (VLMs), les agents mobiles basés sur des interfaces graphiques (GUI) sont devenus une direction clé dans le développement des systèmes mobiles intelligents. Cependant, les modèles d'agents existants continuent de rencontrer des défis majeurs dans l'exécution de tâches en conditions réelles, notamment en termes de précision et d'efficacité. Pour répondre à ces limitations, nous proposons MobiAgent, un système complet d'agents mobiles comprenant trois composants principaux : les modèles d'agents de la série MobiMind, le cadre d'accélération AgentRR et la suite de référence MobiFlow. Par ailleurs, reconnaissant que les capacités des agents mobiles actuels sont encore limitées par la disponibilité de données de haute qualité, nous avons développé un pipeline agile de collecte de données assistée par IA, qui réduit significativement le coût de l'annotation manuelle. Comparé à la fois aux modèles de langage généralistes (LLMs) et aux modèles d'agents spécialisés pour les GUI, MobiAgent atteint des performances de pointe dans des scénarios mobiles réels.
English
With the rapid advancement of Vision-Language Models (VLMs), GUI-based mobile
agents have emerged as a key development direction for intelligent mobile
systems. However, existing agent models continue to face significant challenges
in real-world task execution, particularly in terms of accuracy and efficiency.
To address these limitations, we propose MobiAgent, a comprehensive mobile
agent system comprising three core components: the MobiMind-series agent
models, the AgentRR acceleration framework, and the MobiFlow benchmarking
suite. Furthermore, recognizing that the capabilities of current mobile agents
are still limited by the availability of high-quality data, we have developed
an AI-assisted agile data collection pipeline that significantly reduces the
cost of manual annotation. Compared to both general-purpose LLMs and
specialized GUI agent models, MobiAgent achieves state-of-the-art performance
in real-world mobile scenarios.