ChatPaper.aiChatPaper

MobiAgent: Un Framework Sistematico per Agenti Mobili Personalizzabili

MobiAgent: A Systematic Framework for Customizable Mobile Agents

August 30, 2025
Autori: Cheng Zhang, Erhu Feng, Xi Zhao, Yisheng Zhao, Wangbo Gong, Jiahui Sun, Dong Du, Zhichao Hua, Yubin Xia, Haibo Chen
cs.AI

Abstract

Con il rapido progresso dei Modelli Visione-Linguaggio (VLMs), gli agenti mobili basati su GUI sono emersi come una direzione chiave per lo sviluppo di sistemi mobili intelligenti. Tuttavia, i modelli di agenti esistenti continuano a fronteggiare sfide significative nell'esecuzione di compiti nel mondo reale, in particolare in termini di accuratezza ed efficienza. Per affrontare queste limitazioni, proponiamo MobiAgent, un sistema completo per agenti mobili composto da tre componenti principali: i modelli di agenti della serie MobiMind, il framework di accelerazione AgentRR e la suite di benchmarking MobiFlow. Inoltre, riconoscendo che le capacità degli attuali agenti mobili sono ancora limitate dalla disponibilità di dati di alta qualità, abbiamo sviluppato una pipeline agile di raccolta dati assistita dall'IA che riduce significativamente i costi dell'annotazione manuale. Rispetto sia ai modelli LLM generici che ai modelli di agenti GUI specializzati, MobiAgent raggiunge prestazioni all'avanguardia in scenari mobili reali.
English
With the rapid advancement of Vision-Language Models (VLMs), GUI-based mobile agents have emerged as a key development direction for intelligent mobile systems. However, existing agent models continue to face significant challenges in real-world task execution, particularly in terms of accuracy and efficiency. To address these limitations, we propose MobiAgent, a comprehensive mobile agent system comprising three core components: the MobiMind-series agent models, the AgentRR acceleration framework, and the MobiFlow benchmarking suite. Furthermore, recognizing that the capabilities of current mobile agents are still limited by the availability of high-quality data, we have developed an AI-assisted agile data collection pipeline that significantly reduces the cost of manual annotation. Compared to both general-purpose LLMs and specialized GUI agent models, MobiAgent achieves state-of-the-art performance in real-world mobile scenarios.
PDF62September 3, 2025