UFO^3: Tesserando la Galassia degli Agenti Digitali
UFO^3: Weaving the Digital Agent Galaxy
November 14, 2025
Autori: Chaoyun Zhang, Liqun Li, He Huang, Chiming Ni, Bo Qiao, Si Qin, Yu Kang, Minghua Ma, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang
cs.AI
Abstract
Gli agenti basati su grandi modelli linguistici (LLM) stanno trasformando i dispositivi digitali da strumenti passivi in collaboratori intelligenti e proattivi. Tuttavia, la maggior parte dei framework esistenti rimane confinata a un singolo sistema operativo o dispositivo, rendendo i flussi di lavoro cross-device fragili e in gran parte manuali. Presentiamo UFO³, un sistema che unisce endpoint eterogenei - desktop, server, dispositivi mobili e edge - in un unico tessuto di orchestrazione. UFO³ modella ogni richiesta dell'utente come una TaskConstellation mutabile: un DAG distribuito di sottocompiti atomici (TaskStar) con dipendenze esplicite di controllo e dati (TaskStarLines). La TaskConstellation si evolve continuamente man mano che i risultati fluiscono dai dispositivi distribuiti, abilitando l'esecuzione asincrona, il recupero adattivo e l'ottimizzazione dinamica. Un Constellation Orchestrator esegue i compiti in modo sicuro e asincrono applicando aggiornamenti dinamici del DAG, mentre il Protocollo di Interazione Agente (AIP) fornisce canali persistenti a bassa latenza per l'invio affidabile dei compiti e lo streaming dei risultati. Questi progetti dissolvono i tradizionali confini tra dispositivi e piattaforme, consentendo agli agenti di collaborare perfettamente e amplificare la loro intelligenza collettiva.
Valutiamo UFO³ su NebulaBench, un benchmark di 55 attività cross-device distribuite su 5 macchine e 10 categorie. UFO³ raggiunge un tasso di completamento dei sottocompiti dell'83,3%, un successo complessivo del 70,9%, sfrutta il parallelismo con una larghezza media di 1,72 e riduce la latenza end-to-end del 31% rispetto a una baseline sequenziale. Esperimenti di iniezione di guasti dimostrano un degrado e un recupero graduali in caso di guasti temporanei e permanenti degli agenti. Questi risultati mostrano che UFO³ raggiunge un'orchestrazione dei compiti accurata, efficiente e resiliente su dispositivi eterogenei, unendo agenti isolati in un tessuto computazionale coerente e adattivo che si estende attraverso il panorama dell'ubiquitous computing.
English
Large language model (LLM)-powered agents are transforming digital devices from passive tools into proactive intelligent collaborators. However, most existing frameworks remain confined to a single OS or device, making cross-device workflows brittle and largely manual. We present UFO^3, a system that unifies heterogeneous endpoints, desktops, servers, mobile devices, and edge, into a single orchestration fabric. UFO^3 models each user request as a mutable TaskConstellation: a distributed DAG of atomic subtasks (TaskStars) with explicit control and data dependencies (TaskStarLines). The TaskConstellation continuously evolves as results stream in from distributed devices, enabling asynchronous execution, adaptive recovery, and dynamic optimization. A Constellation Orchestrator} executes tasks safely and asynchronously while applying dynamic DAG updates, and the Agent Interaction Protocol (AIP) provides persistent, low-latency channels for reliable task dispatch and result streaming. These designs dissolve the traditional boundaries between devices and platforms, allowing agents to collaborate seamlessly and amplify their collective intelligence.
We evaluate UFO^3 on NebulaBench, a benchmark of 55 cross-device tasks across 5 machines and 10 categories. UFO^3 achieves 83.3% subtask completion, 70.9% task success, exposes parallelism with an average width of 1.72, and reduces end-to-end latency by 31% relative to a sequential baseline. Fault-injection experiments demonstrate graceful degradation and recovery under transient and permanent agent failures. These results show that UFO^3 achieves accurate, efficient, and resilient task orchestration across heterogeneous devices, uniting isolated agents into a coherent, adaptive computing fabric that extends across the landscape of ubiquitous computing.