UFO^3: Tecendo a Galáxia do Agente Digital
UFO^3: Weaving the Digital Agent Galaxy
November 14, 2025
Autores: Chaoyun Zhang, Liqun Li, He Huang, Chiming Ni, Bo Qiao, Si Qin, Yu Kang, Minghua Ma, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang
cs.AI
Resumo
Os agentes baseados em grandes modelos de linguagem (LLMs) estão transformando os dispositivos digitais de ferramentas passivas em colaboradores inteligentes e proativos. No entanto, a maioria dos frameworks existentes permanece confinada a um único sistema operacional ou dispositivo, tornando os fluxos de trabalho entre dispositivos frágeis e amplamente manuais. Apresentamos o UFO³, um sistema que unifica endpoints heterogêneos – desktops, servidores, dispositivos móveis e computação de borda – em um único tecido de orquestração.
O UFO³ modela cada requisição do usuário como uma **Constelação de Tarefas** mutável: um DAG (Grafo Acíclico Direcionado) distribuído de subtarefas atômicas (**Estrelas de Tarefa**) com dependências explícitas de controle e dados (**Linhas de Estrela de Tarefa**). A Constelação de Tarefas evolui continuamente à medida que os resultados fluem dos dispositivos distribuídos, permitindo execução assíncrona, recuperação adaptativa e otimização dinâmica. Um **Orquestrador de Constelações** executa tarefas de forma segura e assíncrona enquanto aplica atualizações dinâmicas no DAG, e o **Protocolo de Interação de Agentes (AIP)** fornece canais persistentes e de baixa latência para o despacho confiável de tarefas e o fluxo de resultados.
Esses designs dissolvem as fronteiras tradicionais entre dispositivos e plataformas, permitindo que os agentes colaborem perfeitamente e amplifiquem sua inteligência coletiva. Avaliamos o UFO³ no NebulaBench, um benchmark com 55 tarefas entre dispositivos, abrangendo 5 máquinas e 10 categorias. O UFO³ alcança 83,3% de conclusão de subtarefas, 70,9% de sucesso na tarefa, expõe paralelismo com uma largura média de 1,72 e reduz a latência de ponta a ponta em 31% em relação a uma linha de base sequencial. Experimentos de injeção de falhas demonstram degradação graciosa e recuperação sob falhas transitórias e permanentes de agentes. Esses resultados mostram que o UFO³ alcança uma orquestração de tarefas precisa, eficiente e resiliente em dispositivos heterogêneos, unindo agentes isolados em um tecido de computação coerente e adaptativo que se estende por toda a paisagem da computação ubíqua.
English
Large language model (LLM)-powered agents are transforming digital devices from passive tools into proactive intelligent collaborators. However, most existing frameworks remain confined to a single OS or device, making cross-device workflows brittle and largely manual. We present UFO^3, a system that unifies heterogeneous endpoints, desktops, servers, mobile devices, and edge, into a single orchestration fabric. UFO^3 models each user request as a mutable TaskConstellation: a distributed DAG of atomic subtasks (TaskStars) with explicit control and data dependencies (TaskStarLines). The TaskConstellation continuously evolves as results stream in from distributed devices, enabling asynchronous execution, adaptive recovery, and dynamic optimization. A Constellation Orchestrator} executes tasks safely and asynchronously while applying dynamic DAG updates, and the Agent Interaction Protocol (AIP) provides persistent, low-latency channels for reliable task dispatch and result streaming. These designs dissolve the traditional boundaries between devices and platforms, allowing agents to collaborate seamlessly and amplify their collective intelligence.
We evaluate UFO^3 on NebulaBench, a benchmark of 55 cross-device tasks across 5 machines and 10 categories. UFO^3 achieves 83.3% subtask completion, 70.9% task success, exposes parallelism with an average width of 1.72, and reduces end-to-end latency by 31% relative to a sequential baseline. Fault-injection experiments demonstrate graceful degradation and recovery under transient and permanent agent failures. These results show that UFO^3 achieves accurate, efficient, and resilient task orchestration across heterogeneous devices, uniting isolated agents into a coherent, adaptive computing fabric that extends across the landscape of ubiquitous computing.