Computadoras Sintéticas a Escala para la Simulación de Productividad de Largo Horizonte

Resumen

El trabajo realista de productividad a largo plazo está fuertemente condicionado por entornos informáticos específicos del usuario, donde gran parte del contexto laboral se almacena y organiza mediante estructuras de directorios y artefactos ricos en contenido. Para escalar la creación de datos sintéticos en estos escenarios de productividad, presentamos Synthetic Computers at Scale, una metodología escalable para crear dichos entornos con jerarquías de carpetas realistas y artefactos con contenido enriquecido (por ejemplo, documentos, hojas de cálculo y presentaciones). Condicionados a cada ordenador sintético, ejecutamos simulaciones de largo horizonte: un agente crea objetivos de productividad específicos para el usuario del ordenador que requieren múltiples entregables profesionales y aproximadamente un mes de trabajo humano; otro agente actúa entonces como ese usuario y continúa trabajando en el ordenador —por ejemplo, navegando por el sistema de archivos para contextualizarse, coordinándose con colaboradores simulados y produciendo artefactos profesionales— hasta que estos objetivos se completan. En experimentos preliminares, creamos 1,000 ordenadores sintéticos y ejecutamos simulaciones de largo horizonte en ellos; cada ejecución requiere más de 8 horas de tiempo de ejecución del agente y abarca en promedio más de 2,000 turnos. Estas simulaciones producen señales de aprendizaje experiencial ricas, cuya efectividad se valida mediante mejoras significativas en el rendimiento de los agentes en evaluaciones de productividad tanto dentro como fuera del dominio. Dado que las personalidades son abundantes a escala de miles de millones, esta metodología puede en principio escalarse a millones o incluso miles de millones de mundos de usuarios sintéticos con suficiente capacidad de cómputo, permitiendo una cobertura más amplia de diversas profesiones, roles, contextos, entornos y necesidades de productividad. Sostenemos que la creación escalable de ordenadores sintéticos, junto con simulaciones a gran escala, es muy prometedora como sustrato fundamental para la auto-mejora de agentes y el aprendizaje por refuerzo agéntico en escenarios de productividad de largo horizonte.

English

Realistic long-horizon productivity work is strongly conditioned on user-specific computer environments, where much of the work context is stored and organized through directory structures and content-rich artifacts. To scale synthetic data creation for such productivity scenarios, we introduce Synthetic Computers at Scale, a scalable methodology for creating such environments with realistic folder hierarchies and content-rich artifacts (e.g., documents, spreadsheets, and presentations). Conditioned on each synthetic computer, we run long-horizon simulations: one agent creates productivity objectives that are specific to the computer's user and require multiple professional deliverables and about a month of human work; another agent then acts as that user and keeps working across the computer -- for example, navigating the filesystem for grounding, coordinating with simulated collaborators, and producing professional artifacts -- until these objectives are completed. In preliminary experiments, we create 1,000 synthetic computers and run long-horizon simulations on them; each run requires over 8 hours of agent runtime and spans more than 2,000 turns on average. These simulations produce rich experiential learning signals, whose effectiveness is validated by significant improvements in agent performance on both in-domain and out-of-domain productivity evaluations. Given that personas are abundant at billion scale, this methodology can in principle scale to millions or even billions of synthetic user worlds with sufficient compute, enabling broader coverage of diverse professions, roles, contexts, environments, and productivity needs. We argue that scalable synthetic computer creation, together with at-scale simulations, is highly promising as a foundational substrate for agent self-improvement and agentic reinforcement learning in long-horizon productivity scenarios.

Computadoras Sintéticas a Escala para la Simulación de Productividad de Largo Horizonte

Synthetic Computers at Scale for Long-Horizon Productivity Simulation

Resumen

Support