Ordinateurs Synthétiques à Grande Échelle pour la Simulation de Productivité à Long Terme

Résumé

Le travail productif réaliste à long terme est fortement conditionné par les environnements informatiques spécifiques aux utilisateurs, où une grande partie du contexte de travail est stockée et organisée via des structures de répertoires et des artefacts riches en contenu. Pour mettre à l'échelle la création de données synthétiques dans de tels scénarios de productivité, nous introduisons Synthetic Computers at Scale, une méthodologie évolutive permettant de créer de tels environnements avec des hiérarchies de dossiers réalistes et des artefacts riches en contenu (par exemple, des documents, des feuilles de calcul et des présentations). Sur la base de chaque ordinateur synthétique, nous exécutons des simulations à long terme : un agent crée des objectifs de productivité spécifiques à l'utilisateur de l'ordinateur, nécessitant de multiples livrables professionnels et environ un mois de travail humain ; un autre agent agit ensuite comme cet utilisateur et continue de travailler sur l'ordinateur – par exemple, en naviguant dans le système de fichiers pour se contextualiser, en coordonnant avec des collaborateurs simulés, et en produisant des artefacts professionnels – jusqu'à ce que ces objectifs soient atteints. Dans des expériences préliminaires, nous avons créé 1 000 ordinateurs synthétiques et exécuté des simulations à long terme sur ceux-ci ; chaque exécution nécessite plus de 8 heures de temps d'exécution d'agent et s'étend en moyenne sur plus de 2 000 tours. Ces simulations produisent des signaux d'apprentissage expérientiel riches, dont l'efficacité est validée par des améliorations significatives des performances des agents lors d'évaluations de productivité intra-domaines et extra-domaines. Étant donné que les personas existent en abondance à l'échelle du milliard, cette méthodologie peut en principe s'étendre à des millions, voire des milliards de mondes utilisateurs synthétiques avec suffisamment de puissance de calcul, permettant une couverture plus large de professions, de rôles, de contextes, d'environnements et de besoins de productivité divers. Nous soutenons que la création évolutive d'ordinateurs synthétiques, associée à des simulations à grande échelle, est très prometteuse en tant que substrat fondamental pour l'auto-amélioration des agents et l'apprentissage par renforcement agentique dans des scénarios de productivité à long terme.

English

Realistic long-horizon productivity work is strongly conditioned on user-specific computer environments, where much of the work context is stored and organized through directory structures and content-rich artifacts. To scale synthetic data creation for such productivity scenarios, we introduce Synthetic Computers at Scale, a scalable methodology for creating such environments with realistic folder hierarchies and content-rich artifacts (e.g., documents, spreadsheets, and presentations). Conditioned on each synthetic computer, we run long-horizon simulations: one agent creates productivity objectives that are specific to the computer's user and require multiple professional deliverables and about a month of human work; another agent then acts as that user and keeps working across the computer -- for example, navigating the filesystem for grounding, coordinating with simulated collaborators, and producing professional artifacts -- until these objectives are completed. In preliminary experiments, we create 1,000 synthetic computers and run long-horizon simulations on them; each run requires over 8 hours of agent runtime and spans more than 2,000 turns on average. These simulations produce rich experiential learning signals, whose effectiveness is validated by significant improvements in agent performance on both in-domain and out-of-domain productivity evaluations. Given that personas are abundant at billion scale, this methodology can in principle scale to millions or even billions of synthetic user worlds with sufficient compute, enabling broader coverage of diverse professions, roles, contexts, environments, and productivity needs. We argue that scalable synthetic computer creation, together with at-scale simulations, is highly promising as a foundational substrate for agent self-improvement and agentic reinforcement learning in long-horizon productivity scenarios.

Ordinateurs Synthétiques à Grande Échelle pour la Simulation de Productivité à Long Terme

Synthetic Computers at Scale for Long-Horizon Productivity Simulation

Résumé

Support