Conception Agentielle de Machines Compositionnelles
Agentic Design of Compositional Machines
October 16, 2025
papers.authors: Wenqian Zhang, Weiyang Liu, Zhen Liu
cs.AI
papers.abstract
La conception de machines complexes représente à la fois un marqueur de l'intelligence humaine et un pilier de la pratique de l'ingénierie. Compte tenu des avancées récentes dans les modèles de langage à grande échelle (LLMs), nous nous demandons s'ils peuvent, eux aussi, apprendre à créer. Nous abordons cette question sous l'angle de la conception mécanique compositionnelle : une tâche dans laquelle des machines sont assemblées à partir de composants standardisés pour répondre à des besoins fonctionnels tels que la locomotion ou la manipulation dans un environnement physique simulé. Pour soutenir cette investigation, nous introduisons BesiegeField, un banc d'essai basé sur le jeu de construction mécanique Besiege, qui permet la construction modulaire, la simulation physique et l'évaluation basée sur des récompenses. En utilisant BesiegeField, nous évaluons les LLMs de pointe avec des workflows agentiques et identifions les compétences clés nécessaires pour réussir, notamment le raisonnement spatial, l'assemblage stratégique et le suivi des instructions. Comme les modèles open-source actuels présentent des lacunes, nous explorons l'apprentissage par renforcement (RL) comme voie d'amélioration : nous constituons un ensemble de données de démarrage à froid, menons des expériences de fine-tuning par RL et mettons en lumière les défis ouverts à l'intersection du langage, de la conception mécanique et du raisonnement physique.
English
The design of complex machines stands as both a marker of human intelligence
and a foundation of engineering practice. Given recent advances in large
language models (LLMs), we ask whether they, too, can learn to create. We
approach this question through the lens of compositional machine design: a task
in which machines are assembled from standardized components to meet functional
demands like locomotion or manipulation in a simulated physical environment. To
support this investigation, we introduce BesiegeField, a testbed built on the
machine-building game Besiege, which enables part-based construction, physical
simulation and reward-driven evaluation. Using BesiegeField, we benchmark
state-of-the-art LLMs with agentic workflows and identify key capabilities
required for success, including spatial reasoning, strategic assembly, and
instruction-following. As current open-source models fall short, we explore
reinforcement learning (RL) as a path to improvement: we curate a cold-start
dataset, conduct RL finetuning experiments, and highlight open challenges at
the intersection of language, machine design, and physical reasoning.