ChatPaper.aiChatPaper

Agentisch Ontwerp van Compositionele Machines

Agentic Design of Compositional Machines

October 16, 2025
Auteurs: Wenqian Zhang, Weiyang Liu, Zhen Liu
cs.AI

Samenvatting

Het ontwerpen van complexe machines geldt zowel als een teken van menselijke intelligentie als een fundament van ingenieurskunst. Gezien de recente vooruitgang in grote taalmmodellen (LLM's), vragen we ons af of ook zij kunnen leren creëren. We benaderen deze vraag vanuit het perspectief van compositorisch machineontwerp: een taak waarbij machines worden samengesteld uit gestandaardiseerde componenten om functionele eisen zoals voortbeweging of manipulatie in een gesimuleerde fysieke omgeving te vervullen. Om dit onderzoek te ondersteunen, introduceren we BesiegeField, een testomgeving gebaseerd op het machinebouwspel Besiege, die op onderdelen gebaseerde constructie, fysieke simulatie en beloningsgestuurde evaluatie mogelijk maakt. Met behulp van BesiegeField testen we state-of-the-art LLM's met agent-gebaseerde workflows en identificeren we belangrijke vaardigheden die nodig zijn voor succes, waaronder ruimtelijk redeneren, strategische assemblage en het volgen van instructies. Omdat huidige open-source modellen tekortschieten, verkennen we reinforcement learning (RL) als een pad naar verbetering: we stellen een cold-start dataset samen, voeren RL-finetuningexperimenten uit en belichten open uitdagingen op het snijvlak van taal, machineontwerp en fysiek redeneren.
English
The design of complex machines stands as both a marker of human intelligence and a foundation of engineering practice. Given recent advances in large language models (LLMs), we ask whether they, too, can learn to create. We approach this question through the lens of compositional machine design: a task in which machines are assembled from standardized components to meet functional demands like locomotion or manipulation in a simulated physical environment. To support this investigation, we introduce BesiegeField, a testbed built on the machine-building game Besiege, which enables part-based construction, physical simulation and reward-driven evaluation. Using BesiegeField, we benchmark state-of-the-art LLMs with agentic workflows and identify key capabilities required for success, including spatial reasoning, strategic assembly, and instruction-following. As current open-source models fall short, we explore reinforcement learning (RL) as a path to improvement: we curate a cold-start dataset, conduct RL finetuning experiments, and highlight open challenges at the intersection of language, machine design, and physical reasoning.
PDF103October 17, 2025