構成機械のエージェンシックデザイン
Agentic Design of Compositional Machines
October 16, 2025
著者: Wenqian Zhang, Weiyang Liu, Zhen Liu
cs.AI
要旨
複雑な機械の設計は、人間の知性の指標であると同時に、工学実践の基盤でもある。近年の大規模言語モデル(LLMs)の進展を踏まえ、我々はこれらのモデルも創造を学ぶことができるかどうかを問う。この問いに答えるために、我々は構成論的機械設計という視点からアプローチする。これは、標準化された部品を組み立てて、シミュレーションされた物理環境における移動や操作といった機能的要求を満たす機械を設計するタスクである。この研究を支援するため、我々は機械構築ゲーム「Besiege」を基盤としたテストベッド「BesiegeField」を導入した。このプラットフォームは、部品ベースの構築、物理シミュレーション、報酬駆動型の評価を可能にする。BesiegeFieldを用いて、我々は最先端のLLMsをエージェント的なワークフローでベンチマークし、空間推論、戦略的組立、指示の遵守といった成功に必要な主要な能力を特定した。現在のオープンソースモデルがこれらの能力を十分に発揮できないことを受け、我々は強化学習(RL)を改善の道として探求する。具体的には、コールドスタートデータセットを整備し、RLファインチューニング実験を実施し、言語、機械設計、物理推論の交差点における未解決の課題を明らかにする。
English
The design of complex machines stands as both a marker of human intelligence
and a foundation of engineering practice. Given recent advances in large
language models (LLMs), we ask whether they, too, can learn to create. We
approach this question through the lens of compositional machine design: a task
in which machines are assembled from standardized components to meet functional
demands like locomotion or manipulation in a simulated physical environment. To
support this investigation, we introduce BesiegeField, a testbed built on the
machine-building game Besiege, which enables part-based construction, physical
simulation and reward-driven evaluation. Using BesiegeField, we benchmark
state-of-the-art LLMs with agentic workflows and identify key capabilities
required for success, including spatial reasoning, strategic assembly, and
instruction-following. As current open-source models fall short, we explore
reinforcement learning (RL) as a path to improvement: we curate a cold-start
dataset, conduct RL finetuning experiments, and highlight open challenges at
the intersection of language, machine design, and physical reasoning.