Агентно-ориентированное проектирование композиционных машин
Agentic Design of Compositional Machines
October 16, 2025
Авторы: Wenqian Zhang, Weiyang Liu, Zhen Liu
cs.AI
Аннотация
Проектирование сложных машин является как показателем человеческого интеллекта, так и основой инженерной практики. Учитывая недавние достижения в области больших языковых моделей (LLM), мы задаемся вопросом, могут ли они также научиться создавать. Мы рассматриваем этот вопрос через призму композиционного проектирования машин: задачи, в которой машины собираются из стандартизированных компонентов для выполнения функциональных требований, таких как передвижение или манипулирование, в смоделированной физической среде. Для поддержки этого исследования мы представляем BesiegeField — тестовую среду, построенную на основе игры Besiege, которая позволяет создавать конструкции из частей, проводить физическое моделирование и оценивать результаты на основе вознаграждения. Используя BesiegeField, мы тестируем современные LLM с агентными рабочими процессами и определяем ключевые способности, необходимые для успеха, включая пространственное мышление, стратегическую сборку и следование инструкциям. Поскольку текущие модели с открытым исходным кодом не справляются, мы исследуем обучение с подкреплением (RL) как путь к улучшению: мы создаем набор данных для "холодного старта", проводим эксперименты по тонкой настройке RL и выделяем открытые проблемы на стыке языка, проектирования машин и физического мышления.
English
The design of complex machines stands as both a marker of human intelligence
and a foundation of engineering practice. Given recent advances in large
language models (LLMs), we ask whether they, too, can learn to create. We
approach this question through the lens of compositional machine design: a task
in which machines are assembled from standardized components to meet functional
demands like locomotion or manipulation in a simulated physical environment. To
support this investigation, we introduce BesiegeField, a testbed built on the
machine-building game Besiege, which enables part-based construction, physical
simulation and reward-driven evaluation. Using BesiegeField, we benchmark
state-of-the-art LLMs with agentic workflows and identify key capabilities
required for success, including spatial reasoning, strategic assembly, and
instruction-following. As current open-source models fall short, we explore
reinforcement learning (RL) as a path to improvement: we curate a cold-start
dataset, conduct RL finetuning experiments, and highlight open challenges at
the intersection of language, machine design, and physical reasoning.