LLM pour l'ingénierie : Enseigner aux modèles à concevoir des fusées à haute puissance
LLMs for Engineering: Teaching Models to Design High Powered Rockets
April 27, 2025
Auteurs: Toby Simonds
cs.AI
Résumé
Les modèles de langage de grande taille (LLMs) ont transformé le génie logiciel, mais leur application aux domaines du génie physique reste peu explorée. Cet article évalue les capacités des LLMs dans la conception de fusées à haute puissance à travers RocketBench, un benchmark connectant les LLMs à des simulations de fusées à haute fidélité. Nous testons les modèles sur deux tâches de conception de complexité croissante : l'optimisation de l'altitude cible et les défis d'atterrissage de précision. Nos résultats révèlent que si les LLMs de pointe démontrent une solide connaissance de base en ingénierie, ils peinent à itérer sur leurs conceptions lorsqu'ils reçoivent des résultats de simulation et finissent par plafonner en dessous des niveaux de performance humaine. Cependant, lorsqu'ils sont renforcés par l'apprentissage par renforcement (RL), nous montrons qu'un modèle de 7 milliards de paramètres surpasse à la fois les modèles de base de pointe et les experts humains. Cette recherche démontre que les LLMs entraînés par RL peuvent servir d'outils efficaces pour l'optimisation complexe en ingénierie, transformant potentiellement les domaines de l'ingénierie au-delà du développement logiciel.
English
Large Language Models (LLMs) have transformed software engineering, but their
application to physical engineering domains remains underexplored. This paper
evaluates LLMs' capabilities in high-powered rocketry design through
RocketBench, a benchmark connecting LLMs to high-fidelity rocket simulations.
We test models on two increasingly complex design tasks: target altitude
optimization and precision landing challenges. Our findings reveal that while
state-of-the-art LLMs demonstrate strong baseline engineering knowledge, they
struggle to iterate on their designs when given simulation results and
ultimately plateau below human performance levels. However, when enhanced with
reinforcement learning (RL), we show that a 7B parameter model outperforms both
SoTA foundation models and human experts. This research demonstrates that
RL-trained LLMs can serve as effective tools for complex engineering
optimization, potentially transforming engineering domains beyond software
development.Summary
AI-Generated Summary