FullStack-Agent : Amélioration du développement web full-stack par des tests orientés développement et la rétro-traduction de dépôts

papers.abstract

Aider les utilisateurs non experts à développer des sites web interactifs complexes est devenu une tâche populaire pour les agents de code pilotés par des LLM. Cependant, les agents de code existants ont tendance à ne générer que des pages web frontend, masquant l'absence de traitement et de stockage de données full-stack réels par des effets visuels sophistiqués. De manière notable, la construction d'applications web full-stack de niveau production est bien plus complexe que la simple génération de pages frontend, exigeant un contrôle minutieux du flux de données, une compréhension exhaustive des packages et dépendances en constante évolution, et une localisation précise de bugs obscurs dans la base de code. Pour résoudre ces difficultés, nous présentons FullStack-Agent, un système d'agents unifié pour le codage agentique full-stack qui se compose de trois parties : (1) FullStack-Dev, un framework multi-agents doté de solides capacités de planification, d'édition de code, de navigation dans la base de code et de localisation de bugs. (2) FullStack-Learn, une méthode innovante de mise à l'échelle des données et d'auto-amélioration qui rétro-traduit des dépôts de sites web synthétisés et collectés pour améliorer le LLM de base de FullStack-Dev. (3) FullStack-Bench, un benchmark complet qui teste systématiquement les fonctionnalités frontend, backend et base de données du site web généré. Notre FullStack-Dev surpasse la méthode précédente de l'état de l'art de 8,7 %, 38,2 % et 15,9 % respectivement sur les cas de test frontend, backend et base de données. De plus, FullStack-Learn améliore les performances d'un modèle de 30B de 9,7 %, 9,5 % et 2,8 % sur les trois ensembles de tests grâce à l'auto-amélioration, démontrant l'efficacité de notre approche. Le code est disponible à l'adresse https://github.com/mnluzimu/FullStack-Agent.

English

Assisting non-expert users to develop complex interactive websites has become a popular task for LLM-powered code agents. However, existing code agents tend to only generate frontend web pages, masking the lack of real full-stack data processing and storage with fancy visual effects. Notably, constructing production-level full-stack web applications is far more challenging than only generating frontend web pages, demanding careful control of data flow, comprehensive understanding of constantly updating packages and dependencies, and accurate localization of obscure bugs in the codebase. To address these difficulties, we introduce FullStack-Agent, a unified agent system for full-stack agentic coding that consists of three parts: (1) FullStack-Dev, a multi-agent framework with strong planning, code editing, codebase navigation, and bug localization abilities. (2) FullStack-Learn, an innovative data-scaling and self-improving method that back-translates crawled and synthesized website repositories to improve the backbone LLM of FullStack-Dev. (3) FullStack-Bench, a comprehensive benchmark that systematically tests the frontend, backend and database functionalities of the generated website. Our FullStack-Dev outperforms the previous state-of-the-art method by 8.7%, 38.2%, and 15.9% on the frontend, backend, and database test cases respectively. Additionally, FullStack-Learn raises the performance of a 30B model by 9.7%, 9.5%, and 2.8% on the three sets of test cases through self-improvement, demonstrating the effectiveness of our approach. The code is released at https://github.com/mnluzimu/FullStack-Agent.

FullStack-Agent : Amélioration du développement web full-stack par des tests orientés développement et la rétro-traduction de dépôts

FullStack-Agent: Enhancing Agentic Full-Stack Web Coding via Development-Oriented Testing and Repository Back-Translation

papers.abstract

Support