FullStack-Agent: Verbetering van Agentisch Full-Stack Webontwikkeling via Ontwikkelingsgericht Testen en Repository Back-Translatie

Samenvatting

Het assisteren van niet-deskundige gebruikers bij het ontwikkelen van complexe interactieve websites is een populaire taak geworden voor LLM-gestuurde code-agents. Bestaande code-agents genereren echter vaak alleen frontend webpagina's, waarbij het gebrek aan echte full-stack gegevensverwerking en -opslag wordt verhuld met uitgebreide visuele effecten. Het construeren van productieklasse full-stack webapplicaties is aanzienlijk uitdagender dan alleen het genereren van frontend webpagina's, omdat dit zorgvuldige controle van de gegevensstroom vereist, een uitgebreid begrip van constant bijgewerkte pakketten en afhankelijkheden, en accurate lokalisatie van onduidelijke bugs in de codebase. Om deze problemen aan te pakken, introduceren we FullStack-Agent, een uniform agentsysteem voor full-stack agentgebaseerd programmeren dat uit drie delen bestaat: (1) FullStack-Dev, een multi-agent framework met sterke plannings-, codebewerkings-, codebase-navigatie- en buglokalisatiecapaciteiten. (2) FullStack-Learn, een innovatieve methode voor dataschaling en zelfverbetering die gecrawlde en gesynthetiseerde websiterepositories terugvertaalt om het backbone LLM van FullStack-Dev te verbeteren. (3) FullStack-Bench, een uitgebreide benchmark die de frontend-, backend- en databasefunctionaliteiten van de gegenereerde website systematisch test. Onze FullStack-Dev presteert 8,7%, 38,2% en 15,9% beter dan de vorige state-of-the-art methode op respectievelijk de frontend-, backend- en databasetestcases. Bovendien verhoogt FullStack-Learn de prestaties van een 30B-model met 9,7%, 9,5% en 2,8% op de drie sets testcases door zelfverbetering, wat de effectiviteit van onze aanpak aantoont. De code is vrijgegeven op https://github.com/mnluzimu/FullStack-Agent.

English

Assisting non-expert users to develop complex interactive websites has become a popular task for LLM-powered code agents. However, existing code agents tend to only generate frontend web pages, masking the lack of real full-stack data processing and storage with fancy visual effects. Notably, constructing production-level full-stack web applications is far more challenging than only generating frontend web pages, demanding careful control of data flow, comprehensive understanding of constantly updating packages and dependencies, and accurate localization of obscure bugs in the codebase. To address these difficulties, we introduce FullStack-Agent, a unified agent system for full-stack agentic coding that consists of three parts: (1) FullStack-Dev, a multi-agent framework with strong planning, code editing, codebase navigation, and bug localization abilities. (2) FullStack-Learn, an innovative data-scaling and self-improving method that back-translates crawled and synthesized website repositories to improve the backbone LLM of FullStack-Dev. (3) FullStack-Bench, a comprehensive benchmark that systematically tests the frontend, backend and database functionalities of the generated website. Our FullStack-Dev outperforms the previous state-of-the-art method by 8.7%, 38.2%, and 15.9% on the frontend, backend, and database test cases respectively. Additionally, FullStack-Learn raises the performance of a 30B model by 9.7%, 9.5%, and 2.8% on the three sets of test cases through self-improvement, demonstrating the effectiveness of our approach. The code is released at https://github.com/mnluzimu/FullStack-Agent.

FullStack-Agent: Verbetering van Agentisch Full-Stack Webontwikkeling via Ontwikkelingsgericht Testen en Repository Back-Translatie

FullStack-Agent: Enhancing Agentic Full-Stack Web Coding via Development-Oriented Testing and Repository Back-Translation

Samenvatting

Support