FullStack-Agent: Verbesserung des agentenbasierten Full-Stack-Webcodings durch entwicklungsorientiertes Testen und Repository-Rückübersetzung

papers.abstract

Die Unterstützung nicht-experimentierter Benutzer bei der Entwicklung komplexer interaktiver Websites ist zu einer beliebten Aufgabe für LLM-gestützte Code-Agenten geworden. Allerdings neigen bestehende Code-Agenten dazu, nur Frontend-Webseiten zu generieren, wobei der Mangel an echter Full-Stack-Datenverarbeitung und -speicherung durch aufwendige visuelle Effekte kaschiert wird. Es ist bemerkenswert, dass die Erstellung produktionsreifer Full-Stack-Webanwendungen weitaus anspruchsvoller ist als die reine Generierung von Frontend-Webseiten, da sie eine sorgfältige Steuerung des Datenflusses, ein umfassendes Verständnis sich ständig aktualisierender Pakete und Abhängigkeiten sowie eine präzise Lokalisierung schwer auffindbarer Fehler in der Codebasis erfordert. Um diese Schwierigkeiten zu bewältigen, stellen wir FullStack-Agent vor, ein einheitliches Agentensystem für agentenbasiertes Full-Stack-Programmieren, das aus drei Teilen besteht: (1) FullStack-Dev, ein Multi-Agenten-Framework mit starken Fähigkeiten in den Bereichen Planung, Code-Bearbeitung, Navigation in Codebasen und Fehlerlokalisierung. (2) FullStack-Learn, eine innovative Methode zur Datenskalierung und Selbstverbesserung, die gecrawlte und synthetisierte Website-Repositories zurückübersetzt, um das zugrundeliegende LLM von FullStack-Dev zu verbessern. (3) FullStack-Bench, ein umfassender Benchmark, der die Frontend-, Backend- und Datenbankfunktionen der generierten Website systematisch testet. Unser FullStack-Dev übertrifft die bisherige state-of-the-art-Methode um 8,7 %, 38,2 % bzw. 15,9 % bei den Frontend-, Backend- und Datenbank-Testfällen. Zusätzlich steigert FullStack-Learn die Leistung eines 30B-Modells durch Selbstverbesserung um 9,7 %, 9,5 % bzw. 2,8 % bei den drei Testfallgruppen, was die Wirksamkeit unseres Ansatzes demonstriert. Der Code ist unter https://github.com/mnluzimu/FullStack-Agent verfügbar.

English

Assisting non-expert users to develop complex interactive websites has become a popular task for LLM-powered code agents. However, existing code agents tend to only generate frontend web pages, masking the lack of real full-stack data processing and storage with fancy visual effects. Notably, constructing production-level full-stack web applications is far more challenging than only generating frontend web pages, demanding careful control of data flow, comprehensive understanding of constantly updating packages and dependencies, and accurate localization of obscure bugs in the codebase. To address these difficulties, we introduce FullStack-Agent, a unified agent system for full-stack agentic coding that consists of three parts: (1) FullStack-Dev, a multi-agent framework with strong planning, code editing, codebase navigation, and bug localization abilities. (2) FullStack-Learn, an innovative data-scaling and self-improving method that back-translates crawled and synthesized website repositories to improve the backbone LLM of FullStack-Dev. (3) FullStack-Bench, a comprehensive benchmark that systematically tests the frontend, backend and database functionalities of the generated website. Our FullStack-Dev outperforms the previous state-of-the-art method by 8.7%, 38.2%, and 15.9% on the frontend, backend, and database test cases respectively. Additionally, FullStack-Learn raises the performance of a 30B model by 9.7%, 9.5%, and 2.8% on the three sets of test cases through self-improvement, demonstrating the effectiveness of our approach. The code is released at https://github.com/mnluzimu/FullStack-Agent.

FullStack-Agent: Verbesserung des agentenbasierten Full-Stack-Webcodings durch entwicklungsorientiertes Testen und Repository-Rückübersetzung

FullStack-Agent: Enhancing Agentic Full-Stack Web Coding via Development-Oriented Testing and Repository Back-Translation

papers.abstract

Support