GLM-5: Von Vibe Coding zu Agentic Engineering

Zusammenfassung

Wir stellen GLM-5 vor, ein Next-Generation-Foundation-Model, das entwickelt wurde, um das Paradigma vom Vibe Coding zur agentenbasierten Engineering zu überführen. Aufbauend auf den agentenbasierten, reasoning- und Coding-Fähigkeiten (ARC) seines Vorgängers nutzt GLM-5 DSA, um die Trainings- und Inferenzkosten signifikant zu reduzieren und gleichzeitig die Langkontext-Treue beizubehalten. Um die Modellabstimmung und Autonomie voranzutreiben, setzen wir eine neue asynchrone Reinforcement-Learning-Infrastruktur ein, die die Effizienz nach dem Training durch die Entkopplung von Generierung und Training drastisch verbessert. Darüber hinaus schlagen wir neuartige asynchrone Agent-RL-Algorithmen vor, die die RL-Qualität weiter verbessern und es dem Modell ermöglichen, effektiver aus komplexen, langfristigen Interaktionen zu lernen. Durch diese Innovationen erzielt GLM-5 state-of-the-art Leistungen in wichtigen Open-Benchmarks. Entscheidend ist, dass GLM-5 beispiellose Fähigkeiten bei realen Coding-Aufgaben demonstriert und bisherige Baseline-Ansätze bei der Bewältigung end-to-end Software-Engineering-Herausforderungen übertrifft. Code, Modelle und weitere Informationen sind verfügbar unter https://github.com/zai-org/GLM-5.

English

We present GLM-5, a next-generation foundation model designed to transition the paradigm of vibe coding to agentic engineering. Building upon the agentic, reasoning, and coding (ARC) capabilities of its predecessor, GLM-5 adopts DSA to significantly reduce training and inference costs while maintaining long-context fidelity. To advance model alignment and autonomy, we implement a new asynchronous reinforcement learning infrastructure that drastically improves post-training efficiency by decoupling generation from training. Furthermore, we propose novel asynchronous agent RL algorithms that further improve RL quality, enabling the model to learn from complex, long-horizon interactions more effectively. Through these innovations, GLM-5 achieves state-of-the-art performance on major open benchmarks. Most critically, GLM-5 demonstrates unprecedented capability in real-world coding tasks, surpassing previous baselines in handling end-to-end software engineering challenges. Code, models, and more information are available at https://github.com/zai-org/GLM-5.

GLM-5: Von Vibe Coding zu Agentic Engineering

GLM-5: from Vibe Coding to Agentic Engineering

Zusammenfassung

Support