GLM-5: de la Codificación por Vibración a la Ingeniería Agéntica

Resumen

Presentamos GLM-5, un modelo de base de próxima generación diseñado para transicionar el paradigma de la programación por ambiente hacia la ingeniería agentiva. Basándose en las capacidades de agentividad, razonamiento y programación (ARC) de su predecesor, GLM-5 adopta DSA para reducir significativamente los costos de entrenamiento e inferencia manteniendo la fidelidad de contexto largo. Para avanzar en la alineación y autonomía del modelo, implementamos una nueva infraestructura de aprendizaje por refuerzo asíncrono que mejora drásticamente la eficiencia posterior al entrenamiento al desacoplar la generación del entrenamiento. Además, proponemos nuevos algoritmos asíncronos de RL para agentes que mejoran aún más la calidad del RL, permitiendo que el modelo aprenda de interacciones complejas y de largo horizonte de manera más efectiva. A través de estas innovaciones, GLM-5 logra un rendimiento de vanguardia en los principales benchmarks abiertos. Más críticamente, GLM-5 demuestra una capacidad sin precedentes en tareas de programación del mundo real, superando los baselines anteriores en el manejo de desafíos de ingeniería de software de extremo a extremo. El código, los modelos y más información están disponibles en https://github.com/zai-org/GLM-5.

English

We present GLM-5, a next-generation foundation model designed to transition the paradigm of vibe coding to agentic engineering. Building upon the agentic, reasoning, and coding (ARC) capabilities of its predecessor, GLM-5 adopts DSA to significantly reduce training and inference costs while maintaining long-context fidelity. To advance model alignment and autonomy, we implement a new asynchronous reinforcement learning infrastructure that drastically improves post-training efficiency by decoupling generation from training. Furthermore, we propose novel asynchronous agent RL algorithms that further improve RL quality, enabling the model to learn from complex, long-horizon interactions more effectively. Through these innovations, GLM-5 achieves state-of-the-art performance on major open benchmarks. Most critically, GLM-5 demonstrates unprecedented capability in real-world coding tasks, surpassing previous baselines in handling end-to-end software engineering challenges. Code, models, and more information are available at https://github.com/zai-org/GLM-5.

GLM-5: de la Codificación por Vibración a la Ingeniería Agéntica

GLM-5: from Vibe Coding to Agentic Engineering

Resumen

Support