KAPSO: Ein wissensbasiertes Framework für autonome Programmsynthese und -optimierung

papers.abstract

Wir stellen KAPSO vor, ein modulares Framework für die autonome Programmsynthese und -optimierung. Ausgehend von einem natürlichensprachlichen Ziel und einer Evaluierungsmethode führt KAPSO iterativ Ideenfindung, Codesynthese und -bearbeitung, Ausführung, Bewertung und Lernen durch, um ein ausführbares Artefakt in Richtung messbarer Zielvorgaben zu verbessern. Anstatt die Synthese als Endpunkt zu betrachten, nutzt KAPSO die Synthese als Operator innerhalb einer langfristigen Optimierungsschleife, in der der Fortschritt durch die Ergebnisse des Evaluators definiert wird. KAPSO adressiert typische langfristige Schwachstellen von Code-Agenten, wie verlorene Experimentierzustände, sprunghaftes Debugging und schwache Wiederverwendung von Domänenwissen, durch die Integration von drei eng gekoppelten Komponenten. Erstens isoliert eine git-native Experimentier-Engine jeden Versuch als Branch, erzeugt reproduzierbare Artefakte und bewahrt die Provenienz über Iterationen hinweg. Zweitens erfasst ein Wissenssystem heterogene Quellen, einschließlich Repositories, interner Playbooks und kuratierter externer Ressourcen wie Dokumentationen, wissenschaftlicher Arbeiten und Websuchergebnisse, und organisiert sie in einer strukturierten Repräsentation, die Retrieval über Workflows, Implementierungen und Umgebungsbeschränkungen hinweg unterstützt. Drittens koordiniert eine kognitive Gedächtnisschicht den Abruf und verwaltet einen episodischen Speicher wiederverwendbarer Lektionen, die aus Experimentverläufen (Ausführungsprotokolle, Diffs und Evaluator-Feedback) destilliert werden, um wiederholte Fehlermuster zu reduzieren und die Konvergenz zu beschleunigen. Wir evaluierten KAPSO auf MLE-Bench (Kaggle-artige ML-Wettbewerbe) und ALE-Bench (AtCoder-Heuristikoptimierung) und berichten über die End-to-End-Leistung. Code verfügbar unter: https://github.com/Leeroo-AI/kapso

English

We introduce KAPSO, a modular framework for autonomous program synthesis and optimization. Given a natural language goal and an evaluation method, KAPSO iteratively performs ideation, code synthesis and editing, execution, evaluation, and learning to improve a runnable artifact toward measurable objectives. Rather than treating synthesis as the endpoint, KAPSO uses synthesis as an operator within a long-horizon optimization loop, where progress is defined by evaluator outcomes. KAPSO targets long-horizon failures common in coding agents, including lost experimental state, brittle debugging, and weak reuse of domain expertise, by integrating three tightly coupled components. First, a git-native experimentation engine isolates each attempt as a branch, producing reproducible artifacts and preserving provenance across iterations. Second, a knowledge system ingests heterogeneous sources, including repositories, internal playbooks, and curated external resources such as documentation, scientific papers, and web search results, and organizes them into a structured representation that supports retrieval over workflows, implementations, and environment constraints. Third, a cognitive memory layer coordinates retrieval and maintains an episodic store of reusable lessons distilled from experiment traces (run logs, diffs, and evaluator feedback), reducing repeated error modes and accelerating convergence. We evaluated KAPSO on MLE-Bench (Kaggle-style ML competitions) and ALE-Bench (AtCoder heuristic optimization), and report end-to-end performance. Code Available at: https://github.com/Leeroo-AI/kapso

KAPSO: Ein wissensbasiertes Framework für autonome Programmsynthese und -optimierung

KAPSO: A Knowledge-grounded framework for Autonomous Program Synthesis and Optimization

papers.abstract

Support