Auf dem Weg zur skalierbaren Synthese von Terminalaufgaben mittels Fähigkeitsgraphen

Zusammenfassung

Terminale Agenten haben ein großes Potenzial für autonome Kommandozeilenausführung gezeigt, doch ihre Ausbildung bleibt durch die Knappheit hochwertiger und vielfältiger Ausführungspfade eingeschränkt. Bestehende Ansätze mildern diesen Engpass, indem sie groß angelegte Terminal-Aufgabeninstanzen für die Pfadabtastung synthetisieren. Sie konzentrieren sich jedoch primär auf die Skalierung der Aufgabenanzahl, während sie nur begrenzte Kontrolle über die Vielfalt der Ausführungspfade bieten, die Agenten während des Trainings tatsächlich erfahren. In diesem Artikel stellen wir SkillSynth vor, einen automatisierten Rahmen für die Synthese von Terminal-Aufgaben, der auf einem szenariovermittelten Fähigkeitsgraphen basiert. SkillSynth konstruiert zunächst einen groß angelegten Fähigkeitsgraphen, in dem Szenarien als intermediäre Transitionknoten fungieren, die verschiedene Kommandozeilenfähigkeiten verbinden. Anschließend tastet es Pfade von diesem Graphen als Abstraktionen realer Arbeitsabläufe ab und verwendet ein Multi-Agenten-System, um diese in ausführbare Aufgabeninstanzen zu instanziieren. Indem die Aufgaben synthese auf graph-abgetasteten Arbeitsablaufpfaden basiert, kontrolliert SkillSynth explizit die Vielfalt der minimalen Ausführungspfade, die zur Lösung der synthetisierten Aufgaben erforderlich sind. Experimente auf Terminal-Bench demonstrieren die Wirksamkeit von SkillSynth. Darüber hinaus wurden von SkillSynth synthetisierte Aufgabeninstanzen zur Ausbildung von Hy3 Preview übernommen, was zu dessen verbesserten agentenbasierten Fähigkeiten in terminalbasierten Umgebungen beigetragen hat.

English

Terminal agents have demonstrated strong potential for autonomous command-line execution, yet their training remains constrained by the scarcity of high-quality and diverse execution trajectories. Existing approaches mitigate this bottleneck by synthesizing large-scale terminal task instances for trajectory sampling. However, they primarily focus on scaling the number of tasks while providing limited control over the diversity of execution trajectories that agents actually experience during training. In this paper, we present SkillSynth, an automated framework for terminal task synthesis built on a scenario-mediated skill graph. SkillSynth first constructs a large-scale skill graph, where scenarios serve as intermediate transition nodes that connect diverse command-line skills. It then samples paths from this graph as abstractions of real-world workflows, and uses a multi-agent harness to instantiate them into executable task instances. By grounding task synthesis in graph-sampled workflow paths, SkillSynth explicitly controls the diversity of minimal execution trajectories required to solve the synthesized tasks. Experiments on Terminal-Bench demonstrate the effectiveness of SkillSynth. Moreover, task instances synthesized by SkillSynth have been adopted to train Hy3 Preview, contributing to its enhanced agentic capabilities in terminal-based settings.

Auf dem Weg zur skalierbaren Synthese von Terminalaufgaben mittels Fähigkeitsgraphen

Toward Scalable Terminal Task Synthesis via Skill Graphs

Zusammenfassung

Support