К созданию масштабируемого синтеза терминальных задач с помощью графов навыков

Аннотация

Терминальные агенты продемонстрировали значительный потенциал для автономного выполнения командной строки, однако их обучение по-прежнему ограничено нехваткой качественных и разнообразных траекторий выполнения. Существующие подходы смягчают это узкое место за счет синтеза крупномасштабных экземпляров терминальных задач для сэмплирования траекторий. Однако в основном они сосредоточены на масштабировании количества задач, обеспечивая при этом ограниченный контроль над разнообразием траекторий выполнения, с которыми агенты фактически сталкиваются во время обучения. В данной статье мы представляем SkillSynth — автоматизированную платформу для синтеза терминальных задач, построенную на основе сценарий-опосредованного графа навыков. SkillSynth сначала строит крупномасштабный граф навыков, где сценарии служат промежуточными узлами перехода, соединяющими разнообразные навыки командной строки. Затем он семплирует пути из этого графа как абстракции реальных рабочих процессов и использует многoагентную систему для их инстанцирования в исполняемые экземпляры задач. Основывая синтез задач на путях рабочих процессов, семплированных из графа, SkillSynth явно контролирует разнообразие минимальных траекторий выполнения, необходимых для решения синтезированных задач. Эксперименты на Terminal-Bench демонстрируют эффективность SkillSynth. Более того, экземпляры задач, синтезированные SkillSynth, были использованы для обучения Hy3 Preview, что способствовало расширению его агентских возможностей в терминальных средах.

English

Terminal agents have demonstrated strong potential for autonomous command-line execution, yet their training remains constrained by the scarcity of high-quality and diverse execution trajectories. Existing approaches mitigate this bottleneck by synthesizing large-scale terminal task instances for trajectory sampling. However, they primarily focus on scaling the number of tasks while providing limited control over the diversity of execution trajectories that agents actually experience during training. In this paper, we present SkillSynth, an automated framework for terminal task synthesis built on a scenario-mediated skill graph. SkillSynth first constructs a large-scale skill graph, where scenarios serve as intermediate transition nodes that connect diverse command-line skills. It then samples paths from this graph as abstractions of real-world workflows, and uses a multi-agent harness to instantiate them into executable task instances. By grounding task synthesis in graph-sampled workflow paths, SkillSynth explicitly controls the diversity of minimal execution trajectories required to solve the synthesized tasks. Experiments on Terminal-Bench demonstrate the effectiveness of SkillSynth. Moreover, task instances synthesized by SkillSynth have been adopted to train Hy3 Preview, contributing to its enhanced agentic capabilities in terminal-based settings.

К созданию масштабируемого синтеза терминальных задач с помощью графов навыков

Toward Scalable Terminal Task Synthesis via Skill Graphs

Аннотация

Support