HarnessBridge: Обучаемый двунаправленный контроллер для оснастки LLM-агента

Аннотация

Большие языковые модели всё чаще развёртываются в качестве агентов для долгосрочных задач, однако их производительность определяется не только возможностями модели и проектированием среды, но и интерфейсом взаимодействия (обвязкой), опосредующим взаимодействие между агентом и средой. Существующие обвязки в значительной степени разрабатываются вручную, что затрудняет их масштабирование по мере удлинения траекторий и усложнения взаимодействий. В данной работе мы ставим вопрос о том, может ли обвязка быть порождена обучаемым подключаемым модулем, который можно тренировать сквозным образом. Мы представляем HarnessBridge — лёгкий обучаемый контроллер обвязки, параметризующий интерфейс агент–среда в виде двунаправленной проекции. HarnessBridge изучает две двунаправленные проекции: проекцию наблюдений, которая дистиллирует сырые траектории в компактные, релевантные для принятия решений состояния, и проекцию действий, которая преобразует предложенные действия в выполнимые переходы или отклонения, обоснованные траекторией. Мы обучаем HarnessBridge на наборе данных супервизии обвязки с помощью унифицированной настройки на основе инструкций. На Terminal-Bench~2.0 и SWE-bench Verified HarnessBridge достигает или превосходит сильные специализированные обвязки, одновременно существенно снижая потребление токенов и длину траектории, и обобщается от меньших генераторов к более крупным коммерческим моделям.

English

Large language models are increasingly deployed as agents for long-horizon tasks, yet their performance is shaped not only by model capability and environment design, but also by the harness that mediates agent--environment interaction. Existing harnesses are largely manually engineered, making them difficult to scale as trajectories grow longer and interactions become more complex. In this work, we ask whether harness can be generated by a learnable plug-in module that can be trained in an end-to-end fashion. We introduce HarnessBridge, a lightweight learnable harness controller that parameterizes the agent--environment interface as a bidirectional projection. HarnessBridge learns two bidirectional projections: observation projection, which distills raw trajectories into compact, decision-relevant states, and action projection, which converts proposed actions into executable transitions or trajectory-grounded rejections. We train HarnessBridge on a harness supervision dataset via unified instruction tuning. On Terminal-Bench~2.0 and SWE-bench Verified, HarnessBridge matches or surpasses strong specialized harnesses while substantially reducing token usage and trajectory length, and generalizes from smaller generators to larger commercial models.