ChatPaper.aiChatPaper

HarnessBridge: LLMエージェントハーネスのための学習可能な双方向コントローラ

HarnessBridge: Learnable Bidirectional Controller for LLM Agent Harness

June 11, 2026
著者: Xiaoxuan Wang, Haixin Wang, Alexander Taylor, Jason Cong, Yizhou Sun, Wei Wang
cs.AI

要旨

大規模言語モデルは、長期的なタスクを遂行するエージェントとしてますます展開されている。しかし、その性能はモデルの能力や環境設計だけでなく、エージェントと環境の相互作用を仲介するハーネスによっても形作られる。既存のハーネスは主に手動で設計されているため、軌跡が長くなり相互作用が複雑になるにつれて、スケールが困難になる。本研究では、エンドツーエンドで学習可能なプラグインモジュールによってハーネスを生成できるかどうかを問う。我々は、HarnessBridgeを提案する。これは、エージェントと環境のインタフェースを双方向射影としてパラメータ化する、軽量な学習可能ハーネスコントローラである。HarnessBridgeは、二つの双方向射影を学習する。観測射影は、生の軌跡をコンパクトで意思決定に関連する状態に蒸留し、行動射影は、提案された行動を実行可能な遷移または軌跡に基づく拒否に変換する。我々は、HarnessBridgeを統一命令チューニングにより、ハーネス監視データセットで訓練する。Terminal-Bench~2.0およびSWE-bench Verifiedにおいて、HarnessBridgeは強力な専用ハーネスと同等またはそれ以上の性能を達成しつつ、トークン使用量と軌跡の長さを大幅に削減し、小規模な生成モデルから大規模な商用モデルに一般化する。
English
Large language models are increasingly deployed as agents for long-horizon tasks, yet their performance is shaped not only by model capability and environment design, but also by the harness that mediates agent--environment interaction. Existing harnesses are largely manually engineered, making them difficult to scale as trajectories grow longer and interactions become more complex. In this work, we ask whether harness can be generated by a learnable plug-in module that can be trained in an end-to-end fashion. We introduce HarnessBridge, a lightweight learnable harness controller that parameterizes the agent--environment interface as a bidirectional projection. HarnessBridge learns two bidirectional projections: observation projection, which distills raw trajectories into compact, decision-relevant states, and action projection, which converts proposed actions into executable transitions or trajectory-grounded rejections. We train HarnessBridge on a harness supervision dataset via unified instruction tuning. On Terminal-Bench~2.0 and SWE-bench Verified, HarnessBridge matches or surpasses strong specialized harnesses while substantially reducing token usage and trajectory length, and generalizes from smaller generators to larger commercial models.