언어 서버 CLI, 프로세스 보상을 통해 언어 에이전트 강화
Language Server CLI Empowers Language Agents with Process Rewards
October 27, 2025
저자: Yifan Zhang, Lanser Contributors
cs.AI
초록
대규모 언어 모델은 API를 빈번히 환각(hallucinate)하고 편집 위치를 잘못 파악하는 반면, 언어 서버는 실제 코드에 대한 검증된 IDE 수준의 정보를 계산합니다. 본 논문에서는 코딩 에이전트와 CI를 위해 Language Server Protocol(LSP) 서버를 고정하고 중재하는 CLI-우선 오케스트레이션 계층인 Lanser-CLI를 제안합니다. 이는 결정론적이고 재현 가능한 워크플로우를 제공합니다. 우리의 입장은 언어 서버가 구조적 정보(정의, 참조, 타입, 진단 정보)뿐만 아니라 실행 가능한 프로세스 보상, 즉 에이전트의 계획 루프를 프로그램 현실과 일치시키는 기계 검증된 단계별 신호를 제공한다는 것입니다. 본 연구에서 Lanser-CLI는 다음을 기여합니다: (i) 취약한 "파일:행:열" 방식을 넘어 심볼릭, AST 경로, 콘텐츠 기반 선택자를 지원하는 Selector DSL과 체계적인 재위치 알고리즘을 통한 강력한 주소 지정 방식; (ii) 언어 서버 응답을 정규화하고 환경/기능 메타데이터를 안정적인 콘텐츠 해시와 함께 캡처하는 결정론적 분석 번들; (iii) 미리보기, 작업공간 격리, Git 인식 트랜잭션 적용을 포함하는 변형 작업(이름 변경, 코드 액션)을 위한 안전 장치; (iv) 언어 서버 정보(진단 정보 델타, 명확성 신뢰도, 안전 적용 검사)로부터 도출되며 온라인으로 계산 가능하고 오프라인에서 재현 가능한 프로세스 보상 함수입니다. 우리는 고정된 스냅샷 하에서의 결정론을 형식화하고 프로세스 보상에 대한 단조성 특성을 확립하여 프로세스 감독 및 반사실 분석에 적합하게 만듭니다. 프로젝트 페이지: https://github.com/yifanzhang-pro/lanser-cli
English
Large language models routinely hallucinate APIs and mislocalize edits, while
language servers compute verified, IDE-grade facts about real code. We present
Lanser-CLI, a CLI-first orchestration layer that pins and mediates a Language
Server Protocol (LSP) server for coding agents and CI, exposing deterministic,
replayable workflows. Our position is that language servers provide not only
structural information (definitions, references, types, diagnostics) but also
an actionable process reward: machine-checked, step-wise signals that align an
agent's planning loop with program reality. In this work, Lanser-CLI
contributes: (i) a robust addressing scheme beyond brittle "file:line:col" via
a Selector DSL (symbolic, AST-path, and content-anchored selectors) with a
principled relocation algorithm; (ii) deterministic Analysis Bundles that
normalize Language Server responses and capture environment/capability metadata
with stable content hashes; (iii) a safety envelope for mutating operations
(rename, code actions) with preview, workspace jails, and Git-aware,
transactional apply; and (iv) a process-reward functional derived from Language
Server facts (diagnostic deltas, disambiguation confidence, and safe-apply
checks) that is computable online and replayable offline. We formalize
determinism under frozen snapshots and establish a monotonicity property for
the process reward, making it suitable for process supervision and
counterfactual analysis. Project Page:
https://github.com/yifanzhang-pro/lanser-cli