ChatPaper.aiChatPaper

ML 의사결정 해석: 대규모 순위 시스템을 위한 행위주체적 추론 프레임워크

Decoding ML Decision: An Agentic Reasoning Framework for Large-Scale Ranking System

February 20, 2026
저자: Longfei Yun, Yihan Wu, Haoran Liu, Xiaoxuan Liu, Ziyun Xu, Yi Wang, Yang Xia, Pengfei Wang, Mingze Gao, Yunxiang Wang, Changfan Chen, Junfeng Pan
cs.AI

초록

현대 대규모 순위 시스템은 경쟁적 목표, 운영상 제약, 진화하는 제품 요구사항이 복잡하게 얽힌 환경에서 운영됩니다. 이 분야의 발전은 모델링 기술 자체보다는 모호한 제품 의도를 합리적이고 실행 가능하며 검증 가능한 가설로 전환하는 어려운 과정인 엔지니어링 맥락 제약에 의해 점차 병목 현상을 겪고 있습니다. 본 논문은 순위 최적화를 프로그램 가능한 실험 환경 내 자율적 발견 과정으로 재정의하는 프레임워크인 GEARS(Generative Engine for Agentic Ranking Systems)를 제안합니다. GEARS는 최적화를 정적 모델 선택으로 취급하기보다, 특화 에이전트 기술을 활용하여 순위 전문가 지식을 재사용 가능한 추론 능력으로 캡슐화함으로써 운영자가 높은 수준의 의도 기반 개인화를 통해 시스템을 조종할 수 있도록 합니다. 더 나아가 프로덕션 신뢰성을 보장하기 위해 본 프레임워크는 통계적 강건성을 강제하고 단기 신호에 과적합된 취약한 정책을 걸러내기 위한 검증 후크를 통합합니다. 다양한 제품 인터페이스에서의 실험적 검증을 통해 GEARS가 엄격한 배포 안정성을 유지하면서 알고리즘 신호와 심층 순위 맥락을 시너지적으로 결합하여 우수하고 근사 파레토 효율적인 정책을 지속적으로 발견함을 입증했습니다.
English
Modern large-scale ranking systems operate within a sophisticated landscape of competing objectives, operational constraints, and evolving product requirements. Progress in this domain is increasingly bottlenecked by the engineering context constraint: the arduous process of translating ambiguous product intent into reasonable, executable, verifiable hypotheses, rather than by modeling techniques alone. We present GEARS (Generative Engine for Agentic Ranking Systems), a framework that reframes ranking optimization as an autonomous discovery process within a programmable experimentation environment. Rather than treating optimization as static model selection, GEARS leverages Specialized Agent Skills to encapsulate ranking expert knowledge into reusable reasoning capabilities, enabling operators to steer systems via high-level intent vibe personalization. Furthermore, to ensure production reliability, the framework incorporates validation hooks to enforce statistical robustness and filter out brittle policies that overfit short-term signals. Experimental validation across diverse product surfaces demonstrates that GEARS consistently identifies superior, near-Pareto-efficient policies by synergizing algorithmic signals with deep ranking context while maintaining rigorous deployment stability.
PDF11February 25, 2026