OnePiece: 산업용 캐스케이드 랭킹 시스템에 컨텍스트 엔지니어링과 추론 기능 도입
OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System
September 22, 2025
저자: Sunhao Dai, Jiakai Tang, Jiahua Wu, Kun Wang, Yuxuan Zhu, Bingjun Chen, Bangyang Hong, Yu Zhao, Cong Fu, Kangle Wu, Yabo Ni, Anxiang Zeng, Wenjie Wang, Xu Chen, Jun Xu, See-Kiong Ng
cs.AI
초록
대규모 언어 모델(LLM)의 성공을 산업 검색 및 추천 시스템에 확장하려는 관심이 증가하고 있음에도 불구하고, 대부분의 기존 산업적 노력은 Transformer 아키텍처를 이식하는 데 그치고 있으며, 이는 강력한 딥러닝 추천 모델(DLRM)에 비해 점진적인 개선만을 가져옵니다. 근본적인 관점에서, LLM의 혁신은 아키텍처뿐만 아니라 두 가지 상호 보완적인 메커니즘에서 비롯됩니다: 첫째, 컨텍스트 엔지니어링은 원시 입력 쿼리를 컨텍스트 단서로 풍부하게 하여 모델의 능력을 더 잘 이끌어내고, 둘째, 다단계 추론은 중간 추론 경로를 통해 모델 출력을 반복적으로 개선합니다. 그러나 이러한 두 메커니즘과 그들이 가져올 수 있는 상당한 개선 가능성은 산업적 랭킹 시스템에서 여전히 크게 탐구되지 않고 있습니다.
이 논문에서 우리는 OnePiece를 제안합니다. OnePiece는 LLM 스타일의 컨텍스트 엔지니어링과 추론을 산업적 캐스케이드 파이프라인의 검색 및 랭킹 모델에 원활하게 통합하는 통합 프레임워크입니다. OnePiece는 순수 Transformer 백본을 기반으로 하며, 세 가지 주요 혁신을 추가로 도입합니다: (1) 구조화된 컨텍스트 엔지니어링은 상호작용 이력에 선호도와 시나리오 신호를 추가하고 이를 구조화된 토큰화된 입력 시퀀스로 통합하여 검색과 랭킹 모두에 활용합니다; (2) 블록 단위 잠재 추론은 모델에 다단계 표현 개선 기능을 제공하고 블록 크기를 통해 추론 대역폭을 확장합니다; (3) 점진적 다중 작업 학습은 사용자 피드백 체인을 활용하여 학습 중 추론 단계를 효과적으로 감독합니다. OnePiece는 Shopee의 주요 개인화 검색 시나리오에 배포되었으며, +2% 이상의 GMV/UU 및 광고 수익 +2.90% 증가를 포함한 다양한 핵심 비즈니스 지표에서 일관된 온라인 성과를 달성했습니다.
English
Despite the growing interest in replicating the scaled success of large
language models (LLMs) in industrial search and recommender systems, most
existing industrial efforts remain limited to transplanting Transformer
architectures, which bring only incremental improvements over strong Deep
Learning Recommendation Models (DLRMs). From a first principle perspective, the
breakthroughs of LLMs stem not only from their architectures but also from two
complementary mechanisms: context engineering, which enriches raw input queries
with contextual cues to better elicit model capabilities, and multi-step
reasoning, which iteratively refines model outputs through intermediate
reasoning paths. However, these two mechanisms and their potential to unlock
substantial improvements remain largely underexplored in industrial ranking
systems.
In this paper, we propose OnePiece, a unified framework that seamlessly
integrates LLM-style context engineering and reasoning into both retrieval and
ranking models of industrial cascaded pipelines. OnePiece is built on a pure
Transformer backbone and further introduces three key innovations: (1)
structured context engineering, which augments interaction history with
preference and scenario signals and unifies them into a structured tokenized
input sequence for both retrieval and ranking; (2) block-wise latent reasoning,
which equips the model with multi-step refinement of representations and scales
reasoning bandwidth via block size; (3) progressive multi-task training, which
leverages user feedback chains to effectively supervise reasoning steps during
training. OnePiece has been deployed in the main personalized search scenario
of Shopee and achieves consistent online gains across different key business
metrics, including over +2% GMV/UU and a +2.90% increase in advertising
revenue.