ChatPaper.aiChatPaper

OnePiece: Integrazione di Ingegneria del Contesto e Ragionamento nei Sistemi Industriali di Classificazione a Cascata

OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System

September 22, 2025
Autori: Sunhao Dai, Jiakai Tang, Jiahua Wu, Kun Wang, Yuxuan Zhu, Bingjun Chen, Bangyang Hong, Yu Zhao, Cong Fu, Kangle Wu, Yabo Ni, Anxiang Zeng, Wenjie Wang, Xu Chen, Jun Xu, See-Kiong Ng
cs.AI

Abstract

Nonostante il crescente interesse nel replicare il successo scalabile dei grandi modelli linguistici (LLM) nei sistemi di ricerca e raccomandazione industriali, la maggior parte degli sforzi industriali esistenti rimane limitata al trapianto delle architetture Transformer, che portano solo miglioramenti incrementali rispetto ai robusti Modelli di Raccomandazione con Apprendimento Profondo (DLRM). Da una prospettiva di principi primi, le svolte degli LLM derivano non solo dalle loro architetture, ma anche da due meccanismi complementari: l'ingegneria del contesto, che arricchisce le query di input grezze con segnali contestuali per sfruttare meglio le capacità del modello, e il ragionamento multi-step, che affina iterativamente gli output del modello attraverso percorsi di ragionamento intermedi. Tuttavia, questi due meccanismi e il loro potenziale di sbloccare miglioramenti sostanziali rimangono in gran parte inesplorati nei sistemi di ranking industriali. In questo articolo, proponiamo OnePiece, un framework unificato che integra in modo fluido l'ingegneria del contesto e il ragionamento in stile LLM sia nei modelli di retrieval che di ranking delle pipeline a cascata industriali. OnePiece è costruito su un'architettura puramente Transformer e introduce tre innovazioni chiave: (1) l'ingegneria del contesto strutturata, che arricchisce la cronologia delle interazioni con segnali di preferenza e scenario e li unisce in una sequenza di input tokenizzata strutturata per sia il retrieval che il ranking; (2) il ragionamento latente a blocchi, che equipaggia il modello con un affinamento multi-step delle rappresentazioni e scala la larghezza di banda del ragionamento attraverso la dimensione del blocco; (3) l'addestramento progressivo multi-task, che sfrutta le catene di feedback degli utenti per supervisionare efficacemente i passi di ragionamento durante l'addestramento. OnePiece è stato implementato nello scenario principale di ricerca personalizzata di Shopee e ottiene guadagni online consistenti su diverse metriche chiave di business, tra cui oltre +2% di GMV/UU e un aumento del +2,90% delle entrate pubblicitarie.
English
Despite the growing interest in replicating the scaled success of large language models (LLMs) in industrial search and recommender systems, most existing industrial efforts remain limited to transplanting Transformer architectures, which bring only incremental improvements over strong Deep Learning Recommendation Models (DLRMs). From a first principle perspective, the breakthroughs of LLMs stem not only from their architectures but also from two complementary mechanisms: context engineering, which enriches raw input queries with contextual cues to better elicit model capabilities, and multi-step reasoning, which iteratively refines model outputs through intermediate reasoning paths. However, these two mechanisms and their potential to unlock substantial improvements remain largely underexplored in industrial ranking systems. In this paper, we propose OnePiece, a unified framework that seamlessly integrates LLM-style context engineering and reasoning into both retrieval and ranking models of industrial cascaded pipelines. OnePiece is built on a pure Transformer backbone and further introduces three key innovations: (1) structured context engineering, which augments interaction history with preference and scenario signals and unifies them into a structured tokenized input sequence for both retrieval and ranking; (2) block-wise latent reasoning, which equips the model with multi-step refinement of representations and scales reasoning bandwidth via block size; (3) progressive multi-task training, which leverages user feedback chains to effectively supervise reasoning steps during training. OnePiece has been deployed in the main personalized search scenario of Shopee and achieves consistent online gains across different key business metrics, including over +2% GMV/UU and a +2.90% increase in advertising revenue.
PDF333September 23, 2025