OnePiece: Kontexttechnik und logisches Denken in industrielle Kaskaden-Rankingsysteme integrieren
OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System
September 22, 2025
papers.authors: Sunhao Dai, Jiakai Tang, Jiahua Wu, Kun Wang, Yuxuan Zhu, Bingjun Chen, Bangyang Hong, Yu Zhao, Cong Fu, Kangle Wu, Yabo Ni, Anxiang Zeng, Wenjie Wang, Xu Chen, Jun Xu, See-Kiong Ng
cs.AI
papers.abstract
Trotz des wachsenden Interesses an der Übertragung des skalierbaren Erfolgs großer Sprachmodelle (LLMs) auf industrielle Such- und Empfehlungssysteme, beschränken sich die meisten bestehenden industriellen Bemühungen weitgehend auf die Übernahme von Transformer-Architekturen, die nur inkrementelle Verbesserungen gegenüber leistungsstarken Deep Learning Recommendation Models (DLRMs) bringen. Aus einer grundlegenden Perspektive betrachtet, resultieren die Durchbrüche von LLMs nicht nur aus ihren Architekturen, sondern auch aus zwei komplementären Mechanismen: Kontextengineering, das rohe Eingabeanfragen mit kontextuellen Hinweisen anreichert, um die Fähigkeiten des Modells besser zu aktivieren, und mehrstufiges Reasoning, das die Modellausgaben iterativ durch Zwischenschritte verfeinert. Diese beiden Mechanismen und ihr Potenzial, erhebliche Verbesserungen zu erzielen, bleiben jedoch in industriellen Rankingsystemen weitgehend unerforscht.
In diesem Artikel schlagen wir OnePiece vor, ein einheitliches Framework, das LLM-artiges Kontextengineering und Reasoning nahtlos in sowohl Retrieval- als auch Ranking-Modelle industrieller Kaskadenpipelines integriert. OnePiece basiert auf einer reinen Transformer-Architektur und führt drei wesentliche Innovationen ein: (1) strukturiertes Kontextengineering, das die Interaktionshistorie mit Präferenz- und Szenariosignalen anreichert und sie in eine strukturierte, tokenisierte Eingabesequenz für sowohl Retrieval als auch Ranking vereinheitlicht; (2) blockweises latentes Reasoning, das das Modell mit einer mehrstufigen Verfeinerung von Repräsentationen ausstattet und die Reasoning-Bandbreite über die Blockgröße skaliert; (3) progressives Multi-Task-Training, das Nutzerfeedbackketten nutzt, um die Reasoning-Schritte während des Trainings effektiv zu überwachen. OnePiece wurde im Hauptszenario der personalisierten Suche von Shopee eingesetzt und erzielt konsistente Online-Gewinne über verschiedene wichtige Geschäftskennzahlen hinweg, darunter über +2 % GMV/UU und eine Steigerung der Werbeeinnahmen um +2,90 %.
English
Despite the growing interest in replicating the scaled success of large
language models (LLMs) in industrial search and recommender systems, most
existing industrial efforts remain limited to transplanting Transformer
architectures, which bring only incremental improvements over strong Deep
Learning Recommendation Models (DLRMs). From a first principle perspective, the
breakthroughs of LLMs stem not only from their architectures but also from two
complementary mechanisms: context engineering, which enriches raw input queries
with contextual cues to better elicit model capabilities, and multi-step
reasoning, which iteratively refines model outputs through intermediate
reasoning paths. However, these two mechanisms and their potential to unlock
substantial improvements remain largely underexplored in industrial ranking
systems.
In this paper, we propose OnePiece, a unified framework that seamlessly
integrates LLM-style context engineering and reasoning into both retrieval and
ranking models of industrial cascaded pipelines. OnePiece is built on a pure
Transformer backbone and further introduces three key innovations: (1)
structured context engineering, which augments interaction history with
preference and scenario signals and unifies them into a structured tokenized
input sequence for both retrieval and ranking; (2) block-wise latent reasoning,
which equips the model with multi-step refinement of representations and scales
reasoning bandwidth via block size; (3) progressive multi-task training, which
leverages user feedback chains to effectively supervise reasoning steps during
training. OnePiece has been deployed in the main personalized search scenario
of Shopee and achieves consistent online gains across different key business
metrics, including over +2% GMV/UU and a +2.90% increase in advertising
revenue.