ChatPaper.aiChatPaper

RecGPT-V2 技術報告書

RecGPT-V2 Technical Report

December 16, 2025
著者: Chao Yi, Dian Chen, Gaoyang Guo, Jiakai Tang, Jian Wu, Jing Yu, Mao Zhang, Wen Chen, Wenjun Yang, Yujie Luo, Yuning Jiang, Zhujin Gao, Bo Zheng, Binbin Cao, Changfa Wu, Dixuan Wang, Han Wu, Haoyi Hu, Kewei Zhu, Lang Tian, Lin Yang, Qiqi Huang, Siqi Yang, Wenbo Su, Xiaoxiao He, Xin Tong, Xu Chen, Xunke Xi, Xiaowei Huang, Yaxuan Wu, Yeqiu Yang, Yi Hu, Yujin Yuan, Yuliang Yan, Zile Zhou
cs.AI

要旨

大規模言語モデル(LLM)は、推薦システムを暗黙的な行動パターンマッチングから明示的な意図推論へと転換する顕著な可能性を示している。RecGPT-V1はLLMベースの推論をユーザー興味マイニングとアイテムタグ予測に統合することでこのパラダイムを先駆的に実現したが、以下の4つの根本的課題を抱えている:(1)複数の推論経路にわたる計算非効率性と認知的冗長性、(2)固定テンプレート生成における説明の多様性不足、(3)教師あり学習パラダイム下での限定的な一般化能力、(4)人間の基準に適合しない結果偏重評価である。 これらの課題に対処するため、我々は4つの核心的革新を備えたRecGPT-V2を提案する。第一に、階層型マルチエージェントシステムは協調的連携による意図推論を再構築し、認知的重複を排除しながら多様な意図カバレッジを実現する。ユーザー行動コンテキストを圧縮するハイブリッド表現推論と組み合わせることで、GPU消費を60%削減し、排他的再現率を9.39%から10.99%に改善した。第二に、メタプロンプティングフレームワークは文脈適応型プロンプトを動的に生成し、説明の多様性を+7.3%向上させる。第三に、制約付き強化学習は多報酬衝突を緩和し、タグ予測で+24.1%、説明受容性で+13.0%の改善を達成する。第四に、エージェント・アズ・ア・ジャッジフレームワークは評価を多段階推論に分解し、人間の選好整合性を向上させる。淘宝網でのオンラインA/Bテストでは、CTR+2.98%、IPV+3.71%、TV+2.19%、NER+11.46%の有意な改善を実証した。RecGPT-V2は、認知探索と産業応用の間の隔たりを埋め、LLM駆動の意図推論を大規模展開する技術的実現性と商業的実行可能性を同時に確立するものである。
English
Large language models (LLMs) have demonstrated remarkable potential in transforming recommender systems from implicit behavioral pattern matching to explicit intent reasoning. While RecGPT-V1 successfully pioneered this paradigm by integrating LLM-based reasoning into user interest mining and item tag prediction, it suffers from four fundamental limitations: (1) computational inefficiency and cognitive redundancy across multiple reasoning routes; (2) insufficient explanation diversity in fixed-template generation; (3) limited generalization under supervised learning paradigms; and (4) simplistic outcome-focused evaluation that fails to match human standards. To address these challenges, we present RecGPT-V2 with four key innovations. First, a Hierarchical Multi-Agent System restructures intent reasoning through coordinated collaboration, eliminating cognitive duplication while enabling diverse intent coverage. Combined with Hybrid Representation Inference that compresses user-behavior contexts, our framework reduces GPU consumption by 60% and improves exclusive recall from 9.39% to 10.99%. Second, a Meta-Prompting framework dynamically generates contextually adaptive prompts, improving explanation diversity by +7.3%. Third, constrained reinforcement learning mitigates multi-reward conflicts, achieving +24.1% improvement in tag prediction and +13.0% in explanation acceptance. Fourth, an Agent-as-a-Judge framework decomposes assessment into multi-step reasoning, improving human preference alignment. Online A/B tests on Taobao demonstrate significant improvements: +2.98% CTR, +3.71% IPV, +2.19% TV, and +11.46% NER. RecGPT-V2 establishes both the technical feasibility and commercial viability of deploying LLM-powered intent reasoning at scale, bridging the gap between cognitive exploration and industrial utility.
PDF161December 18, 2025