OneRank: Arquitetura de Ranqueamento Nativa do Transformer Unificada para Recomendação Multitarefa

Resumo

A aprendizagem multitarefa (MTL) é essencial em sistemas de recomendação para permitir aprendizado complementar entre diversos *feedbacks* de usuários. Embora as práticas industriais modernas tenham migrado de DNNs para arquiteturas centradas em *Transformers* para fortalecer a modelagem sequencial e a capacidade de escalabilidade, elas ainda separam a codificação de características da predição multitarefa, tratando o *Transformer* como um codificador independente de tarefa. Esse projeto limita fundamentalmente o desempenho e a escalabilidade ao (1) criar um gargalo de informação sob objetivos de tarefa heterogêneos, (2) induzir interferência de gradiente que leva ao fenômeno de gangorra, e (3) forçar uma transição de fluxo de dados na qual a aprendizagem adaptativa de representações baseada em atenção é convertida em predição estática *feed-forward* de tarefas, com dinâmicas incompatíveis de leitura e escrita de informações. Propomos o OneRank, uma estrutura de ranqueamento multitarefa nativa de *Transformers* que elimina a separação entre codificador e preditor, introduzindo canais privados de tarefa para aprendizado de representação direta (*forward*) e otimização reversa (*backward*), permitindo aprendizado especializado por tarefa enquanto reduz a interferência entre tarefas. No passe direto, o OneRank aprende representações específicas de tarefa de baixo para cima por meio de seleção de informação condicionada à tarefa, contextualização ciente de candidatos e interação controlada entre tarefas. No passe reverso, o desligamento de gradiente entre tarefas isola as atualizações de parâmetros privados de cada tarefa dos módulos de extração de conhecimento compartilhado, prevenindo transferência negativa. Substituímos ainda os *scorers* MLP estáticos específicos de tarefa por pontuação dinâmica baseada em correspondência para ranqueamento personalizado ciente de contexto. Ao internalizar o raciocínio multitarefa dentro da pilha de *Transformers*, o OneRank estabelece um paradigma arquitetônico unificado e escalável. Experimentos offline e online em conjuntos de dados industriais de grande escala mostram que o OneRank supera significativamente as linhas de base do estado da arte, mantendo eficiência computacional.

English

Multi-task learning (MTL) is essential in recommender systems to enable complementary learning among diverse user feedback. While modern industrial practices have shifted from DNNs to Transformer-centric architectures to strengthen sequence modeling and scaling capacity, they still decouple feature encoding from multi-task prediction, treating the Transformer as a task-agnostic encoder. This design fundamentally limits the performance and scalability by (1) creating an information bottleneck under heterogeneous task objectives, (2) inducing gradient interference that leads to the seesaw phenomenon, and (3) forcing a dataflow transition in which attention-based, context-adaptive representation learning is converted to static feed-forward task prediction with incompatible information read-write dynamics. We propose OneRank, a Transformer-native multi-task ranking framework that eliminates encoder-predictor separation and introduces task-private channels for forward representation learning and backward optimization, enabling task-specialized learning while reducing inter-task interference. In the forward pass, OneRank learns task-specific representations bottom-up through task-conditioned information selection, candidate-aware contextualization, and controlled cross-task interaction. In the backward pass, cross-task gradient detachment isolates task-private parameter updates from shared knowledge extraction modules, preventing negative transfer. We further replace static task-specific MLP scorers with dynamic matching-based scoring for context-aware personalized ranking. By internalizing multi-task reasoning within the Transformer stack, OneRank establishes a unified and scalable architectural paradigm. Offline and online experiments on large-scale industrial datasets show that OneRank significantly outperforms state-of-the-art baselines while maintaining computational efficiency.