ChatPaper.aiChatPaper

Transport Conditionné par la Distribution

Distribution-Conditioned Transport

March 5, 2026
Auteurs: Nic Fishman, Gokul Gowri, Paolo L. B. Fischer, Marinka Zitnik, Omar Abudayyeh, Jonathan Gootenberg
cs.AI

Résumé

L’apprentissage d’un modèle de transport qui associe une distribution source à une distribution cible est un problème classique en apprentissage automatique. Cependant, les applications scientifiques exigent de plus en plus des modèles capables de généraliser à des distributions sources et cibles non observées pendant l’entraînement. Nous présentons le transport conditionné par les distributions (DCT), un cadre qui conditionne les applications de transport sur des représentations apprises des distributions source et cible, permettant ainsi une généralisation à des paires de distributions non vues. DCT permet également un apprentissage semi-supervisé pour les problèmes de prévision distributionnelle : en apprenant à partir de paires de distributions arbitraires, il peut exploiter des distributions observées sous une seule condition pour améliorer la prédiction du transport. DCT est agnostique au mécanisme de transport sous-jacent, prenant en charge des modèles allant de l’appariement de flux aux modèles basés sur des divergences distributionnelles (par exemple, Wasserstein, MMD). Nous démontrons les avantages pratiques de DCT sur des benchmarks synthétiques et quatre applications en biologie : le transfert d’effets de lot en génomique monocellulaire, la prédiction de perturbations à partir de données de cytométrie de masse, l’apprentissage de la dynamique transcriptionnelle clonale dans l’hématopoïèse, et la modélisation de l’évolution des séquences de récepteurs des lymphocytes T.
English
Learning a transport model that maps a source distribution to a target distribution is a canonical problem in machine learning, but scientific applications increasingly require models that can generalize to source and target distributions unseen during training. We introduce distribution-conditioned transport (DCT), a framework that conditions transport maps on learned embeddings of source and target distributions, enabling generalization to unseen distribution pairs. DCT also allows semi-supervised learning for distributional forecasting problems: because it learns from arbitrary distribution pairs, it can leverage distributions observed at only one condition to improve transport prediction. DCT is agnostic to the underlying transport mechanism, supporting models ranging from flow matching to distributional divergence-based models (e.g. Wasserstein, MMD). We demonstrate the practical performance benefits of DCT on synthetic benchmarks and four applications in biology: batch effect transfer in single-cell genomics, perturbation prediction from mass cytometry data, learning clonal transcriptional dynamics in hematopoiesis, and modeling T-cell receptor sequence evolution.
PDF22March 9, 2026