Meta Flow Matching: Integración de Campos Vectoriales en la Variedad de Wasserstein

Resumen

Numerosos procesos biológicos y físicos pueden modelarse como sistemas de entidades interactuantes que evolucionan continuamente en el tiempo, por ejemplo, la dinámica de células en comunicación o partículas físicas. Aprender la dinámica de tales sistemas es esencial para predecir la evolución temporal de poblaciones en muestras novedosas y entornos no vistos. Los modelos basados en flujo permiten aprender estas dinámicas a nivel poblacional: modelan la evolución de la distribución completa de muestras. Sin embargo, los modelos basados en flujo actuales están limitados a una única población inicial y un conjunto de condiciones predefinidas que describen diferentes dinámicas. Argumentamos que múltiples procesos en las ciencias naturales deben representarse como campos vectoriales en la variedad de Wasserstein de densidades de probabilidad. Es decir, el cambio de la población en cualquier momento depende de la población misma debido a las interacciones entre las muestras. En particular, esto es crucial para la medicina personalizada, donde el desarrollo de enfermedades y su respectiva respuesta al tratamiento dependen del microentorno de células específico de cada paciente. Proponemos Meta Flow Matching (MFM), un enfoque práctico para integrar a lo largo de estos campos vectoriales en la variedad de Wasserstein mediante la amortización del modelo de flujo sobre las poblaciones iniciales. Específicamente, incrustamos la población de muestras utilizando una Red Neuronal de Grafos (GNN) y usamos estas incrustaciones para entrenar un modelo de Flow Matching. Esto otorga a MFM la capacidad de generalizar sobre las distribuciones iniciales, a diferencia de métodos propuestos previamente. Demostramos la capacidad de MFM para mejorar la predicción de respuestas individuales al tratamiento en un conjunto de datos a gran escala de cribado de fármacos a nivel de célula única en múltiples pacientes.

English

Numerous biological and physical processes can be modeled as systems of interacting entities evolving continuously over time, e.g. the dynamics of communicating cells or physical particles. Learning the dynamics of such systems is essential for predicting the temporal evolution of populations across novel samples and unseen environments. Flow-based models allow for learning these dynamics at the population level - they model the evolution of the entire distribution of samples. However, current flow-based models are limited to a single initial population and a set of predefined conditions which describe different dynamics. We argue that multiple processes in natural sciences have to be represented as vector fields on the Wasserstein manifold of probability densities. That is, the change of the population at any moment in time depends on the population itself due to the interactions between samples. In particular, this is crucial for personalized medicine where the development of diseases and their respective treatment response depends on the microenvironment of cells specific to each patient. We propose Meta Flow Matching (MFM), a practical approach to integrating along these vector fields on the Wasserstein manifold by amortizing the flow model over the initial populations. Namely, we embed the population of samples using a Graph Neural Network (GNN) and use these embeddings to train a Flow Matching model. This gives MFM the ability to generalize over the initial distributions unlike previously proposed methods. We demonstrate the ability of MFM to improve prediction of individual treatment responses on a large scale multi-patient single-cell drug screen dataset.

Meta Flow Matching: Integración de Campos Vectoriales en la Variedad de Wasserstein

Meta Flow Matching: Integrating Vector Fields on the Wasserstein Manifold

Resumen

Support