CauScale: Нейросетевой причинный анализ в больших масштабах
CauScale: Neural Causal Discovery at Scale
February 9, 2026
Авторы: Bo Peng, Sirui Chen, Jiaguo Tian, Yu Qiao, Chaochao Lu
cs.AI
Аннотация
Установление причинно-следственных связей (causal discovery) является ключевым для развития основанных на данных областей, таких как научный ИИ и анализ данных, однако существующие подходы сталкиваются со значительными проблемами временной и пространственной эффективности при масштабировании на большие графы. Для решения этой задачи мы представляем CauScale — нейросетевую архитектуру, разработанную для эффективного установления причинно-следственных связей, которая масштабирует вывод на графы размером до 1000 узлов. CauScale повышает временную эффективность за счёт блока редукции, сжимающего эмбеддинги данных, и улучшает пространственную эффективность за счёт использования связанных весов внимания, что позволяет избежать хранения отдельных карт внимания для осей. Для сохранения высокой точности установления причинно-следственных связей CauScale использует двухпоточную архитектуру: поток данных извлекает реляционные признаки из многомерных наблюдений, а поток графов интегрирует статистические априорные знания о графах и сохраняет ключевые структурные сигналы. CauScale успешно масштабируется на графы с 500 узлами в процессе обучения, где предыдущие методы терпят неудачу из-за ограничений памяти. На тестовых данных с различными масштабами графов и причинными механизмами CauScale достигает 99,6% mAP на данных из того же распределения и 84,4% на данных из другого распределения, обеспечивая при этом ускорение вывода в 4–13 000 раз по сравнению с предыдущими методами. Страница проекта находится по адресу https://github.com/OpenCausaLab/CauScale.
English
Causal discovery is essential for advancing data-driven fields such as scientific AI and data analysis, yet existing approaches face significant time- and space-efficiency bottlenecks when scaling to large graphs. To address this challenge, we present CauScale, a neural architecture designed for efficient causal discovery that scales inference to graphs with up to 1000 nodes. CauScale improves time efficiency via a reduction unit that compresses data embeddings and improves space efficiency by adopting tied attention weights to avoid maintaining axis-specific attention maps. To keep high causal discovery accuracy, CauScale adopts a two-stream design: a data stream extracts relational evidence from high-dimensional observations, while a graph stream integrates statistical graph priors and preserves key structural signals. CauScale successfully scales to 500-node graphs during training, where prior work fails due to space limitations. Across testing data with varying graph scales and causal mechanisms, CauScale achieves 99.6% mAP on in-distribution data and 84.4% on out-of-distribution data, while delivering 4-13,000 times inference speedups over prior methods. Our project page is at https://github.com/OpenCausaLab/CauScale.