CauScale: 대규모 신경망 기반 인과 관계 발견
CauScale: Neural Causal Discovery at Scale
February 9, 2026
저자: Bo Peng, Sirui Chen, Jiaguo Tian, Yu Qiao, Chaochao Lu
cs.AI
초록
인과 관계 발견은 과학적 AI 및 데이터 분석과 같은 데이터 중심 분야의 발전에 필수적이지만, 기존 방법론은 대규모 그래프로 확장 시 시간 및 공간 효율성에서 심각한 병목 현상을 겪습니다. 이러한 문제를 해결하기 위해 우리는 최대 1000개 노드까지의 그래프에서 효율적인 인과 관계 추론을 가능하게 하는 신경망 아키텍처인 CauScale을 제안합니다. CauScale은 데이터 임베딩을 압축하는 reduction unit을 통해 시간 효율성을 향상시키고, 축별 어텐션 맵 유지 불필요를 위한 tied attention weight 도입으로 공간 효율성을 개선합니다. 높은 인과 발견 정확도를 유지하기 위해 CauScale은 이중 스트림 설계를 채택합니다: 데이터 스트림은 고차원 관측값에서 관계적 증거를 추출하는 반면, 그래프 스트림은 통계적 그래프 사전 정보를 통합하고 핵심 구조적 신호를 보존합니다. CauScale은 공간 제한으로 인해 기존 연구가 실패한 500개 노드 그래프까지 학습 과정에서 성공적으로 확장되었습니다. 다양한 그래프 규모와 인과 메커니즘을 가진 테스트 데이터에서 CauScale은 내부 분포 데이터에서 99.6%의 mAP, 외부 분포 데이터에서 84.4%의 mAP를 달성하면서 기존 방법 대비 4~13,000배의 추론 속도 향상을 보였습니다. 프로젝트 페이지는 https://github.com/OpenCausaLab/CauScale에서 확인할 수 있습니다.
English
Causal discovery is essential for advancing data-driven fields such as scientific AI and data analysis, yet existing approaches face significant time- and space-efficiency bottlenecks when scaling to large graphs. To address this challenge, we present CauScale, a neural architecture designed for efficient causal discovery that scales inference to graphs with up to 1000 nodes. CauScale improves time efficiency via a reduction unit that compresses data embeddings and improves space efficiency by adopting tied attention weights to avoid maintaining axis-specific attention maps. To keep high causal discovery accuracy, CauScale adopts a two-stream design: a data stream extracts relational evidence from high-dimensional observations, while a graph stream integrates statistical graph priors and preserves key structural signals. CauScale successfully scales to 500-node graphs during training, where prior work fails due to space limitations. Across testing data with varying graph scales and causal mechanisms, CauScale achieves 99.6% mAP on in-distribution data and 84.4% on out-of-distribution data, while delivering 4-13,000 times inference speedups over prior methods. Our project page is at https://github.com/OpenCausaLab/CauScale.