마이크로버스: 미시 세계 시뮬레이션을 위한 예비 탐구
MicroVerse: A Preliminary Exploration Toward a Micro-World Simulation
February 28, 2026
저자: Rongsheng Wang, Minghao Wu, Hongru Zhou, Zhihan Yu, Zhenyang Cai, Junying Chen, Benyou Wang
cs.AI
초록
최근 비디오 생성 기술의 발전으로 복잡한 동적 시스템의 거시적 시뮬레이션에 새로운 가능성이 열렸지만, 미시적 현상에 대한 적용은 여전히 크게 탐구되지 않고 있습니다. 미시 규모 시뮬레이션은 약물 발견, 오가노나칩 시스템, 질병 메커니즘 연구와 같은 생의학적 응용분야에서 큰 잠재력을 보여주며, 교육 및 대화형 시각화 분야에서도 가능성을 보입니다. 본 연구에서는 미시 규모 시뮬레이션 과제를 위한 다단계 루브릭 기반 벤치마크인 MicroWorldBench를 소개합니다. MicroWorldBench는 여러 미시 규모 시뮬레이션 과제(예: 장기 수준 과정, 세포 역학, 세포 내 분자 상호작용)와 평가 차원(예: 과학적 정확도, 시각적 품질, 지시사항 준수)에 걸친 459개의 전문가 주석 기준을 통해 체계적인 루브릭 기반 평가를 가능하게 합니다. MicroWorldBench를 통해 현재 최첨단(SOTA) 비디오 생성 모델들이 미시 규모 시뮬레이션에서 물리 법칙 위반, 시간적 불일치, 전문가 기준과의 부적합 등으로 실패한다는 점이 밝혀졌습니다. 이러한 한계를 해결하기 위해 저희는 고품질의 전문가 검증 시뮬레이션 데이터셋인 MicroSim-10K를 구축했습니다. 이 데이터셋을 활용하여 미시 규모 시뮬레이션에 특화된 비디오 생성 모델인 MicroVerse를 학습시켰습니다. MicroVerse는 복잡한 미시 규모 메커니즘을 정확하게 재현할 수 있습니다. 본 연구는 '마이크로 월드 시뮬레이션' 개념을 최초로 도입하고 개념 증명을 제시하며, 생물학, 교육, 과학 시각화 분야의 응용을 위한 길을 열었습니다. 본 연구는 생물학적 메커니즘에 대한 교육용 미시 규모 시뮬레이션의 잠재력을 입증합니다. 저희 데이터와 코드는 https://github.com/FreedomIntelligence/MicroVerse 에서 공개되어 있습니다.
English
Recent advances in video generation have opened new avenues for macroscopic simulation of complex dynamic systems, but their application to microscopic phenomena remains largely unexplored. Microscale simulation holds great promise for biomedical applications such as drug discovery, organ-on-chip systems, and disease mechanism studies, while also showing potential in education and interactive visualization. In this work, we introduce MicroWorldBench, a multi-level rubric-based benchmark for microscale simulation tasks. MicroWorldBench enables systematic, rubric-based evaluation through 459 unique expert-annotated criteria spanning multiple microscale simulation task (e.g., organ-level processes, cellular dynamics, and subcellular molecular interactions) and evaluation dimensions (e.g., scientific fidelity, visual quality, instruction following). MicroWorldBench reveals that current SOTA video generation models fail in microscale simulation, showing violations of physical laws, temporal inconsistency, and misalignment with expert criteria. To address these limitations, we construct MicroSim-10K, a high-quality, expert-verified simulation dataset. Leveraging this dataset, we train MicroVerse, a video generation model tailored for microscale simulation. MicroVerse can accurately reproduce complex microscale mechanism. Our work first introduce the concept of Micro-World Simulation and present a proof of concept, paving the way for applications in biology, education, and scientific visualization. Our work demonstrates the potential of educational microscale simulations of biological mechanisms. Our data and code are publicly available at https://github.com/FreedomIntelligence/MicroVerse