ChatPaper.aiChatPaper

InternAgent-1.5: 長期的自律的科学発見のための統合エージェントフレームワーク

InternAgent-1.5: A Unified Agentic Framework for Long-Horizon Autonomous Scientific Discovery

February 9, 2026
著者: Shiyang Feng, Runmin Ma, Xiangchao Yan, Yue Fan, Yusong Hu, Songtao Huang, Shuaiyu Zhang, Zongsheng Cao, Tianshuo Peng, Jiakang Yuan, Zijie Guo, Zhijie Zhong, Shangheng Du, Weida Wang, Jinxin Shi, Yuhao Zhou, Xiaohan He, Zhiyin Yu, Fangchen Yu, Qihao Zheng, Jiamin Wu, Mianxin Liu, Chi Zhang, Shaowei Hou, Shuya Li, Yankai Jiang, Wenjie Lou, Lilong Wang, Zifu Wang, Jiong Wang, Wanghan Xu, Yue Deng, Dongrui Liu, Yiheng Wang, Wenlong Zhang, Fenghua Ling, Shufei Zhang, Xiaosong Wang, Shuangjia Zheng, Xun Huang, Siqi Sun, Shuyue Hu, Peng Ye, Chunfeng Song, Bin Wang, Conghui He, Yihao Liu, Xin Li, Qibin Hou, Tao Chen, Xiangyu Yue, Bin Wang, Liang He, Dahua Lin, Bowen Zhou, Bo Zhang, Lei Bai
cs.AI

要旨

本論文では、計算科学と実証科学の領域を横断するエンドツーエンドの科学的発見を目的とした統合システム、InternAgent-1.5を提案する。本システムは、生成、検証、進化の3つの調整されたサブシステムから構成される構造化アーキテクチャに基づいて構築されている。これらのサブシステムは、深層リサーチ、ソリューション最適化、長期記憶といった基盤能力によって支えられている。このアーキテクチャにより、InternAgent-1.5は、一貫性を保ちながら行動を改善しつつ、長期にわたる発見サイクルを通じて継続的に動作することが可能となる。また、単一の統合システム内で計算モデリングと実験室での実験を調整することも可能にする。我々は、GAIA、HLE、GPQA、FrontierScienceなどの科学的推論ベンチマークでInternAgent-1.5を評価し、本システムが強力な基盤能力を示す最高水準のパフォーマンスを達成することを確認した。これらのベンチマークを超えて、さらに2種類の発見タスクを評価した。アルゴリズム発見タスクでは、InternAgent-1.5は核心的な機械学習問題に対して競争力のある手法を自律的に設計した。実証的な発見タスクでは、地球科学、生命科学、生物学、物理学の領域において、完全な計算実験またはウェットラボ実験を実行し、科学的知見を産出した。全体として、これらの結果は、InternAgent-1.5が自律的科学発見のための汎用的かつスケーラブルなフレームワークを提供することを示している。
English
We introduce InternAgent-1.5, a unified system designed for end-to-end scientific discovery across computational and empirical domains. The system is built on a structured architecture composed of three coordinated subsystems for generation, verification, and evolution. These subsystems are supported by foundational capabilities for deep research, solution optimization, and long horizon memory. The architecture allows InternAgent-1.5 to operate continuously across extended discovery cycles while maintaining coherent and improving behavior. It also enables the system to coordinate computational modeling and laboratory experimentation within a single unified system. We evaluate InternAgent-1.5 on scientific reasoning benchmarks such as GAIA, HLE, GPQA, and FrontierScience, and the system achieves leading performance that demonstrates strong foundational capabilities. Beyond these benchmarks, we further assess two categories of discovery tasks. In algorithm discovery tasks, InternAgent-1.5 autonomously designs competitive methods for core machine learning problems. In empirical discovery tasks, it executes complete computational or wet lab experiments and produces scientific findings in earth, life, biological, and physical domains. Overall, these results show that InternAgent-1.5 provides a general and scalable framework for autonomous scientific discovery.
PDF593February 11, 2026