ChatPaper.aiChatPaper

인턴에이전트-1.5: 장기적 자율 과학 탐사를 위한 통합 에이전트 프레임워크

InternAgent-1.5: A Unified Agentic Framework for Long-Horizon Autonomous Scientific Discovery

February 9, 2026
저자: Shiyang Feng, Runmin Ma, Xiangchao Yan, Yue Fan, Yusong Hu, Songtao Huang, Shuaiyu Zhang, Zongsheng Cao, Tianshuo Peng, Jiakang Yuan, Zijie Guo, Zhijie Zhong, Shangheng Du, Weida Wang, Jinxin Shi, Yuhao Zhou, Xiaohan He, Zhiyin Yu, Fangchen Yu, Qihao Zheng, Jiamin Wu, Mianxin Liu, Chi Zhang, Shaowei Hou, Shuya Li, Yankai Jiang, Wenjie Lou, Lilong Wang, Zifu Wang, Jiong Wang, Wanghan Xu, Yue Deng, Dongrui Liu, Yiheng Wang, Wenlong Zhang, Fenghua Ling, Shufei Zhang, Xiaosong Wang, Shuangjia Zheng, Xun Huang, Siqi Sun, Shuyue Hu, Peng Ye, Chunfeng Song, Bin Wang, Conghui He, Yihao Liu, Xin Li, Qibin Hou, Tao Chen, Xiangyu Yue, Bin Wang, Liang He, Dahua Lin, Bowen Zhou, Bo Zhang, Lei Bai
cs.AI

초록

우리는 계산 및 실증 영역을 아우르는 종단간 과학적 발견을 위해 설계된 통합 시스템인 InternAgent-1.5를 소개한다. 본 시스템은 생성, 검증, 진화를 담당하는 세 개의 조율된 하위 시스템으로 구성된 구조화된 아키텍처를 기반으로 한다. 이러한 하위 시스템은 심층 연구, 솔루션 최적화, 장기 기억이라는 기초 역량에 의해 지원된다. 해당 아키텍처는 InternAgent-1.5가 일관되고 개선되는 동작을 유지하면서 확장된 발견 주기 동안 지속적으로 운영될 수 있도록 한다. 또한 단일 통합 시스템 내에서 계산 모델링과 실험실 실험을 조율할 수 있게 해준다. 우리는 GAIA, HLE, GPQA, FrontierScience와 같은 과학적 추론 벤치마크에서 InternAgent-1.5를 평가했으며,该系统은 강력한 기초 역량을 입증하는 선도적인 성능을 달성했다. 이러한 벤치마크를 넘어 우리는 두 가지 범주의 발견 과제를 추가로 평가한다. 알고리즘 발견 과제에서는 InternAgent-1.5가 핵심 기계 학습 문제에 대한 경쟁력 있는 방법을 자율적으로 설계한다. 실증 발견 과제에서는 지구과학, 생명과학, 생물학, 물리학 영역에서 완전한 계산 또는 웻 랩 실험을 실행하고 과학적 발견을 생성한다. 전반적으로 이러한 결과는 InternAgent-1.5가 자율 과학 발견을 위한 일반적이고 확장 가능한 프레임워크를 제공함을 보여준다.
English
We introduce InternAgent-1.5, a unified system designed for end-to-end scientific discovery across computational and empirical domains. The system is built on a structured architecture composed of three coordinated subsystems for generation, verification, and evolution. These subsystems are supported by foundational capabilities for deep research, solution optimization, and long horizon memory. The architecture allows InternAgent-1.5 to operate continuously across extended discovery cycles while maintaining coherent and improving behavior. It also enables the system to coordinate computational modeling and laboratory experimentation within a single unified system. We evaluate InternAgent-1.5 on scientific reasoning benchmarks such as GAIA, HLE, GPQA, and FrontierScience, and the system achieves leading performance that demonstrates strong foundational capabilities. Beyond these benchmarks, we further assess two categories of discovery tasks. In algorithm discovery tasks, InternAgent-1.5 autonomously designs competitive methods for core machine learning problems. In empirical discovery tasks, it executes complete computational or wet lab experiments and produces scientific findings in earth, life, biological, and physical domains. Overall, these results show that InternAgent-1.5 provides a general and scalable framework for autonomous scientific discovery.
PDF593February 11, 2026