デナリオプロジェクト:科学的発見のための深層知識AIエージェント
The Denario project: Deep knowledge AI agents for scientific discovery
October 30, 2025
著者: Francisco Villaescusa-Navarro, Boris Bolliet, Pablo Villanueva-Domingo, Adrian E. Bayer, Aidan Acquah, Chetana Amancharla, Almog Barzilay-Siegal, Pablo Bermejo, Camille Bilodeau, Pablo Cárdenas Ramírez, Miles Cranmer, Urbano L. França, ChangHoon Hahn, Yan-Fei Jiang, Raul Jimenez, Jun-Young Lee, Antonio Lerario, Osman Mamun, Thomas Meier, Anupam A. Ojha, Pavlos Protopapas, Shimanto Roy, David N. Spergel, Pedro Tarancón-Álvarez, Ujjwal Tiwari, Matteo Viel, Digvijay Wadekar, Chi Wang, Bonny Y. Wang, Licong Xu, Yossi Yovel, Shuwen Yue, Wen-Han Zhou, Qiyao Zhu, Jiajun Zou, Íñigo Zubeldia
cs.AI
要旨
本論文では、科学研究者のアシスタントとして機能するAIマルチエージェントシステム「Denario」を提案する。Denarioは、アイデアの生成、文献調査、研究計画の立案、コードの作成と実行、図表の作成、科学論文の草稿作成と査読など、多様なタスクを遂行できる。本システムはモジュール型アーキテクチャを採用しており、特定のタスク(例:アイデア生成)の実行や、深層研究バックエンドとしてCmbagentを用いたエンドツーエンドの科学分析を可能とする。本研究では、Denarioとその構成モジュールを詳細に説明し、天体物理学、生物学、生物物理学、医用工学、化学、材料科学、数学物理学、医学、神経科学、惑星科学など、多岐にわたる科学分野で生成されたAI作成論文を例示し、その能力を実証する。Denarioはまた、異なる学問領域のアイデアを融合させることにも優れており、量子物理学と機械学習の手法を天体物理データに応用した論文を示すことでこれを例証する。領域専門家によるこれらの論文への評価(数値スコアと査読に似たフィードバック)を報告し、現行システムの強み、弱点、限界を明らかにする。最後に、AI主導型研究の倫理的含意について議論し、このような技術が科学哲学とどのように関わるかを考察する。コードはhttps://github.com/AstroPilot-AI/Denario で公開している。デモはhttps://huggingface.co/spaces/astropilot-ai/Denario でウェブ上直接実行可能であり、フルアプリケーションはクラウドに展開予定である。
English
We present Denario, an AI multi-agent system designed to serve as a
scientific research assistant. Denario can perform many different tasks, such
as generating ideas, checking the literature, developing research plans,
writing and executing code, making plots, and drafting and reviewing a
scientific paper. The system has a modular architecture, allowing it to handle
specific tasks, such as generating an idea, or carrying out end-to-end
scientific analysis using Cmbagent as a deep-research backend. In this work, we
describe in detail Denario and its modules, and illustrate its capabilities by
presenting multiple AI-generated papers generated by it in many different
scientific disciplines such as astrophysics, biology, biophysics, biomedical
informatics, chemistry, material science, mathematical physics, medicine,
neuroscience and planetary science. Denario also excels at combining ideas from
different disciplines, and we illustrate this by showing a paper that applies
methods from quantum physics and machine learning to astrophysical data. We
report the evaluations performed on these papers by domain experts, who
provided both numerical scores and review-like feedback. We then highlight the
strengths, weaknesses, and limitations of the current system. Finally, we
discuss the ethical implications of AI-driven research and reflect on how such
technology relates to the philosophy of science. We publicly release the code
at https://github.com/AstroPilot-AI/Denario. A Denario demo can also be run
directly on the web at https://huggingface.co/spaces/astropilot-ai/Denario, and
the full app will be deployed on the cloud.