Младший специалист по ИИ и его отчет о рисках: Автономное научное исследование на основе базовой публикации
Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper
November 6, 2025
Авторы: Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa
cs.AI
Аннотация
Понимание текущих возможностей и рисков систем «ИИ-ученый» крайне важно для обеспечения надежного и устойчивого научного прогресса, управляемого искусственным интеллектом, при сохранении целостности академической экосистемы. С этой целью мы разработали Jr. AI Scientist — передовую автономную систему-ученого, которая имитирует ключевой исследовательский workflow студента-исследователя начального уровня: получив базовую статью от человека-наставника, система анализирует ее ограничения, формулирует новые гипотезы для улучшения, проверяет их с помощью строгого экспериментального подхода и пишет статью с результатами. В отличие от предыдущих подходов, предполагающих полную автоматизацию или работающих с небольшими фрагментами кода, Jr. AI Scientist следует четко определенному исследовательскому workflow и использует современные coding-агенты для работы со сложными, многокомпонентными реализациями, что приводит к научно ценным результатам. Для оценки мы провели автоматизированное тестирование с помощью ИИ-рецензентов, оценку авторами и подачу работ на конференцию Agents4Science, посвященную научным достижениям на основе ИИ. Результаты показывают, что статьи, сгенерированные Jr. AI Scientist, получают более высокие оценки рецензентов, чем существующие полностью автоматизированные системы. Тем не менее, мы выявили существенные ограничения как по оценке авторов, так и по отзывам с Agents4Science, что указывает на потенциальные риски прямого применения современных систем «ИИ-ученый» и ключевые вызовы для будущих исследований. Наконец, мы всесторонне описываем различные риски, обнаруженные в процессе разработки. Мы надеемся, что эти наблюдения углубят понимание текущего прогресса и рисков в развитии технологий «ИИ-ученый».
English
Understanding the current capabilities and risks of AI Scientist systems is
essential for ensuring trustworthy and sustainable AI-driven scientific
progress while preserving the integrity of the academic ecosystem. To this end,
we develop Jr. AI Scientist, a state-of-the-art autonomous AI scientist system
that mimics the core research workflow of a novice student researcher: Given
the baseline paper from the human mentor, it analyzes its limitations,
formulates novel hypotheses for improvement, validates them through rigorous
experimentation, and writes a paper with the results. Unlike previous
approaches that assume full automation or operate on small-scale code, Jr. AI
Scientist follows a well-defined research workflow and leverages modern coding
agents to handle complex, multi-file implementations, leading to scientifically
valuable contributions. For evaluation, we conducted automated assessments
using AI Reviewers, author-led evaluations, and submissions to Agents4Science,
a venue dedicated to AI-driven scientific contributions. The findings
demonstrate that Jr. AI Scientist generates papers receiving higher review
scores than existing fully automated systems. Nevertheless, we identify
important limitations from both the author evaluation and the Agents4Science
reviews, indicating the potential risks of directly applying current AI
Scientist systems and key challenges for future research. Finally, we
comprehensively report various risks identified during development. We hope
these insights will deepen understanding of current progress and risks in AI
Scientist development.