AutoMind:自動データサイエンスのための適応型知識エージェント
AutoMind: Adaptive Knowledgeable Agent for Automated Data Science
June 12, 2025
著者: Yixin Ou, Yujie Luo, Jingsheng Zheng, Lanning Wei, Shuofei Qiao, Jintian Zhang, Da Zheng, Huajun Chen, Ningyu Zhang
cs.AI
要旨
大規模言語モデル(LLM)エージェントは、現実世界のデータサイエンス問題に対処する上で大きな可能性を示しています。LLM駆動のデータサイエンスエージェントは、機械学習パイプライン全体を自動化することを約束しますが、その現実世界での有効性はまだ限られています。既存のフレームワークは、硬直した事前定義されたワークフローと柔軟性のないコーディング戦略に依存しているため、比較的単純で古典的な問題では優れた性能を発揮するものの、複雑で革新的なタスクにおいて人間の実践者が持つ経験的専門知識を捉えることができません。本研究では、AutoMindを紹介します。これは、以下の3つの主要な進歩を通じてこれらの欠点を克服する適応的で知識豊富なLLMエージェントフレームワークです:(1)エージェントをドメイン専門知識に基づかせるための精選された専門知識ベース、(2)可能な解決策を戦略的に探索するエージェント的知識木探索アルゴリズム、(3)タスクの複雑さに応じて動的にコード生成を調整する自己適応型コーディング戦略。2つの自動化データサイエンスベンチマークでの評価により、AutoMindが最先端のベースラインに対して優れた性能を発揮することが示されました。追加の分析により、有効性、効率性、および質的解決策の品質が良好であることが確認され、AutoMindが完全自動化されたデータサイエンスに向けた効率的で堅牢な一歩であることが強調されています。
English
Large Language Model (LLM) agents have shown great potential in addressing
real-world data science problems. LLM-driven data science agents promise to
automate the entire machine learning pipeline, yet their real-world
effectiveness remains limited. Existing frameworks depend on rigid, pre-defined
workflows and inflexible coding strategies; consequently, they excel only on
relatively simple, classical problems and fail to capture the empirical
expertise that human practitioners bring to complex, innovative tasks. In this
work, we introduce AutoMind, an adaptive, knowledgeable LLM-agent framework
that overcomes these deficiencies through three key advances: (1) a curated
expert knowledge base that grounds the agent in domain expert knowledge, (2) an
agentic knowledgeable tree search algorithm that strategically explores
possible solutions, and (3) a self-adaptive coding strategy that dynamically
tailors code generation to task complexity. Evaluations on two automated data
science benchmarks demonstrate that AutoMind delivers superior performance
versus state-of-the-art baselines. Additional analyses confirm favorable
effectiveness, efficiency, and qualitative solution quality, highlighting
AutoMind as an efficient and robust step toward fully automated data science.