ChatPaper.aiChatPaper

データエージェントの現状調査:新たなパラダイムか、過大評価された流行か?

A Survey of Data Agents: Emerging Paradigm or Overstated Hype?

October 27, 2025
著者: Yizhang Zhu, Liangwei Wang, Chenyu Yang, Xiaotian Lin, Boyan Li, Wei Zhou, Xinyu Liu, Zhangyang Peng, Tianqi Luo, Yu Li, Chengliang Chai, Chong Chen, Shimin Di, Ju Fan, Ji Sun, Nan Tang, Fugee Tsung, Jiannan Wang, Chenglin Wu, Yanwei Xu, Shaolei Zhang, Yong Zhang, Xuanhe Zhou, Guoliang Li, Yuyu Luo
cs.AI

要旨

大規模言語モデル(LLM)の急速な進化に伴い、複雑なデータ関連タスクに対処するためにData + AIエコシステムを統合する自律システムである「データエージェント」が出現している。しかし、「データエージェント」という用語は現在、用語の曖昧さと採用の不整合に悩まされており、単純な問い合わせ応答システムと高度な自律アーキテクチャが混同されている。この用語の曖昧さは、ユーザー期待の不一致、責任の所在に関する課題、産業成長の障壁を生み出している。自動運転のSAE J3016標準に着想を得て、本調査はデータエージェント初の体系的な階層的分類法を提案する。これは6段階から成り、手動操作(L0)から生成的で完全自律的なデータエージェント(L5)というビジョンまで、自律性の漸進的変化を delineate し追跡することで、能力範囲と責任分配を明確化する。この枠組みを通じて、自律性の向上に沿って配置された既存研究を体系的にレビューし、データ管理、準備、分析のための専門的なデータエージェントから、自律性を強化した汎用的で包括的なシステムに向けた新興の取り組みまでを網羅する。さらに、データエージェントの進化における重要な飛躍と技術的ギャップ、特に手続き的実行から自律的オーケストレーションへ進化するL2からL3への移行を分析する。最後に、先を見据えたロードマップを示し、能動的で生成的なデータエージェントの到来を展望する。
English
The rapid advancement of large language models (LLMs) has spurred the emergence of data agents--autonomous systems designed to orchestrate Data + AI ecosystems for tackling complex data-related tasks. However, the term "data agent" currently suffers from terminological ambiguity and inconsistent adoption, conflating simple query responders with sophisticated autonomous architectures. This terminological ambiguity fosters mismatched user expectations, accountability challenges, and barriers to industry growth. Inspired by the SAE J3016 standard for driving automation, this survey introduces the first systematic hierarchical taxonomy for data agents, comprising six levels that delineate and trace progressive shifts in autonomy, from manual operations (L0) to a vision of generative, fully autonomous data agents (L5), thereby clarifying capability boundaries and responsibility allocation. Through this lens, we offer a structured review of existing research arranged by increasing autonomy, encompassing specialized data agents for data management, preparation, and analysis, alongside emerging efforts toward versatile, comprehensive systems with enhanced autonomy. We further analyze critical evolutionary leaps and technical gaps for advancing data agents, especially the ongoing L2-to-L3 transition, where data agents evolve from procedural execution to autonomous orchestration. Finally, we conclude with a forward-looking roadmap, envisioning the advent of proactive, generative data agents.
PDF651December 31, 2025