ChatPaper.aiChatPaper

SurveyXは、大規模言語モデルを活用した学術調査自動化システムです。本システムは、調査設計、データ収集、分析、可視化の全プロセスを自動化し、研究者が調査研究を効率的に実施できるよう支援します。SurveyXは、自然言語処理技術を駆使して、複雑な調査質問の生成、回答の解釈、洞察の抽出を可能にします。さらに、システムは継続的に学習し、ユーザーのフィードバックに基づいて改善されるため、時間の経過とともに精度と有用性が向上します。SurveyXは、社会科学、市場調査、ユーザー研究など、幅広い分野での応用が期待されています。

SurveyX: Academic Survey Automation via Large Language Models

February 20, 2025
著者: Xun Liang, Jiawei Yang, Yezhaohui Wang, Chen Tang, Zifan Zheng, Simin Niu, Shichao Song, Hanyu Wang, Bo Tang, Feiyu Xiong, Keming Mao, Zhiyu li
cs.AI

要旨

大規模言語モデル(LLMs)は、卓越した理解能力と膨大な知識基盤を示しており、LLMsが自動化された調査生成の効率的なツールとして機能し得ることを示唆しています。しかし、自動化された調査生成に関する最近の研究は、有限のコンテキストウィンドウ、深い内容の議論の欠如、体系的な評価フレームワークの不在といった重要な制約に依然として縛られています。人間の執筆プロセスに着想を得て、我々はSurveyXを提案します。これは、調査作成プロセスを準備段階と生成段階の2つのフェーズに分解する、効率的で体系的な自動調査生成システムです。オンライン参照検索、AttributeTreeと呼ばれる前処理方法、および再研磨プロセスを革新的に導入することで、SurveyXは調査作成の効率を大幅に向上させます。実験的評価の結果、SurveyXは既存の自動調査生成システムを内容の品質(0.259の改善)と引用の品質(1.76の向上)の両面で上回り、複数の評価次元で人間の専門家のパフォーマンスに接近しています。SurveyXによって生成された調査の例は、www.surveyx.cnで閲覧可能です。
English
Large Language Models (LLMs) have demonstrated exceptional comprehension capabilities and a vast knowledge base, suggesting that LLMs can serve as efficient tools for automated survey generation. However, recent research related to automated survey generation remains constrained by some critical limitations like finite context window, lack of in-depth content discussion, and absence of systematic evaluation frameworks. Inspired by human writing processes, we propose SurveyX, an efficient and organized system for automated survey generation that decomposes the survey composing process into two phases: the Preparation and Generation phases. By innovatively introducing online reference retrieval, a pre-processing method called AttributeTree, and a re-polishing process, SurveyX significantly enhances the efficacy of survey composition. Experimental evaluation results show that SurveyX outperforms existing automated survey generation systems in content quality (0.259 improvement) and citation quality (1.76 enhancement), approaching human expert performance across multiple evaluation dimensions. Examples of surveys generated by SurveyX are available on www.surveyx.cn

Summary

AI-Generated Summary

PDF1005February 24, 2025