ChatPaper.aiChatPaper

SurveyX: Automação de Pesquisas Acadêmicas por meio de Modelos de Linguagem de Grande Escala

SurveyX: Academic Survey Automation via Large Language Models

February 20, 2025
Autores: Xun Liang, Jiawei Yang, Yezhaohui Wang, Chen Tang, Zifan Zheng, Simin Niu, Shichao Song, Hanyu Wang, Bo Tang, Feiyu Xiong, Keming Mao, Zhiyu li
cs.AI

Resumo

Os Modelos de Linguagem de Grande Escala (LLMs) demonstraram capacidades excepcionais de compreensão e uma vasta base de conhecimento, sugerindo que os LLMs podem servir como ferramentas eficientes para a geração automatizada de pesquisas. No entanto, pesquisas recentes relacionadas à geração automatizada de pesquisas ainda são limitadas por algumas restrições críticas, como janela de contexto finita, falta de discussão aprofundada de conteúdo e ausência de frameworks de avaliação sistemáticos. Inspirados pelos processos de escrita humana, propomos o SurveyX, um sistema eficiente e organizado para geração automatizada de pesquisas que decompõe o processo de composição de pesquisas em duas fases: as fases de Preparação e Geração. Ao introduzir de forma inovadora a recuperação de referências online, um método de pré-processamento chamado AttributeTree e um processo de repolimento, o SurveyX melhora significativamente a eficácia da composição de pesquisas. Os resultados da avaliação experimental mostram que o SurveyX supera os sistemas existentes de geração automatizada de pesquisas em qualidade de conteúdo (melhoria de 0,259) e qualidade de citações (melhoria de 1,76), aproximando-se do desempenho de especialistas humanos em múltiplas dimensões de avaliação. Exemplos de pesquisas geradas pelo SurveyX estão disponíveis em www.surveyx.cn.
English
Large Language Models (LLMs) have demonstrated exceptional comprehension capabilities and a vast knowledge base, suggesting that LLMs can serve as efficient tools for automated survey generation. However, recent research related to automated survey generation remains constrained by some critical limitations like finite context window, lack of in-depth content discussion, and absence of systematic evaluation frameworks. Inspired by human writing processes, we propose SurveyX, an efficient and organized system for automated survey generation that decomposes the survey composing process into two phases: the Preparation and Generation phases. By innovatively introducing online reference retrieval, a pre-processing method called AttributeTree, and a re-polishing process, SurveyX significantly enhances the efficacy of survey composition. Experimental evaluation results show that SurveyX outperforms existing automated survey generation systems in content quality (0.259 improvement) and citation quality (1.76 enhancement), approaching human expert performance across multiple evaluation dimensions. Examples of surveys generated by SurveyX are available on www.surveyx.cn

Summary

AI-Generated Summary

PDF1005February 24, 2025