ChatPaper.aiChatPaper

SurveySum : un ensemble de données pour résumer plusieurs articles scientifiques en une section de synthèse

SurveySum: A Dataset for Summarizing Multiple Scientific Articles into a Survey Section

August 29, 2024
Auteurs: Leandro Carísio Fernandes, Gustavo Bartz Guedes, Thiago Soares Laitz, Thales Sales Almeida, Rodrigo Nogueira, Roberto Lotufo, Jayr Pereira
cs.AI

Résumé

La résumé automatique est une tâche visant à condenser des textes en résumés concis et informatifs. Cet article présente un nouvel ensemble de données conçu pour résumer plusieurs articles scientifiques en une section d'une enquête. Nos contributions sont les suivantes : (1) SurveySum, un nouvel ensemble de données comblant le fossé dans les outils de résumé spécifiques à un domaine ; (2) deux pipelines spécifiques pour résumer des articles scientifiques en une section d'une enquête ; et (3) l'évaluation de ces pipelines à l'aide de plusieurs métriques pour comparer leurs performances. Nos résultats mettent en évidence l'importance des étapes de récupération de haute qualité et l'impact des différentes configurations sur la qualité des résumés générés.
English
Document summarization is a task to shorten texts into concise and informative summaries. This paper introduces a novel dataset designed for summarizing multiple scientific articles into a section of a survey. Our contributions are: (1) SurveySum, a new dataset addressing the gap in domain-specific summarization tools; (2) two specific pipelines to summarize scientific articles into a section of a survey; and (3) the evaluation of these pipelines using multiple metrics to compare their performance. Our results highlight the importance of high-quality retrieval stages and the impact of different configurations on the quality of generated summaries.

Summary

AI-Generated Summary

PDF81November 16, 2024