SurveySum: Ein Datensatz zum Zusammenfassen mehrerer wissenschaftlicher Artikel in einen Umfrageabschnitt.
SurveySum: A Dataset for Summarizing Multiple Scientific Articles into a Survey Section
August 29, 2024
Autoren: Leandro Carísio Fernandes, Gustavo Bartz Guedes, Thiago Soares Laitz, Thales Sales Almeida, Rodrigo Nogueira, Roberto Lotufo, Jayr Pereira
cs.AI
Zusammenfassung
Die Dokumentenzusammenfassung ist eine Aufgabe, um Texte in prägnante und informative Zusammenfassungen zu kürzen. Dieses Papier stellt einen neuartigen Datensatz vor, der für die Zusammenfassung mehrerer wissenschaftlicher Artikel zu einem Abschnitt einer Umfrage entwickelt wurde. Unsere Beiträge sind: (1) SurveySum, ein neuer Datensatz, der die Lücke in domänenspezifischen Zusammenfassungswerkzeugen adressiert; (2) zwei spezifische Abläufe zur Zusammenfassung wissenschaftlicher Artikel zu einem Abschnitt einer Umfrage; und (3) die Bewertung dieser Abläufe unter Verwendung mehrerer Metriken, um ihre Leistung zu vergleichen. Unsere Ergebnisse betonen die Bedeutung von qualitativ hochwertigen Abrufstufen und den Einfluss verschiedener Konfigurationen auf die Qualität der generierten Zusammenfassungen.
English
Document summarization is a task to shorten texts into concise and
informative summaries. This paper introduces a novel dataset designed for
summarizing multiple scientific articles into a section of a survey. Our
contributions are: (1) SurveySum, a new dataset addressing the gap in
domain-specific summarization tools; (2) two specific pipelines to summarize
scientific articles into a section of a survey; and (3) the evaluation of these
pipelines using multiple metrics to compare their performance. Our results
highlight the importance of high-quality retrieval stages and the impact of
different configurations on the quality of generated summaries.Summary
AI-Generated Summary