ReFeed : Raffinement multidimensionnel de la synthèse par raisonnement réflexif sur les retours
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback
March 27, 2025
Auteurs: Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
cs.AI
Résumé
Le raffinement de la synthèse rencontre des défis lorsqu'il s'étend à plusieurs dimensions. Dans cet article, nous présentons ReFeed, un pipeline puissant de raffinement de synthèse qui améliore plusieurs dimensions grâce à un raisonnement réflexif sur les retours. Pour y parvenir, nous publions SumFeed-CoT, un jeu de données à grande échelle basé sur Long-CoT, optimisé pour entraîner un modèle léger avec raisonnement réflexif. Nos expériences révèlent comment le nombre de dimensions, l'exposition aux retours et la politique de raisonnement influencent la performance du raffinement, soulignant que le raisonnement réflexif et la prise en compte simultanée de multiples retours sont essentiels pour atténuer les compromis entre dimensions. De plus, ReFeed est robuste face aux retours bruyants et à l'ordre des retours. Enfin, notre découverte met en évidence que la création de données avec un objectif et des directives appropriés constitue un pilier fondamental pour un raisonnement efficace. Le jeu de données et le modèle seront publiés.
English
Summarization refinement faces challenges when extending to multi-dimension.
In this paper, we introduce ReFeed, a powerful summarization refinement
pipeline that enhances multiple dimensions through reflective reasoning on
feedback. To achieve this, we release SumFeed-CoT, a large-scale Long-CoT-based
dataset optimized for training a lightweight model with reflective reasoning.
Our experiments reveal how the number of dimensions, feedback exposure, and
reasoning policy influence refinement performance, highlighting reflective
reasoning and simultaneously addressing multiple feedback is crucial to
mitigate trade-off between dimensions. Furthermore, ReFeed is robust to noisy
feedback and feedback order. Lastly, our finding emphasizes that creating data
with a proper goal and guideline constitutes a fundamental pillar of effective
reasoning. The dataset and model will be released.Summary
AI-Generated Summary