ReFeed: Multidimensionale samenvattingsverfijning met reflectief redeneren op feedback
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback
March 27, 2025
Auteurs: Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
cs.AI
Samenvatting
Samenvattingsverfijning ondervindt uitdagingen bij uitbreiding naar meerdere dimensies.
In dit artikel introduceren we ReFeed, een krachtige pijplijn voor samenvattingsverfijning
die meerdere dimensies verbetert door reflectief redeneren op basis van feedback.
Hiervoor brengen we SumFeed-CoT uit, een grootschalige Long-CoT-gebaseerde dataset
geoptimaliseerd voor het trainen van een lichtgewicht model met reflectief redeneren.
Onze experimenten laten zien hoe het aantal dimensies, blootstelling aan feedback en
redeneerbeleid de verfijningsprestaties beïnvloeden, waarbij reflectief redeneren en
het gelijktijdig aanpakken van meerdere feedbackpunten cruciaal zijn om de afweging
tussen dimensies te verminderen. Bovendien is ReFeed robuust tegen ruis in feedback
en de volgorde van feedback. Tot slot benadrukt onze bevinding dat het creëren van
data met een passend doel en richtlijnen een fundamentele pijler vormt voor effectief
redeneren. De dataset en het model zullen worden vrijgegeven.
English
Summarization refinement faces challenges when extending to multi-dimension.
In this paper, we introduce ReFeed, a powerful summarization refinement
pipeline that enhances multiple dimensions through reflective reasoning on
feedback. To achieve this, we release SumFeed-CoT, a large-scale Long-CoT-based
dataset optimized for training a lightweight model with reflective reasoning.
Our experiments reveal how the number of dimensions, feedback exposure, and
reasoning policy influence refinement performance, highlighting reflective
reasoning and simultaneously addressing multiple feedback is crucial to
mitigate trade-off between dimensions. Furthermore, ReFeed is robust to noisy
feedback and feedback order. Lastly, our finding emphasizes that creating data
with a proper goal and guideline constitutes a fundamental pillar of effective
reasoning. The dataset and model will be released.Summary
AI-Generated Summary