ReFeed: Refinamento de Sumarização Multidimensional com Raciocínio Reflexivo sobre Feedback
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback
March 27, 2025
Autores: Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
cs.AI
Resumo
O refinamento de sumarização enfrenta desafios ao se estender para múltiplas dimensões. Neste artigo, apresentamos o ReFeed, um poderoso pipeline de refinamento de sumarização que aprimora múltiplas dimensões por meio de raciocínio reflexivo sobre feedback. Para alcançar isso, lançamos o SumFeed-CoT, um conjunto de dados em larga escala baseado em Long-CoT, otimizado para treinar um modelo leve com raciocínio reflexivo. Nossos experimentos revelam como o número de dimensões, a exposição ao feedback e a política de raciocínio influenciam o desempenho do refinamento, destacando que o raciocínio reflexivo e a abordagem simultânea de múltiplos feedbacks são cruciais para mitigar o trade-off entre as dimensões. Além disso, o ReFeed é robusto a feedbacks ruidosos e à ordem dos feedbacks. Por fim, nossa descoberta enfatiza que a criação de dados com um objetivo e diretrizes adequados constitui um pilar fundamental para um raciocínio eficaz. O conjunto de dados e o modelo serão disponibilizados.
English
Summarization refinement faces challenges when extending to multi-dimension.
In this paper, we introduce ReFeed, a powerful summarization refinement
pipeline that enhances multiple dimensions through reflective reasoning on
feedback. To achieve this, we release SumFeed-CoT, a large-scale Long-CoT-based
dataset optimized for training a lightweight model with reflective reasoning.
Our experiments reveal how the number of dimensions, feedback exposure, and
reasoning policy influence refinement performance, highlighting reflective
reasoning and simultaneously addressing multiple feedback is crucial to
mitigate trade-off between dimensions. Furthermore, ReFeed is robust to noisy
feedback and feedback order. Lastly, our finding emphasizes that creating data
with a proper goal and guideline constitutes a fundamental pillar of effective
reasoning. The dataset and model will be released.Summary
AI-Generated Summary