ReFeed: Refinamiento de Resúmenes Multidimensionales con Razonamiento Reflexivo sobre Retroalimentación
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback
March 27, 2025
Autores: Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
cs.AI
Resumen
El refinamiento de resúmenes enfrenta desafíos al extenderse a múltiples dimensiones. En este artículo, presentamos ReFeed, una potente pipeline de refinamiento de resúmenes que mejora múltiples dimensiones mediante razonamiento reflexivo sobre retroalimentación. Para lograrlo, lanzamos SumFeed-CoT, un conjunto de datos a gran escala basado en Long-CoT optimizado para entrenar un modelo ligero con razonamiento reflexivo. Nuestros experimentos revelan cómo el número de dimensiones, la exposición a la retroalimentación y la política de razonamiento influyen en el rendimiento del refinamiento, destacando que el razonamiento reflexivo y abordar simultáneamente múltiples retroalimentaciones es crucial para mitigar el compromiso entre dimensiones. Además, ReFeed es robusto frente a retroalimentación ruidosa y al orden de la retroalimentación. Por último, nuestros hallazgos enfatizan que la creación de datos con un objetivo y directrices adecuados constituye un pilar fundamental para un razonamiento efectivo. El conjunto de datos y el modelo serán publicados.
English
Summarization refinement faces challenges when extending to multi-dimension.
In this paper, we introduce ReFeed, a powerful summarization refinement
pipeline that enhances multiple dimensions through reflective reasoning on
feedback. To achieve this, we release SumFeed-CoT, a large-scale Long-CoT-based
dataset optimized for training a lightweight model with reflective reasoning.
Our experiments reveal how the number of dimensions, feedback exposure, and
reasoning policy influence refinement performance, highlighting reflective
reasoning and simultaneously addressing multiple feedback is crucial to
mitigate trade-off between dimensions. Furthermore, ReFeed is robust to noisy
feedback and feedback order. Lastly, our finding emphasizes that creating data
with a proper goal and guideline constitutes a fundamental pillar of effective
reasoning. The dataset and model will be released.Summary
AI-Generated Summary