ReFeed : Raffinement multidimensionnel de la synthèse par raisonnement réflexif sur les retours

Résumé

Le raffinement de la synthèse rencontre des défis lorsqu'il s'étend à plusieurs dimensions. Dans cet article, nous présentons ReFeed, un pipeline puissant de raffinement de synthèse qui améliore plusieurs dimensions grâce à un raisonnement réflexif sur les retours. Pour y parvenir, nous publions SumFeed-CoT, un jeu de données à grande échelle basé sur Long-CoT, optimisé pour entraîner un modèle léger avec raisonnement réflexif. Nos expériences révèlent comment le nombre de dimensions, l'exposition aux retours et la politique de raisonnement influencent la performance du raffinement, soulignant que le raisonnement réflexif et la prise en compte simultanée de multiples retours sont essentiels pour atténuer les compromis entre dimensions. De plus, ReFeed est robuste face aux retours bruyants et à l'ordre des retours. Enfin, notre découverte met en évidence que la création de données avec un objectif et des directives appropriés constitue un pilier fondamental pour un raisonnement efficace. Le jeu de données et le modèle seront publiés.

English

Summarization refinement faces challenges when extending to multi-dimension. In this paper, we introduce ReFeed, a powerful summarization refinement pipeline that enhances multiple dimensions through reflective reasoning on feedback. To achieve this, we release SumFeed-CoT, a large-scale Long-CoT-based dataset optimized for training a lightweight model with reflective reasoning. Our experiments reveal how the number of dimensions, feedback exposure, and reasoning policy influence refinement performance, highlighting reflective reasoning and simultaneously addressing multiple feedback is crucial to mitigate trade-off between dimensions. Furthermore, ReFeed is robust to noisy feedback and feedback order. Lastly, our finding emphasizes that creating data with a proper goal and guideline constitutes a fundamental pillar of effective reasoning. The dataset and model will be released.