ChatPaper.aiChatPaper

ReFeed: フィードバックに対する内省的推論を用いた多次元要約の精緻化

ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback

March 27, 2025
著者: Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
cs.AI

要旨

要約の精緻化は、多次元への拡張において課題に直面しています。本論文では、フィードバックに対する反射的推論を通じて複数の次元を強化する強力な要約精緻化パイプラインであるReFeedを紹介します。これを実現するため、反射的推論を備えた軽量モデルのトレーニングに最適化された大規模なLong-CoTベースのデータセットであるSumFeed-CoTを公開します。実験により、次元の数、フィードバックの露出、および推論ポリシーが精緻化の性能にどのように影響するかを明らかにし、反射的推論と複数のフィードバックを同時に対処することが次元間のトレードオフを緩和する上で重要であることを示しています。さらに、ReFeedはノイズの多いフィードバックやフィードバックの順序に対してロバストです。最後に、適切な目標とガイドラインに基づいてデータを作成することが効果的な推論の基本的な柱を構成することを強調します。データセットとモデルは公開される予定です。
English
Summarization refinement faces challenges when extending to multi-dimension. In this paper, we introduce ReFeed, a powerful summarization refinement pipeline that enhances multiple dimensions through reflective reasoning on feedback. To achieve this, we release SumFeed-CoT, a large-scale Long-CoT-based dataset optimized for training a lightweight model with reflective reasoning. Our experiments reveal how the number of dimensions, feedback exposure, and reasoning policy influence refinement performance, highlighting reflective reasoning and simultaneously addressing multiple feedback is crucial to mitigate trade-off between dimensions. Furthermore, ReFeed is robust to noisy feedback and feedback order. Lastly, our finding emphasizes that creating data with a proper goal and guideline constitutes a fundamental pillar of effective reasoning. The dataset and model will be released.

Summary

AI-Generated Summary

PDF203March 31, 2025