ReFeed: Mehrdimensionale Zusammenfassungsverfeinerung mit reflektivem Denken auf Basis von Feedback
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback
March 27, 2025
Autoren: Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
cs.AI
Zusammenfassung
Die Verfeinerung von Zusammenfassungen steht vor Herausforderungen, wenn sie auf mehrere Dimensionen ausgeweitet wird. In diesem Artikel stellen wir ReFeed vor, eine leistungsstarke Pipeline zur Verfeinerung von Zusammenfassungen, die mehrere Dimensionen durch reflektierendes Denken auf Basis von Feedback verbessert. Um dies zu erreichen, veröffentlichen wir SumFeed-CoT, einen groß angelegten, auf Long-CoT basierenden Datensatz, der für das Training eines leichtgewichtigen Modells mit reflektierendem Denken optimiert ist. Unsere Experimente zeigen, wie die Anzahl der Dimensionen, die Feedback-Exposition und die Denkstrategie die Verfeinerungsleistung beeinflussen, wobei reflektierendes Denken und die gleichzeitige Berücksichtigung mehrerer Feedback-Aspekte entscheidend sind, um den Kompromiss zwischen den Dimensionen zu mildern. Darüber hinaus ist ReFeed robust gegenüber verrauschtem Feedback und der Reihenfolge des Feedbacks. Schließlich unterstreicht unsere Erkenntnis, dass die Erstellung von Daten mit einem angemessenen Ziel und Leitfaden eine grundlegende Säule für effektives Denken darstellt. Der Datensatz und das Modell werden veröffentlicht.
English
Summarization refinement faces challenges when extending to multi-dimension.
In this paper, we introduce ReFeed, a powerful summarization refinement
pipeline that enhances multiple dimensions through reflective reasoning on
feedback. To achieve this, we release SumFeed-CoT, a large-scale Long-CoT-based
dataset optimized for training a lightweight model with reflective reasoning.
Our experiments reveal how the number of dimensions, feedback exposure, and
reasoning policy influence refinement performance, highlighting reflective
reasoning and simultaneously addressing multiple feedback is crucial to
mitigate trade-off between dimensions. Furthermore, ReFeed is robust to noisy
feedback and feedback order. Lastly, our finding emphasizes that creating data
with a proper goal and guideline constitutes a fundamental pillar of effective
reasoning. The dataset and model will be released.Summary
AI-Generated Summary