ChatPaper.aiChatPaper

Dyve: 動的プロセス検証のための速い思考と遅い思考

Dyve: Thinking Fast and Slow for Dynamic Process Verification

February 16, 2025
著者: Jianyuan Zhong, Zeju Li, Zhijian Xu, Xiangyu Wen, Qiang Xu
cs.AI

要旨

私たちは、カーネマンのシステム理論に着想を得た高速思考と低速思考の統合により、大規模言語モデルにおける推論エラーの検出を強化する動的プロセス検証器Dyveを提案します。Dyveは、単純なステップには即時的なトークンレベルの確認を行うシステム1を、複雑なステップには包括的な分析を行うシステム2を適応的に適用します。モンテカルロ推定とLLMベースの評価を組み合わせた新しいステップワイズ・コンセンサスフィルタリングプロセス監視技術を活用することで、Dyveはノイズの多いデータから高品質な監視信号を抽出します。ProcessBenchとMATHデータセットでの実験結果は、Dyveが既存のプロセスベースの検証器を大幅に上回り、Best-of-N設定での性能を向上させることを確認しています。
English
We present Dyve, a dynamic process verifier that enhances reasoning error detection in large language models by integrating fast and slow thinking, inspired by Kahneman's Systems Theory. Dyve adaptively applies immediate token-level confirmation System 1 for straightforward steps and comprehensive analysis System 2 for complex ones. Leveraging a novel step-wise consensus-filtered process supervision technique, combining Monte Carlo estimation with LLM based evaluation, Dyve curates high-quality supervision signals from noisy data. Experimental results on ProcessBench and the MATH dataset confirm that Dyve significantly outperforms existing process-based verifiers and boosts performance in Best-of-N settings.

Summary

AI-Generated Summary

PDF72February 18, 2025