ChatPaper.aiChatPaper

フィードバックを記憶として道具化する

Distilling Feedback into Memory-as-a-Tool

January 9, 2026
著者: Víctor Gallego
cs.AI

要旨

我々は、推論時の推論コストを償却するフレームワークを提案する。これは、ファイルベースのメモリシステムとエージェント制御のツール呼び出しを通じて、一時的な批評を検索可能なガイドラインに変換するものである。本手法を、ルーブリックに基づく学習のための新規データセットであるRubric Feedback Benchで評価した。実験により、拡張したLLMが、推論コストを大幅に削減しつつ、テスト時改良パイプラインの性能に迅速に到達することを実証した。
English
We propose a framework that amortizes the cost of inference-time reasoning by converting transient critiques into retrievable guidelines, through a file-based memory system and agent-controlled tool calls. We evaluate this method on the Rubric Feedback Bench, a novel dataset for rubric-based learning. Experiments demonstrate that our augmented LLMs rapidly match the performance of test-time refinement pipelines while drastically reducing inference cost.
PDF11January 13, 2026