ChatPaper.aiChatPaper

MCTS-RAG: Mejorando la Generación Aumentada por Recuperación con Búsqueda en Árbol de Monte Carlo

MCTS-RAG: Enhancing Retrieval-Augmented Generation with Monte Carlo Tree Search

March 26, 2025
Autores: Yunhai Hu, Yilun Zhao, Chen Zhao, Arman Cohan
cs.AI

Resumen

Presentamos MCTS-RAG, un enfoque novedoso que mejora las capacidades de razonamiento de modelos de lenguaje pequeños en tareas intensivas en conocimiento al aprovechar la generación aumentada por recuperación (RAG) para proporcionar contexto relevante y la Búsqueda en Árbol de Monte Carlo (MCTS) para refinar las rutas de razonamiento. MCTS-RAG integra dinámicamente la recuperación y el razonamiento a través de un proceso iterativo de toma de decisiones. A diferencia de los métodos RAG estándar, que suelen recuperar información de manera independiente al razonamiento y, por lo tanto, integran el conocimiento de manera subóptima, o del razonamiento MCTS convencional, que depende únicamente del conocimiento interno del modelo sin hechos externos, MCTS-RAG combina el razonamiento estructurado con la recuperación adaptativa. Este enfoque integrado mejora la toma de decisiones, reduce las alucinaciones y garantiza una mayor precisión factual y consistencia en las respuestas. Los resultados experimentales en múltiples conjuntos de datos de razonamiento e intensivos en conocimiento (es decir, ComplexWebQA, GPQA y FoolMeTwice) muestran que nuestro método permite que los modelos de lenguaje de pequeña escala alcancen un rendimiento comparable al de modelos de lenguaje de vanguardia como GPT-4 al escalar eficazmente el cómputo en tiempo de inferencia, estableciendo un nuevo estándar para el razonamiento en modelos de pequeña escala.
English
We introduce MCTS-RAG, a novel approach that enhances the reasoning capabilities of small language models on knowledge-intensive tasks by leveraging retrieval-augmented generation (RAG) to provide relevant context and Monte Carlo Tree Search (MCTS) to refine reasoning paths. MCTS-RAG dynamically integrates retrieval and reasoning through an iterative decision-making process. Unlike standard RAG methods, which typically retrieve information independently from reasoning and thus integrate knowledge suboptimally, or conventional MCTS reasoning, which depends solely on internal model knowledge without external facts, MCTS-RAG combines structured reasoning with adaptive retrieval. This integrated approach enhances decision-making, reduces hallucinations, and ensures improved factual accuracy and response consistency. The experimental results on multiple reasoning and knowledge-intensive datasets datasets (i.e., ComplexWebQA, GPQA, and FoolMeTwice) show that our method enables small-scale LMs to achieve performance comparable to frontier LLMs like GPT-4o by effectively scaling inference-time compute, setting a new standard for reasoning in small-scale models.

Summary

AI-Generated Summary

PDF102March 27, 2025