SearchRAG: ¿Pueden los motores de búsqueda ser útiles para la respuesta de preguntas médicas basadas en LLM?
SearchRAG: Can Search Engines Be Helpful for LLM-based Medical Question Answering?
February 18, 2025
Autores: Yucheng Shi, Tianze Yang, Canyu Chen, Quanzheng Li, Tianming Liu, Xiang Li, Ninghao Liu
cs.AI
Resumen
Los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) han demostrado capacidades notables en dominios generales, pero a menudo enfrentan dificultades en tareas que requieren conocimiento especializado. Las técnicas convencionales de Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) suelen recuperar información externa de bases de conocimiento estáticas, las cuales pueden estar desactualizadas o incompletas, careciendo de detalles clínicos específicos esenciales para respuestas médicas precisas. En este trabajo, proponemos SearchRAG, un marco novedoso que supera estas limitaciones al aprovechar motores de búsqueda en tiempo real. Nuestro método emplea la generación sintética de consultas para convertir preguntas médicas complejas en consultas compatibles con motores de búsqueda y utiliza la selección de conocimiento basada en incertidumbre para filtrar e incorporar el conocimiento médico más relevante e informativo en la entrada del LLM. Los resultados experimentales demuestran que nuestro método mejora significativamente la precisión de las respuestas en tareas de respuesta a preguntas médicas, particularmente en preguntas complejas que requieren conocimiento detallado y actualizado.
English
Large Language Models (LLMs) have shown remarkable capabilities in general
domains but often struggle with tasks requiring specialized knowledge.
Conventional Retrieval-Augmented Generation (RAG) techniques typically retrieve
external information from static knowledge bases, which can be outdated or
incomplete, missing fine-grained clinical details essential for accurate
medical question answering. In this work, we propose SearchRAG, a novel
framework that overcomes these limitations by leveraging real-time search
engines. Our method employs synthetic query generation to convert complex
medical questions into search-engine-friendly queries and utilizes
uncertainty-based knowledge selection to filter and incorporate the most
relevant and informative medical knowledge into the LLM's input. Experimental
results demonstrate that our method significantly improves response accuracy in
medical question answering tasks, particularly for complex questions requiring
detailed and up-to-date knowledge.Summary
AI-Generated Summary