SearchRAG : Les moteurs de recherche peuvent-ils être utiles pour le traitement de questions médicales basé sur des modèles de langage (LLM) ?
SearchRAG: Can Search Engines Be Helpful for LLM-based Medical Question Answering?
February 18, 2025
Auteurs: Yucheng Shi, Tianze Yang, Canyu Chen, Quanzheng Li, Tianming Liu, Xiang Li, Ninghao Liu
cs.AI
Résumé
Les grands modèles de langage (LLMs) ont démontré des capacités remarquables dans des domaines généraux, mais peinent souvent à accomplir des tâches nécessitant des connaissances spécialisées. Les techniques conventionnelles de génération augmentée par récupération (RAG) récupèrent généralement des informations externes à partir de bases de connaissances statiques, qui peuvent être obsolètes ou incomplètes, manquant ainsi de détails cliniques fins essentiels pour une réponse précise aux questions médicales. Dans ce travail, nous proposons SearchRAG, un cadre novateur qui surmonte ces limitations en exploitant des moteurs de recherche en temps réel. Notre méthode utilise la génération de requêtes synthétiques pour convertir des questions médicales complexes en requêtes adaptées aux moteurs de recherche et emploie une sélection de connaissances basée sur l'incertitude pour filtrer et intégrer les informations médicales les plus pertinentes et informatives dans l'entrée du LLM. Les résultats expérimentaux montrent que notre méthode améliore significativement la précision des réponses dans les tâches de question-réponse médicale, en particulier pour les questions complexes nécessitant des connaissances détaillées et à jour.
English
Large Language Models (LLMs) have shown remarkable capabilities in general
domains but often struggle with tasks requiring specialized knowledge.
Conventional Retrieval-Augmented Generation (RAG) techniques typically retrieve
external information from static knowledge bases, which can be outdated or
incomplete, missing fine-grained clinical details essential for accurate
medical question answering. In this work, we propose SearchRAG, a novel
framework that overcomes these limitations by leveraging real-time search
engines. Our method employs synthetic query generation to convert complex
medical questions into search-engine-friendly queries and utilizes
uncertainty-based knowledge selection to filter and incorporate the most
relevant and informative medical knowledge into the LLM's input. Experimental
results demonstrate that our method significantly improves response accuracy in
medical question answering tasks, particularly for complex questions requiring
detailed and up-to-date knowledge.Summary
AI-Generated Summary