SearchRAG: Können Suchmaschinen bei der medizinischen Fragebeantwortung auf Basis von LLMs hilfreich sein?
SearchRAG: Can Search Engines Be Helpful for LLM-based Medical Question Answering?
February 18, 2025
Autoren: Yucheng Shi, Tianze Yang, Canyu Chen, Quanzheng Li, Tianming Liu, Xiang Li, Ninghao Liu
cs.AI
Zusammenfassung
Große Sprachmodelle (LLMs) haben bemerkenswerte Fähigkeiten in allgemeinen Bereichen gezeigt, stoßen jedoch oft bei Aufgaben an ihre Grenzen, die spezialisiertes Wissen erfordern. Herkömmliche Retrieval-Augmented Generation (RAG)-Techniken greifen typischerweise auf externe Informationen aus statischen Wissensdatenbanken zurück, die veraltet oder unvollständig sein können und fein abgestufte klinische Details vermissen, die für eine genaue Beantwortung medizinischer Fragen entscheidend sind. In dieser Arbeit schlagen wir SearchRAG vor, ein neuartiges Framework, das diese Einschränkungen durch die Nutzung von Echtzeit-Suchmaschinen überwindet. Unser Ansatz verwendet synthetische Abfragegenerierung, um komplexe medizinische Fragen in suchmaschinenfreundliche Abfragen umzuwandeln, und nutzt unsicherheitsbasierte Wissensselektion, um das relevanteste und informativste medizinische Wissen zu filtern und in die Eingabe des LLM zu integrieren. Experimentelle Ergebnisse zeigen, dass unsere Methode die Antwortgenauigkeit bei medizinischen Frage-Antwort-Aufgaben erheblich verbessert, insbesondere bei komplexen Fragen, die detailliertes und aktuelles Wissen erfordern.
English
Large Language Models (LLMs) have shown remarkable capabilities in general
domains but often struggle with tasks requiring specialized knowledge.
Conventional Retrieval-Augmented Generation (RAG) techniques typically retrieve
external information from static knowledge bases, which can be outdated or
incomplete, missing fine-grained clinical details essential for accurate
medical question answering. In this work, we propose SearchRAG, a novel
framework that overcomes these limitations by leveraging real-time search
engines. Our method employs synthetic query generation to convert complex
medical questions into search-engine-friendly queries and utilizes
uncertainty-based knowledge selection to filter and incorporate the most
relevant and informative medical knowledge into the LLM's input. Experimental
results demonstrate that our method significantly improves response accuracy in
medical question answering tasks, particularly for complex questions requiring
detailed and up-to-date knowledge.Summary
AI-Generated Summary