Navegador de Conhecimento: Estrutura de Navegação Guiada por LLM para Pesquisa Exploratória na Literatura Científica
Knowledge Navigator: LLM-guided Browsing Framework for Exploratory Search in Scientific Literature
August 28, 2024
Autores: Uri Katz, Mosh Levy, Yoav Goldberg
cs.AI
Resumo
O crescimento exponencial da literatura científica torna necessária a utilização de ferramentas avançadas para uma exploração eficaz do conhecimento. Apresentamos o Navegador de Conhecimento, um sistema projetado para aprimorar as habilidades de busca exploratória, organizando e estruturando os documentos recuperados a partir de consultas amplas em tópicos científicos nomeados e descritivos, em uma hierarquia navegável de dois níveis. Essa organização estruturada fornece uma visão geral dos temas de pesquisa em um domínio, permitindo também uma busca iterativa e uma descoberta de conhecimento mais profunda dentro de subtemas específicos, ao permitir que os usuários refinem seu foco e recuperem documentos relevantes adicionais. O Navegador de Conhecimento combina capacidades de LLM com métodos baseados em cluster para possibilitar um método de navegação eficaz. Demonstramos a eficácia de nossa abordagem por meio de avaliações automáticas e manuais em dois novos benchmarks, CLUSTREC-COVID e SCITOC. Nosso código, prompts e benchmarks estão disponíveis publicamente.
English
The exponential growth of scientific literature necessitates advanced tools
for effective knowledge exploration. We present Knowledge Navigator, a system
designed to enhance exploratory search abilities by organizing and structuring
the retrieved documents from broad topical queries into a navigable, two-level
hierarchy of named and descriptive scientific topics and subtopics. This
structured organization provides an overall view of the research themes in a
domain, while also enabling iterative search and deeper knowledge discovery
within specific subtopics by allowing users to refine their focus and retrieve
additional relevant documents. Knowledge Navigator combines LLM capabilities
with cluster-based methods to enable an effective browsing method. We
demonstrate our approach's effectiveness through automatic and manual
evaluations on two novel benchmarks, CLUSTREC-COVID and SCITOC. Our code,
prompts, and benchmarks are made publicly available.Summary
AI-Generated Summary