Navegador de Conhecimento: Estrutura de Navegação Guiada por LLM para Pesquisa Exploratória na Literatura Científica

Resumo

O crescimento exponencial da literatura científica torna necessária a utilização de ferramentas avançadas para uma exploração eficaz do conhecimento. Apresentamos o Navegador de Conhecimento, um sistema projetado para aprimorar as habilidades de busca exploratória, organizando e estruturando os documentos recuperados a partir de consultas amplas em tópicos científicos nomeados e descritivos, em uma hierarquia navegável de dois níveis. Essa organização estruturada fornece uma visão geral dos temas de pesquisa em um domínio, permitindo também uma busca iterativa e uma descoberta de conhecimento mais profunda dentro de subtemas específicos, ao permitir que os usuários refinem seu foco e recuperem documentos relevantes adicionais. O Navegador de Conhecimento combina capacidades de LLM com métodos baseados em cluster para possibilitar um método de navegação eficaz. Demonstramos a eficácia de nossa abordagem por meio de avaliações automáticas e manuais em dois novos benchmarks, CLUSTREC-COVID e SCITOC. Nosso código, prompts e benchmarks estão disponíveis publicamente.

English

The exponential growth of scientific literature necessitates advanced tools for effective knowledge exploration. We present Knowledge Navigator, a system designed to enhance exploratory search abilities by organizing and structuring the retrieved documents from broad topical queries into a navigable, two-level hierarchy of named and descriptive scientific topics and subtopics. This structured organization provides an overall view of the research themes in a domain, while also enabling iterative search and deeper knowledge discovery within specific subtopics by allowing users to refine their focus and retrieve additional relevant documents. Knowledge Navigator combines LLM capabilities with cluster-based methods to enable an effective browsing method. We demonstrate our approach's effectiveness through automatic and manual evaluations on two novel benchmarks, CLUSTREC-COVID and SCITOC. Our code, prompts, and benchmarks are made publicly available.

Navegador de Conhecimento: Estrutura de Navegação Guiada por LLM para Pesquisa Exploratória na Literatura Científica

Knowledge Navigator: LLM-guided Browsing Framework for Exploratory Search in Scientific Literature

Resumo

Support