MindSearch: Imitar las mentes humanas provoca una profunda búsqueda de IA.
MindSearch: Mimicking Human Minds Elicits Deep AI Searcher
July 29, 2024
Autores: Zehui Chen, Kuikun Liu, Qiuchen Wang, Jiangning Liu, Wenwei Zhang, Kai Chen, Feng Zhao
cs.AI
Resumen
La búsqueda e integración de información es una tarea cognitiva compleja que consume un tiempo y esfuerzo enormes. Inspirados por el notable progreso de los Modelos de Lenguaje Grande, trabajos recientes intentan resolver esta tarea combinando LLMs y motores de búsqueda. Sin embargo, estos métodos aún obtienen un rendimiento insatisfactorio debido a tres desafíos: (1) las solicitudes complejas a menudo no pueden ser recuperadas de manera precisa y completa por el motor de búsqueda, (2) la información correspondiente a integrar está dispersa en múltiples páginas web junto con un ruido masivo, y (3) un gran número de páginas web con contenidos extensos pueden exceder rápidamente la longitud máxima de contexto de los LLMs. Inspirados por el proceso cognitivo cuando los humanos resuelven estos problemas, presentamos MindSearch para imitar las mentes humanas en la búsqueda e integración de información en la web, que puede ser implementado por un marco multiagente basado en LLM simple pero efectivo. El WebPlanner modela la mente humana de búsqueda de información en múltiples pasos como un proceso de construcción de gráficos dinámicos: descompone la consulta del usuario en subpreguntas atómicas como nodos en el gráfico y extiende progresivamente el gráfico basado en el resultado de búsqueda de WebSearcher. Encargado de cada subpregunta, WebSearcher realiza recuperación jerárquica de información con motores de búsqueda y recopila información valiosa para WebPlanner. El diseño multiagente de MindSearch permite que todo el marco busque e integre información en paralelo desde una escala más grande (por ejemplo, más de 300) páginas web en 3 minutos, lo que equivale a 3 horas de esfuerzo humano. MindSearch demuestra una mejora significativa en la calidad de respuesta en términos de profundidad y amplitud, tanto en problemas de preguntas y respuestas de conjunto cerrado como abierto. Además, las respuestas de MindSearch basadas en InternLM2.5-7B son preferibles por los humanos a las aplicaciones ChatGPT-Web y Perplexity.ai, lo que implica que MindSearch ya puede ofrecer una solución competitiva al motor de búsqueda de IA propietario.
English
Information seeking and integration is a complex cognitive task that consumes
enormous time and effort. Inspired by the remarkable progress of Large Language
Models, recent works attempt to solve this task by combining LLMs and search
engines. However, these methods still obtain unsatisfying performance due to
three challenges: (1) complex requests often cannot be accurately and
completely retrieved by the search engine once (2) corresponding information to
be integrated is spread over multiple web pages along with massive noise, and
(3) a large number of web pages with long contents may quickly exceed the
maximum context length of LLMs. Inspired by the cognitive process when humans
solve these problems, we introduce MindSearch to mimic the human minds in web
information seeking and integration, which can be instantiated by a simple yet
effective LLM-based multi-agent framework. The WebPlanner models the human mind
of multi-step information seeking as a dynamic graph construction process: it
decomposes the user query into atomic sub-questions as nodes in the graph and
progressively extends the graph based on the search result from WebSearcher.
Tasked with each sub-question, WebSearcher performs hierarchical information
retrieval with search engines and collects valuable information for WebPlanner.
The multi-agent design of MindSearch enables the whole framework to seek and
integrate information parallelly from larger-scale (e.g., more than 300) web
pages in 3 minutes, which is worth 3 hours of human effort. MindSearch
demonstrates significant improvement in the response quality in terms of depth
and breadth, on both close-set and open-set QA problems. Besides, responses
from MindSearch based on InternLM2.5-7B are preferable by humans to ChatGPT-Web
and Perplexity.ai applications, which implies that MindSearch can already
deliver a competitive solution to the proprietary AI search engine.Summary
AI-Generated Summary