MindSearch : Imiter les esprits humains pour susciter une recherche IA approfondie
MindSearch: Mimicking Human Minds Elicits Deep AI Searcher
July 29, 2024
Auteurs: Zehui Chen, Kuikun Liu, Qiuchen Wang, Jiangning Liu, Wenwei Zhang, Kai Chen, Feng Zhao
cs.AI
Résumé
La recherche et l'intégration d'informations constituent une tâche cognitive complexe qui consomme un temps et un effort considérables. Inspirés par les progrès remarquables des modèles de langage de grande taille (LLM), des travaux récents tentent de résoudre cette tâche en combinant les LLM et les moteurs de recherche. Cependant, ces méthodes obtiennent encore des performances insatisfaisantes en raison de trois défis : (1) les requêtes complexes ne peuvent souvent pas être récupérées de manière précise et complète par le moteur de recherche en une seule fois, (2) les informations correspondantes à intégrer sont dispersées sur plusieurs pages web avec un bruit massif, et (3) un grand nombre de pages web avec des contenus longs peuvent rapidement dépasser la longueur maximale de contexte des LLM. Inspirés par le processus cognitif humain pour résoudre ces problèmes, nous introduisons MindSearch pour imiter l'esprit humain dans la recherche et l'intégration d'informations sur le web, qui peut être instancié par un cadre multi-agent simple mais efficace basé sur les LLM. Le WebPlanner modélise l'esprit humain de recherche d'informations en plusieurs étapes comme un processus de construction de graphe dynamique : il décompose la requête de l'utilisateur en sous-questions atomiques comme des nœuds dans le graphe et étend progressivement le graphe en fonction des résultats de recherche du WebSearcher. Chargé de chaque sous-question, le WebSearcher effectue une récupération hiérarchique d'informations avec les moteurs de recherche et collecte des informations précieuses pour le WebPlanner. La conception multi-agent de MindSearch permet à l'ensemble du cadre de rechercher et d'intégrer des informations en parallèle à partir d'un plus grand nombre de pages web (par exemple, plus de 300) en 3 minutes, ce qui équivaut à 3 heures d'effort humain. MindSearch démontre une amélioration significative de la qualité des réponses en termes de profondeur et de largeur, sur des problèmes de questions-réponses (QA) à ensemble fermé et ouvert. De plus, les réponses de MindSearch basées sur InternLM2.5-7B sont préférées par les humains à celles des applications ChatGPT-Web et Perplexity.ai, ce qui implique que MindSearch peut déjà offrir une solution compétitive face aux moteurs de recherche IA propriétaires.
English
Information seeking and integration is a complex cognitive task that consumes
enormous time and effort. Inspired by the remarkable progress of Large Language
Models, recent works attempt to solve this task by combining LLMs and search
engines. However, these methods still obtain unsatisfying performance due to
three challenges: (1) complex requests often cannot be accurately and
completely retrieved by the search engine once (2) corresponding information to
be integrated is spread over multiple web pages along with massive noise, and
(3) a large number of web pages with long contents may quickly exceed the
maximum context length of LLMs. Inspired by the cognitive process when humans
solve these problems, we introduce MindSearch to mimic the human minds in web
information seeking and integration, which can be instantiated by a simple yet
effective LLM-based multi-agent framework. The WebPlanner models the human mind
of multi-step information seeking as a dynamic graph construction process: it
decomposes the user query into atomic sub-questions as nodes in the graph and
progressively extends the graph based on the search result from WebSearcher.
Tasked with each sub-question, WebSearcher performs hierarchical information
retrieval with search engines and collects valuable information for WebPlanner.
The multi-agent design of MindSearch enables the whole framework to seek and
integrate information parallelly from larger-scale (e.g., more than 300) web
pages in 3 minutes, which is worth 3 hours of human effort. MindSearch
demonstrates significant improvement in the response quality in terms of depth
and breadth, on both close-set and open-set QA problems. Besides, responses
from MindSearch based on InternLM2.5-7B are preferable by humans to ChatGPT-Web
and Perplexity.ai applications, which implies that MindSearch can already
deliver a competitive solution to the proprietary AI search engine.Summary
AI-Generated Summary