MindSearch : Imiter les esprits humains pour susciter une recherche IA approfondie

papers.abstract

La recherche et l'intégration d'informations constituent une tâche cognitive complexe qui consomme un temps et un effort considérables. Inspirés par les progrès remarquables des modèles de langage de grande taille (LLM), des travaux récents tentent de résoudre cette tâche en combinant les LLM et les moteurs de recherche. Cependant, ces méthodes obtiennent encore des performances insatisfaisantes en raison de trois défis : (1) les requêtes complexes ne peuvent souvent pas être récupérées de manière précise et complète par le moteur de recherche en une seule fois, (2) les informations correspondantes à intégrer sont dispersées sur plusieurs pages web avec un bruit massif, et (3) un grand nombre de pages web avec des contenus longs peuvent rapidement dépasser la longueur maximale de contexte des LLM. Inspirés par le processus cognitif humain pour résoudre ces problèmes, nous introduisons MindSearch pour imiter l'esprit humain dans la recherche et l'intégration d'informations sur le web, qui peut être instancié par un cadre multi-agent simple mais efficace basé sur les LLM. Le WebPlanner modélise l'esprit humain de recherche d'informations en plusieurs étapes comme un processus de construction de graphe dynamique : il décompose la requête de l'utilisateur en sous-questions atomiques comme des nœuds dans le graphe et étend progressivement le graphe en fonction des résultats de recherche du WebSearcher. Chargé de chaque sous-question, le WebSearcher effectue une récupération hiérarchique d'informations avec les moteurs de recherche et collecte des informations précieuses pour le WebPlanner. La conception multi-agent de MindSearch permet à l'ensemble du cadre de rechercher et d'intégrer des informations en parallèle à partir d'un plus grand nombre de pages web (par exemple, plus de 300) en 3 minutes, ce qui équivaut à 3 heures d'effort humain. MindSearch démontre une amélioration significative de la qualité des réponses en termes de profondeur et de largeur, sur des problèmes de questions-réponses (QA) à ensemble fermé et ouvert. De plus, les réponses de MindSearch basées sur InternLM2.5-7B sont préférées par les humains à celles des applications ChatGPT-Web et Perplexity.ai, ce qui implique que MindSearch peut déjà offrir une solution compétitive face aux moteurs de recherche IA propriétaires.

English

Information seeking and integration is a complex cognitive task that consumes enormous time and effort. Inspired by the remarkable progress of Large Language Models, recent works attempt to solve this task by combining LLMs and search engines. However, these methods still obtain unsatisfying performance due to three challenges: (1) complex requests often cannot be accurately and completely retrieved by the search engine once (2) corresponding information to be integrated is spread over multiple web pages along with massive noise, and (3) a large number of web pages with long contents may quickly exceed the maximum context length of LLMs. Inspired by the cognitive process when humans solve these problems, we introduce MindSearch to mimic the human minds in web information seeking and integration, which can be instantiated by a simple yet effective LLM-based multi-agent framework. The WebPlanner models the human mind of multi-step information seeking as a dynamic graph construction process: it decomposes the user query into atomic sub-questions as nodes in the graph and progressively extends the graph based on the search result from WebSearcher. Tasked with each sub-question, WebSearcher performs hierarchical information retrieval with search engines and collects valuable information for WebPlanner. The multi-agent design of MindSearch enables the whole framework to seek and integrate information parallelly from larger-scale (e.g., more than 300) web pages in 3 minutes, which is worth 3 hours of human effort. MindSearch demonstrates significant improvement in the response quality in terms of depth and breadth, on both close-set and open-set QA problems. Besides, responses from MindSearch based on InternLM2.5-7B are preferable by humans to ChatGPT-Web and Perplexity.ai applications, which implies that MindSearch can already deliver a competitive solution to the proprietary AI search engine.

MindSearch : Imiter les esprits humains pour susciter une recherche IA approfondie

MindSearch: Mimicking Human Minds Elicits Deep AI Searcher

papers.abstract

Support