AgentRxiv : Vers une recherche autonome collaborative

papers.abstract

Les progrès dans la découverte scientifique résultent rarement d'un seul moment "Eurêka", mais sont plutôt le fruit de la collaboration progressive de centaines de scientifiques travaillant vers un objectif commun. Bien que les workflows d'agents existants soient capables de produire des recherches de manière autonome, ils le font de manière isolée, sans la capacité d'améliorer continuellement les résultats de recherches antérieures. Pour relever ces défis, nous présentons AgentRxiv - un cadre qui permet aux laboratoires d'agents LLM de télécharger et de récupérer des rapports depuis un serveur de prépublications partagé afin de collaborer, partager des insights et construire itérativement sur les recherches de chacun. Nous confions aux laboratoires d'agents la tâche de développer de nouvelles techniques de raisonnement et d'incitation, et constatons que les agents ayant accès à leurs recherches antérieures obtiennent de meilleures améliorations de performance par rapport aux agents opérant de manière isolée (amélioration relative de 11,4% par rapport à la base sur MATH-500). Nous observons que la stratégie la plus performante se généralise à des benchmarks dans d'autres domaines (amélioration moyenne de 3,3%). Plusieurs laboratoires d'agents partageant des recherches via AgentRxiv sont capables de travailler ensemble vers un objectif commun, progressant plus rapidement que les laboratoires isolés, et atteignant une précision globale plus élevée (amélioration relative de 13,7% par rapport à la base sur MATH-500). Ces résultats suggèrent que les agents autonomes pourraient jouer un rôle dans la conception des futurs systèmes d'IA aux côtés des humains. Nous espérons qu'AgentRxiv permettra aux agents de collaborer vers des objectifs de recherche et aux chercheurs d'accélérer la découverte.

English

Progress in scientific discovery is rarely the result of a single "Eureka" moment, but is rather the product of hundreds of scientists incrementally working together toward a common goal. While existing agent workflows are capable of producing research autonomously, they do so in isolation, without the ability to continuously improve upon prior research results. To address these challenges, we introduce AgentRxiv-a framework that lets LLM agent laboratories upload and retrieve reports from a shared preprint server in order to collaborate, share insights, and iteratively build on each other's research. We task agent laboratories to develop new reasoning and prompting techniques and find that agents with access to their prior research achieve higher performance improvements compared to agents operating in isolation (11.4% relative improvement over baseline on MATH-500). We find that the best performing strategy generalizes to benchmarks in other domains (improving on average by 3.3%). Multiple agent laboratories sharing research through AgentRxiv are able to work together towards a common goal, progressing more rapidly than isolated laboratories, achieving higher overall accuracy (13.7% relative improvement over baseline on MATH-500). These findings suggest that autonomous agents may play a role in designing future AI systems alongside humans. We hope that AgentRxiv allows agents to collaborate toward research goals and enables researchers to accelerate discovery.

AgentRxiv : Vers une recherche autonome collaborative

AgentRxiv: Towards Collaborative Autonomous Research

papers.abstract

Support