ChatPaper.aiChatPaper

Surfer-H se encuentra con Holo1: Agente web eficiente en costos impulsado por pesos abiertos

Surfer-H Meets Holo1: Cost-Efficient Web Agent Powered by Open Weights

June 3, 2025
Autores: Mathieu Andreux, Breno Baldas Skuk, Hamza Benchekroun, Emilien Biré, Antoine Bonnet, Riaz Bordie, Matthias Brunel, Pierre-Louis Cedoz, Antoine Chassang, Mickaël Chen, Alexandra D. Constantinou, Antoine d'Andigné, Hubert de La Jonquière, Aurélien Delfosse, Ludovic Denoyer, Alexis Deprez, Augustin Derupti, Michael Eickenberg, Mathïs Federico, Charles Kantor, Xavier Koegler, Yann Labbé, Matthew C. H. Lee, Erwan Le Jumeau de Kergaradec, Amir Mahla, Avshalom Manevich, Adrien Maret, Charles Masson, Rafaël Maurin, Arturo Mena, Philippe Modard, Axel Moyal, Axel Nguyen Kerbel, Julien Revelle, Mats L. Richter, María Santos, Laurent Sifre, Maxime Theillard, Marc Thibault, Louis Thiry, Léo Tronchon, Nicolas Usunier, Tony Wu
cs.AI

Resumen

Presentamos Surfer-H, un agente web eficiente en costos que integra Modelos de Visión-Lenguaje (VLM) para realizar tareas definidas por el usuario en la web. Lo combinamos con Holo1, una nueva colección de VLMs de pesos abiertos especializada en navegación web y extracción de información. Holo1 fue entrenado con fuentes de datos cuidadosamente seleccionadas, que incluyen contenido web de acceso abierto, ejemplos sintéticos y datos agenticos autogenerados. Holo1 lidera los benchmarks generalistas de Interfaz de Usuario (UI), así como nuestro nuevo benchmark de localización de UI web, WebClick. Cuando es impulsado por Holo1, Surfer-H alcanza un rendimiento de vanguardia del 92.2% en WebVoyager, logrando un equilibrio Pareto-óptimo entre precisión y eficiencia en costos. Para acelerar el avance de la investigación en sistemas agenticos, estamos liberando tanto nuestro conjunto de datos de evaluación WebClick como los pesos del modelo Holo1.
English
We present Surfer-H, a cost-efficient web agent that integrates Vision-Language Models (VLM) to perform user-defined tasks on the web. We pair it with Holo1, a new open-weight collection of VLMs specialized in web navigation and information extraction. Holo1 was trained on carefully curated data sources, including open-access web content, synthetic examples, and self-produced agentic data. Holo1 tops generalist User Interface (UI) benchmarks as well as our new web UI localization benchmark, WebClick. When powered by Holo1, Surfer-H achieves a 92.2% state-of-the-art performance on WebVoyager, striking a Pareto-optimal balance between accuracy and cost-efficiency. To accelerate research advancement in agentic systems, we are open-sourcing both our WebClick evaluation dataset and the Holo1 model weights.
PDF272June 6, 2025