ChatPaper.aiChatPaper

PageGuide: Estensione del browser per aiutare gli utenti a navigare una pagina web e individuare le informazioni.

PageGuide: Browser extension to assist users in navigating a webpage and locating information

April 26, 2026
Autori: Tin Nguyen, Thang T. Truong, Runtao Zhou, Trung Bui, Chirag Agarwal, Anh Totti Nguyen
cs.AI

Abstract

Gli utenti che navigano quotidianamente sul web faticano a individuare rapidamente informazioni rilevanti in pagine disordinate, a completare attività complesse e poco familiari e a mantenere la concentrazione tra contenuti distraenti. I moderni assistenti IA (ad es. ChatGPT, Gemini, Claude) e agenti browser (ad es. OpenAI Operator, Browser Use) possono rispondere a domande e automatizzare azioni, ma restituiscono risultati senza mostrare l'origine delle informazioni sulla pagina, costringendo gli utenti a verificare manualmente i risultati e a fidarsi ciecamente di ogni passaggio automatizzato. Presentiamo PageGuide, un'estensione browser che ancora le risposte degli LLM direttamente nel DOM HTML tramite overlay visivi, affrontando tre esigenze fondamentali: (a) Trovare - individuare ed evidenziare evidenze contestuali in modo che gli utenti possano verificare istantaneamente le risposte; (b) Guidare - mostrare istruzioni passo-passo (es. come cambiare password) una alla volta per consentire agli utenti di eseguire autonomamente le azioni; (c) Nascondere - offrire la possibilità di oscurare contenuti distraenti, lasciando all'utente la scelta finale. In uno studio utenti (N=94), PageGuide ha superato la navigazione non assistita in tutte le modalità: l'accuratezza in Nascondere è migliorata di 26 punti percentuali (+86,7%) con un calo del 70% nei tempi di completamento; la percentuale di successo in Guidare è aumentata di 30 punti; Trovare ha ridotto lo sforzo di ricerca manuale, con un utilizzo di Ctrl+F diminuito dell'80% e tempi di attività ridotti del 19%. Codice e demo su: pageguide.github.io.
English
Users browsing the web daily struggle to quickly locate relevant information in cluttered pages, complete unfamiliar multi-step tasks, and stay focused amid distracting content. State-of-the-art AI assistants (e.g., ChatGPT, Gemini, Claude) and browser agents (e.g., OpenAI Operator, Browser Use) can answer questions and automate actions, yet they return answers without showing where the information comes from on the page, forcing users to manually verify results and blindly trust every automated steps. We present PageGuide, a browser extension that grounds LLM answers directly in the HTML DOM via visual overlays, addressing three core user needs: (a) Find-locating and highlighting relevant evidence in-situ so users can instantly verify answers on the page; (b) Guide-showing step-by-step instructions (e.g. how to change password) one at a time so users can follow and perform actions by themselves; and (c) Hide-hiding distracting content-giving users a chance to decide to hide an element or not. In a user study (N=94), PageGuide outperform unaided browsing across all modes: Hide accuracy improve by 26 percentage points (86.7% relative gain) and task completion time drops by 70%; Guide completion rate increases by 30 percentage points; and Find reduces manual search effort, with Ctrl+F usage falling by 80% and task time decreasing by 19%. Code and demo is at: pageguide.github.io.
PDF42April 29, 2026