PageGuide: Browseruitbreiding om gebruikers te helpen bij het navigeren op een webpagina en het vinden van informatie
PageGuide: Browser extension to assist users in navigating a webpage and locating information
April 26, 2026
Auteurs: Tin Nguyen, Thang T. Truong, Runtao Zhou, Trung Bui, Chirag Agarwal, Anh Totti Nguyen
cs.AI
Samenvatting
Dagelijkse internetgebruikers worstelen om snel relevante informatie te vinden op rommelige pagina's, onbekende meerstappentaken uit te voeren en gefocust te blijven tussen afleidende content. Geavanceerde AI-assistenten (zoals ChatGPT, Gemini, Claude) en browseragents (zoals OpenAI Operator, Browser Use) kunnen weliswaar vragen beantwoorden en handelingen automatiseren, maar zij presenteren antwoorden zonder te tonen waar de informatie op de pagina vandaan komt. Dit dwingt gebruikers om resultaten handmatig te verifiëren en elke geautomatiseerde stap blindelings te vertrouwen. Wij presenteren PageGuide, een browserextensie die LLM-antwoorden direct verankert in de HTML-DOM via visuele overlays, waarmee drie kernbehoeften worden aangepakt: (a) Vinden - het lokaliseren en markeren van relevant bewijsmateriaal *in-situ*, zodat gebruikers antwoorden direct op de pagina kunnen verifiëren; (b) Gidsen - het tonen van stap-voor-stap instructies (bijv. voor het wijzigen van een wachtwoord) één voor één, zodat gebruikers handelingen zelf kunnen uitvoeren; en (c) Verbergen - het verbergen van afleidende content, waarbij gebruikers de keuze krijgen om een element al dan niet te verbergen. In een gebruikersstudie (N=94) presteerde PageGuide beter dan ongeassisteerd browsen in alle modi: de nauwkeurigheid bij Verbergen steeg met 26 procentpunten (een relatieve verbetering van 86,7%) en de taaktijd daalde met 70%; het slagingspercentage bij Gidsen nam toe met 30 procentpunten; en bij Vinden nam de zoekinspanning af, met een daling van 80% in Ctrl+F-gebruik en een afname van 19% in taaktijd. Code en demo zijn beschikbaar op: pageguide.github.io.
English
Users browsing the web daily struggle to quickly locate relevant information in cluttered pages, complete unfamiliar multi-step tasks, and stay focused amid distracting content. State-of-the-art AI assistants (e.g., ChatGPT, Gemini, Claude) and browser agents (e.g., OpenAI Operator, Browser Use) can answer questions and automate actions, yet they return answers without showing where the information comes from on the page, forcing users to manually verify results and blindly trust every automated steps. We present PageGuide, a browser extension that grounds LLM answers directly in the HTML DOM via visual overlays, addressing three core user needs: (a) Find-locating and highlighting relevant evidence in-situ so users can instantly verify answers on the page; (b) Guide-showing step-by-step instructions (e.g. how to change password) one at a time so users can follow and perform actions by themselves; and (c) Hide-hiding distracting content-giving users a chance to decide to hide an element or not. In a user study (N=94), PageGuide outperform unaided browsing across all modes: Hide accuracy improve by 26 percentage points (86.7% relative gain) and task completion time drops by 70%; Guide completion rate increases by 30 percentage points; and Find reduces manual search effort, with Ctrl+F usage falling by 80% and task time decreasing by 19%. Code and demo is at: pageguide.github.io.