ChatPaper.aiChatPaper

PageGuide: Extensão de navegador para auxiliar usuários na navegação de páginas web e localização de informações

PageGuide: Browser extension to assist users in navigating a webpage and locating information

April 26, 2026
Autores: Tin Nguyen, Thang T. Truong, Runtao Zhou, Trung Bui, Chirag Agarwal, Anh Totti Nguyen
cs.AI

Resumo

Os utilizadores que navegam diariamente na web enfrentam dificuldades em localizar rapidamente informações relevantes em páginas desorganizadas, completar tarefas multi-etapa desconhecidas e manter o foco em meio a conteúdos distractivos. Os assistentes de IA de última geração (ex: ChatGPT, Gemini, Claude) e agentes de navegador (ex: OpenAI Operator, Browser Use) podem responder a perguntas e automatizar ações, mas devolvem respostas sem mostrar a origem da informação na página, forçando os utilizadores a verificar manualmente os resultados e a confiar cegamente em cada passo automatizado. Apresentamos o PageGuide, uma extensão de navegador que ancora as respostas de LLM diretamente no DOM HTML através de sobreposições visuais, abordando três necessidades centrais dos utilizadores: (a) Localizar - identificar e destacar evidências relevantes in-situ para que os utilizadores possam verificar instantaneamente as respostas na página; (b) Guiar - mostrar instruções passo a passo (ex: como alterar a palavra-passe) uma de cada vez para que os utilizadores possam seguir e executar ações autonomamente; e (c) Ocultar - esconder conteúdos distractivos, dando aos utilizadores a opção de decidir ocultar um elemento ou não. Num estudo com utilizadores (N=94), o PageGuide superou a navegação não assistida em todos os modos: a precisão de Ocultar melhorou 26 pontos percentuais (ganho relativo de 86,7%) e o tempo de conclusão de tarefas reduziu 70%; a taxa de conclusão de Guiar aumentou 30 pontos percentuais; e Localizar reduziu o esforço de pesquisa manual, com o uso de Ctrl+F a diminuir 80% e o tempo de tarefa a reduzir 19%. Código e demonstração disponíveis em: pageguide.github.io.
English
Users browsing the web daily struggle to quickly locate relevant information in cluttered pages, complete unfamiliar multi-step tasks, and stay focused amid distracting content. State-of-the-art AI assistants (e.g., ChatGPT, Gemini, Claude) and browser agents (e.g., OpenAI Operator, Browser Use) can answer questions and automate actions, yet they return answers without showing where the information comes from on the page, forcing users to manually verify results and blindly trust every automated steps. We present PageGuide, a browser extension that grounds LLM answers directly in the HTML DOM via visual overlays, addressing three core user needs: (a) Find-locating and highlighting relevant evidence in-situ so users can instantly verify answers on the page; (b) Guide-showing step-by-step instructions (e.g. how to change password) one at a time so users can follow and perform actions by themselves; and (c) Hide-hiding distracting content-giving users a chance to decide to hide an element or not. In a user study (N=94), PageGuide outperform unaided browsing across all modes: Hide accuracy improve by 26 percentage points (86.7% relative gain) and task completion time drops by 70%; Guide completion rate increases by 30 percentage points; and Find reduces manual search effort, with Ctrl+F usage falling by 80% and task time decreasing by 19%. Code and demo is at: pageguide.github.io.
PDF42April 29, 2026