ChatPaper.aiChatPaper

O que os Mecanismos de Busca Generativos Preferem e Como Otimizar o Conteúdo da Web de Forma Cooperativa

What Generative Search Engines Like and How to Optimize Web Content Cooperatively

October 13, 2025
Autores: Yujiang Wu, Shanshan Zhong, Yubin Kim, Chenyan Xiong
cs.AI

Resumo

Ao empregar modelos de linguagem de grande escala (LLMs) para recuperar documentos e gerar respostas em linguagem natural, os Motores Gerativos, como o Google AI Overview e o ChatGPT, oferecem experiências de usuário significativamente aprimoradas e rapidamente se tornaram a nova forma de busca. Sua rápida adoção também impulsiona a necessidade de Otimização de Motores Gerativos (Generative Engine Optimization - GEO), já que os provedores de conteúdo estão ansiosos para obter maior visibilidade por meio deles. Neste artigo, apresentamos o AutoGEO, uma estrutura para aprender automaticamente as preferências dos motores gerativos ao usar conteúdos recuperados para a geração de respostas e reescrever conteúdos da web para obter maior visibilidade. O AutoGEO primeiro solicita que LLMs de ponta expliquem as preferências dos motores gerativos e extrai regras de preferência significativas dessas explicações. Em seguida, utiliza essas regras de preferência como engenharia de contexto para o AutoGEO_API, um sistema GEO baseado em prompts, e como recompensas baseadas em regras para treinar o AutoGEO_Mini, um modelo GEO de baixo custo. Experimentos no GEO-Bench padrão e em dois novos benchmarks construídos com consultas reais de usuários demonstram a eficácia do AutoGEO em aumentar a visibilidade do conteúdo enquanto preserva a utilidade da busca. Análises confirmam a robustez das regras aprendidas e sua capacidade de capturar preferências únicas em diferentes domínios, bem como a capacidade dos sistemas AutoGEO de incorporá-las na otimização de conteúdo. O código está disponível em https://github.com/cxcscmu/AutoGEO.
English
By employing large language models (LLMs) to retrieve documents and generate natural language responses, Generative Engines, such as Google AI overview and ChatGPT, provide significantly enhanced user experiences and have rapidly become the new form of search. Their rapid adoption also drives the needs of Generative Engine Optimization (GEO), as content providers are eager to gain more traction from them. In this paper, we introduce AutoGEO, a framework to automatically learn generative engine preferences when using retrieved contents for response generation, and rewrite web contents for more such traction. AutoGEO first prompts frontier LLMs to explain generative engine preferences and extract meaningful preference rules from these explanations. Then it uses preference rules as context engineering for AutoGEO_API, a prompt-based GEO system, and as rule-based rewards to train AutoGEO_Mini, a cost-effective GEO model. Experiments on the standard GEO-Bench and two newly constructed benchmarks using real user queries demonstrate the effectiveness of AutoGEO in enhancing content traction while preserving search utility. Analyses confirm the learned rules' robustness and abilities to capture unique preferences in variant domains, and AutoGEO systems' ability to embed them in content optimization. The code is released at https://github.com/cxcscmu/AutoGEO.
PDF103October 16, 2025