Wat Generatieve Zoekmachines Leuk Vinden en Hoe Webinhoud Samenwerkend te Optimaliseren
What Generative Search Engines Like and How to Optimize Web Content Cooperatively
October 13, 2025
Auteurs: Yujiang Wu, Shanshan Zhong, Yubin Kim, Chenyan Xiong
cs.AI
Samenvatting
Door grote taalmodellen (LLM's) in te zetten voor het ophalen van documenten en het genereren van natuurlijke taalreacties, bieden Generative Engines, zoals Google AI-overzicht en ChatGPT, aanzienlijk verbeterde gebruikerservaringen en zijn ze snel uitgegroeid tot de nieuwe vorm van zoeken. Hun snelle adoptie drijft ook de behoefte aan Generative Engine Optimization (GEO), aangezien contentaanbieders graag meer aandacht willen genereren via deze systemen. In dit artikel introduceren we AutoGEO, een raamwerk om automatisch de voorkeuren van generative engines te leren wanneer opgehaalde inhoud wordt gebruikt voor het genereren van reacties, en om webinhoud te herschrijven voor meer van dergelijke aandacht. AutoGEO vraagt eerst geavanceerde LLM's om de voorkeuren van generative engines uit te leggen en haalt betekenisvolle voorkeursregels uit deze uitleg. Vervolgens gebruikt het deze voorkeursregels als contextengineering voor AutoGEO_API, een op prompts gebaseerd GEO-systeem, en als regelgebaseerde beloningen om AutoGEO_Mini te trainen, een kosteneffectief GEO-model. Experimenten op de standaard GEO-Bench en twee nieuw geconstrueerde benchmarks met echte gebruikersquery's tonen de effectiviteit van AutoGEO aan in het vergroten van de aandacht voor inhoud terwijl de zoeknut behouden blijft. Analyses bevestigen de robuustheid van de geleerde regels en hun vermogen om unieke voorkeuren in verschillende domeinen vast te leggen, evenals het vermogen van AutoGEO-systemen om deze in contentoptimalisatie te integreren. De code is vrijgegeven op https://github.com/cxcscmu/AutoGEO.
English
By employing large language models (LLMs) to retrieve documents and generate
natural language responses, Generative Engines, such as Google AI overview and
ChatGPT, provide significantly enhanced user experiences and have rapidly
become the new form of search. Their rapid adoption also drives the needs of
Generative Engine Optimization (GEO), as content providers are eager to gain
more traction from them. In this paper, we introduce AutoGEO, a framework to
automatically learn generative engine preferences when using retrieved contents
for response generation, and rewrite web contents for more such traction.
AutoGEO first prompts frontier LLMs to explain generative engine preferences
and extract meaningful preference rules from these explanations. Then it uses
preference rules as context engineering for AutoGEO_API, a
prompt-based GEO system, and as rule-based rewards to train
AutoGEO_Mini, a cost-effective GEO model. Experiments on the standard
GEO-Bench and two newly constructed benchmarks using real user queries
demonstrate the effectiveness of AutoGEO in enhancing content traction while
preserving search utility. Analyses confirm the learned rules' robustness and
abilities to capture unique preferences in variant domains, and AutoGEO
systems' ability to embed them in content optimization. The code is released at
https://github.com/cxcscmu/AutoGEO.