Cosa Piacciono ai Motori di Ricerca Generativi e Come Ottimizzare i Contenuti Web in Modo Collaborativo
What Generative Search Engines Like and How to Optimize Web Content Cooperatively
October 13, 2025
Autori: Yujiang Wu, Shanshan Zhong, Yubin Kim, Chenyan Xiong
cs.AI
Abstract
Utilizzando modelli linguistici di grandi dimensioni (LLM) per recuperare documenti e generare risposte in linguaggio naturale, i motori generativi, come Google AI Overview e ChatGPT, offrono esperienze utente significativamente migliorate e sono rapidamente diventati la nuova forma di ricerca. La loro rapida adozione ha anche stimolato la necessità di ottimizzazione per motori generativi (Generative Engine Optimization, GEO), poiché i fornitori di contenuti sono desiderosi di ottenere maggiore visibilità attraverso di essi. In questo articolo, introduciamo AutoGEO, un framework per apprendere automaticamente le preferenze dei motori generativi quando si utilizzano contenuti recuperati per la generazione di risposte e per riscrivere i contenuti web al fine di ottenere maggiore trazione. AutoGEO prima invita i LLM di frontiera a spiegare le preferenze dei motori generativi e a estrarre regole di preferenza significative da queste spiegazioni. Successivamente, utilizza le regole di preferenza come contesto di ingegneria per AutoGEO_API, un sistema GEO basato su prompt, e come ricompense basate su regole per addestrare AutoGEO_Mini, un modello GEO economicamente vantaggioso. Esperimenti condotti sul benchmark standard GEO-Bench e su due nuovi benchmark costruiti utilizzando query reali degli utenti dimostrano l'efficacia di AutoGEO nel migliorare la trazione dei contenuti preservando l'utilità della ricerca. Le analisi confermano la robustezza delle regole apprese e la loro capacità di catturare preferenze uniche in diversi domini, nonché la capacità dei sistemi AutoGEO di incorporarle nell'ottimizzazione dei contenuti. Il codice è rilasciato all'indirizzo https://github.com/cxcscmu/AutoGEO.
English
By employing large language models (LLMs) to retrieve documents and generate
natural language responses, Generative Engines, such as Google AI overview and
ChatGPT, provide significantly enhanced user experiences and have rapidly
become the new form of search. Their rapid adoption also drives the needs of
Generative Engine Optimization (GEO), as content providers are eager to gain
more traction from them. In this paper, we introduce AutoGEO, a framework to
automatically learn generative engine preferences when using retrieved contents
for response generation, and rewrite web contents for more such traction.
AutoGEO first prompts frontier LLMs to explain generative engine preferences
and extract meaningful preference rules from these explanations. Then it uses
preference rules as context engineering for AutoGEO_API, a
prompt-based GEO system, and as rule-based rewards to train
AutoGEO_Mini, a cost-effective GEO model. Experiments on the standard
GEO-Bench and two newly constructed benchmarks using real user queries
demonstrate the effectiveness of AutoGEO in enhancing content traction while
preserving search utility. Analyses confirm the learned rules' robustness and
abilities to capture unique preferences in variant domains, and AutoGEO
systems' ability to embed them in content optimization. The code is released at
https://github.com/cxcscmu/AutoGEO.