ChatPaper.aiChatPaper

Cosa Piacciono ai Motori di Ricerca Generativi e Come Ottimizzare i Contenuti Web in Modo Collaborativo

What Generative Search Engines Like and How to Optimize Web Content Cooperatively

October 13, 2025
Autori: Yujiang Wu, Shanshan Zhong, Yubin Kim, Chenyan Xiong
cs.AI

Abstract

Utilizzando modelli linguistici di grandi dimensioni (LLM) per recuperare documenti e generare risposte in linguaggio naturale, i motori generativi, come Google AI Overview e ChatGPT, offrono esperienze utente significativamente migliorate e sono rapidamente diventati la nuova forma di ricerca. La loro rapida adozione ha anche stimolato la necessità di ottimizzazione per motori generativi (Generative Engine Optimization, GEO), poiché i fornitori di contenuti sono desiderosi di ottenere maggiore visibilità attraverso di essi. In questo articolo, introduciamo AutoGEO, un framework per apprendere automaticamente le preferenze dei motori generativi quando si utilizzano contenuti recuperati per la generazione di risposte e per riscrivere i contenuti web al fine di ottenere maggiore trazione. AutoGEO prima invita i LLM di frontiera a spiegare le preferenze dei motori generativi e a estrarre regole di preferenza significative da queste spiegazioni. Successivamente, utilizza le regole di preferenza come contesto di ingegneria per AutoGEO_API, un sistema GEO basato su prompt, e come ricompense basate su regole per addestrare AutoGEO_Mini, un modello GEO economicamente vantaggioso. Esperimenti condotti sul benchmark standard GEO-Bench e su due nuovi benchmark costruiti utilizzando query reali degli utenti dimostrano l'efficacia di AutoGEO nel migliorare la trazione dei contenuti preservando l'utilità della ricerca. Le analisi confermano la robustezza delle regole apprese e la loro capacità di catturare preferenze uniche in diversi domini, nonché la capacità dei sistemi AutoGEO di incorporarle nell'ottimizzazione dei contenuti. Il codice è rilasciato all'indirizzo https://github.com/cxcscmu/AutoGEO.
English
By employing large language models (LLMs) to retrieve documents and generate natural language responses, Generative Engines, such as Google AI overview and ChatGPT, provide significantly enhanced user experiences and have rapidly become the new form of search. Their rapid adoption also drives the needs of Generative Engine Optimization (GEO), as content providers are eager to gain more traction from them. In this paper, we introduce AutoGEO, a framework to automatically learn generative engine preferences when using retrieved contents for response generation, and rewrite web contents for more such traction. AutoGEO first prompts frontier LLMs to explain generative engine preferences and extract meaningful preference rules from these explanations. Then it uses preference rules as context engineering for AutoGEO_API, a prompt-based GEO system, and as rule-based rewards to train AutoGEO_Mini, a cost-effective GEO model. Experiments on the standard GEO-Bench and two newly constructed benchmarks using real user queries demonstrate the effectiveness of AutoGEO in enhancing content traction while preserving search utility. Analyses confirm the learned rules' robustness and abilities to capture unique preferences in variant domains, and AutoGEO systems' ability to embed them in content optimization. The code is released at https://github.com/cxcscmu/AutoGEO.
PDF103October 16, 2025