ChatPaper.aiChatPaper

Ce que les moteurs de recherche génératifs apprécient et comment optimiser le contenu web de manière collaborative

What Generative Search Engines Like and How to Optimize Web Content Cooperatively

October 13, 2025
papers.authors: Yujiang Wu, Shanshan Zhong, Yubin Kim, Chenyan Xiong
cs.AI

papers.abstract

En utilisant des modèles de langage de grande taille (LLMs) pour récupérer des documents et générer des réponses en langage naturel, les moteurs génératifs, tels que Google AI Overview et ChatGPT, offrent une expérience utilisateur considérablement améliorée et sont rapidement devenus la nouvelle forme de recherche. Leur adoption rapide stimule également les besoins en optimisation des moteurs génératifs (Generative Engine Optimization, GEO), car les fournisseurs de contenu cherchent à obtenir une plus grande visibilité grâce à eux. Dans cet article, nous présentons AutoGEO, un cadre permettant d'apprendre automatiquement les préférences des moteurs génératifs lors de l'utilisation de contenus récupérés pour la génération de réponses, et de réécrire les contenus web pour accroître cette visibilité. AutoGEO commence par solliciter des LLMs de pointe pour expliquer les préférences des moteurs génératifs et extraire des règles de préférence significatives à partir de ces explications. Ensuite, il utilise ces règles de préférence comme ingénierie contextuelle pour AutoGEO_API, un système GEO basé sur des prompts, et comme récompenses basées sur des règles pour entraîner AutoGEO_Mini, un modèle GEO économique. Des expériences sur le benchmark standard GEO-Bench et deux nouveaux benchmarks construits à partir de requêtes réelles d'utilisateurs démontrent l'efficacité d'AutoGEO à améliorer la visibilité des contenus tout en préservant l'utilité de la recherche. Les analyses confirment la robustesse des règles apprises et leur capacité à capturer des préférences uniques dans divers domaines, ainsi que la capacité des systèmes AutoGEO à les intégrer dans l'optimisation des contenus. Le code est disponible à l'adresse https://github.com/cxcscmu/AutoGEO.
English
By employing large language models (LLMs) to retrieve documents and generate natural language responses, Generative Engines, such as Google AI overview and ChatGPT, provide significantly enhanced user experiences and have rapidly become the new form of search. Their rapid adoption also drives the needs of Generative Engine Optimization (GEO), as content providers are eager to gain more traction from them. In this paper, we introduce AutoGEO, a framework to automatically learn generative engine preferences when using retrieved contents for response generation, and rewrite web contents for more such traction. AutoGEO first prompts frontier LLMs to explain generative engine preferences and extract meaningful preference rules from these explanations. Then it uses preference rules as context engineering for AutoGEO_API, a prompt-based GEO system, and as rule-based rewards to train AutoGEO_Mini, a cost-effective GEO model. Experiments on the standard GEO-Bench and two newly constructed benchmarks using real user queries demonstrate the effectiveness of AutoGEO in enhancing content traction while preserving search utility. Analyses confirm the learned rules' robustness and abilities to capture unique preferences in variant domains, and AutoGEO systems' ability to embed them in content optimization. The code is released at https://github.com/cxcscmu/AutoGEO.
PDF103October 16, 2025