Qué les Gusta a los Motores de Búsqueda Generativos y Cómo Optimizar el Contenido Web de Manera Cooperativa
What Generative Search Engines Like and How to Optimize Web Content Cooperatively
October 13, 2025
Autores: Yujiang Wu, Shanshan Zhong, Yubin Kim, Chenyan Xiong
cs.AI
Resumen
Al emplear modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) para recuperar documentos y generar respuestas en lenguaje natural, los motores generativos, como Google AI Overview y ChatGPT, ofrecen experiencias de usuario significativamente mejoradas y se han convertido rápidamente en la nueva forma de búsqueda. Su rápida adopción también impulsa la necesidad de la Optimización de Motores Generativos (GEO, por sus siglas en inglés), ya que los proveedores de contenido están ansiosos por obtener mayor tracción a través de ellos. En este artículo, presentamos AutoGEO, un marco para aprender automáticamente las preferencias de los motores generativos al utilizar contenidos recuperados para la generación de respuestas y reescribir contenidos web para obtener mayor tracción. AutoGEO primero solicita a los LLMs de vanguardia que expliquen las preferencias de los motores generativos y extrae reglas de preferencia significativas de estas explicaciones. Luego, utiliza estas reglas de preferencia como ingeniería de contexto para AutoGEO_API, un sistema GEO basado en prompts, y como recompensas basadas en reglas para entrenar AutoGEO_Mini, un modelo GEO rentable. Los experimentos en el estándar GEO-Bench y dos nuevos benchmarks construidos utilizando consultas reales de usuarios demuestran la efectividad de AutoGEO para mejorar la tracción del contenido mientras se preserva la utilidad de la búsqueda. Los análisis confirman la robustez de las reglas aprendidas y su capacidad para capturar preferencias únicas en diversos dominios, así como la capacidad de los sistemas AutoGEO para integrarlas en la optimización de contenidos. El código se ha publicado en https://github.com/cxcscmu/AutoGEO.
English
By employing large language models (LLMs) to retrieve documents and generate
natural language responses, Generative Engines, such as Google AI overview and
ChatGPT, provide significantly enhanced user experiences and have rapidly
become the new form of search. Their rapid adoption also drives the needs of
Generative Engine Optimization (GEO), as content providers are eager to gain
more traction from them. In this paper, we introduce AutoGEO, a framework to
automatically learn generative engine preferences when using retrieved contents
for response generation, and rewrite web contents for more such traction.
AutoGEO first prompts frontier LLMs to explain generative engine preferences
and extract meaningful preference rules from these explanations. Then it uses
preference rules as context engineering for AutoGEO_API, a
prompt-based GEO system, and as rule-based rewards to train
AutoGEO_Mini, a cost-effective GEO model. Experiments on the standard
GEO-Bench and two newly constructed benchmarks using real user queries
demonstrate the effectiveness of AutoGEO in enhancing content traction while
preserving search utility. Analyses confirm the learned rules' robustness and
abilities to capture unique preferences in variant domains, and AutoGEO
systems' ability to embed them in content optimization. The code is released at
https://github.com/cxcscmu/AutoGEO.