Что предпочитают генеративные поисковые системы и как оптимизировать веб-контент совместно
What Generative Search Engines Like and How to Optimize Web Content Cooperatively
October 13, 2025
Авторы: Yujiang Wu, Shanshan Zhong, Yubin Kim, Chenyan Xiong
cs.AI
Аннотация
Используя большие языковые модели (LLMs) для извлечения документов и генерации естественно-языковых ответов, генеративные движки, такие как Google AI Overview и ChatGPT, значительно улучшают пользовательский опыт и быстро становятся новой формой поиска. Их стремительное внедрение также стимулирует потребность в оптимизации для генеративных движков (Generative Engine Optimization, GEO), поскольку поставщики контента стремятся получить больше внимания с их помощью. В данной статье мы представляем AutoGEO — фреймворк для автоматического изучения предпочтений генеративных движков при использовании извлеченного контента для генерации ответов и переписывания веб-контента для повышения его привлекательности. AutoGEO сначала запрашивает передовые LLM для объяснения предпочтений генеративных движков и извлекает значимые правила предпочтений из этих объяснений. Затем он использует эти правила как контекстную инженерию для AutoGEO_API — системы GEO на основе промптов, и как основанные на правилах награды для обучения AutoGEO_Mini — экономически эффективной модели GEO. Эксперименты на стандартном GEO-Bench и двух новых бенчмарках, созданных с использованием реальных пользовательских запросов, демонстрируют эффективность AutoGEO в повышении привлекательности контента при сохранении полезности поиска. Анализ подтверждает устойчивость изученных правил и их способность учитывать уникальные предпочтения в различных доменах, а также способность систем AutoGEO внедрять их в оптимизацию контента. Код доступен по адресу https://github.com/cxcscmu/AutoGEO.
English
By employing large language models (LLMs) to retrieve documents and generate
natural language responses, Generative Engines, such as Google AI overview and
ChatGPT, provide significantly enhanced user experiences and have rapidly
become the new form of search. Their rapid adoption also drives the needs of
Generative Engine Optimization (GEO), as content providers are eager to gain
more traction from them. In this paper, we introduce AutoGEO, a framework to
automatically learn generative engine preferences when using retrieved contents
for response generation, and rewrite web contents for more such traction.
AutoGEO first prompts frontier LLMs to explain generative engine preferences
and extract meaningful preference rules from these explanations. Then it uses
preference rules as context engineering for AutoGEO_API, a
prompt-based GEO system, and as rule-based rewards to train
AutoGEO_Mini, a cost-effective GEO model. Experiments on the standard
GEO-Bench and two newly constructed benchmarks using real user queries
demonstrate the effectiveness of AutoGEO in enhancing content traction while
preserving search utility. Analyses confirm the learned rules' robustness and
abilities to capture unique preferences in variant domains, and AutoGEO
systems' ability to embed them in content optimization. The code is released at
https://github.com/cxcscmu/AutoGEO.