생성형 검색 엔진의 선호와 웹 콘텐츠 최적화 방안 협력적 접근
What Generative Search Engines Like and How to Optimize Web Content Cooperatively
October 13, 2025
저자: Yujiang Wu, Shanshan Zhong, Yubin Kim, Chenyan Xiong
cs.AI
초록
대규모 언어 모델(LLMs)을 활용하여 문서를 검색하고 자연어 응답을 생성함으로써, Google AI 개요 및 ChatGPT와 같은 생성형 엔진은 사용자 경험을 크게 향상시키며 빠르게 새로운 형태의 검색 방식으로 자리 잡고 있다. 이러한 빠른 채택은 생성형 엔진 최적화(Generative Engine Optimization, GEO)의 필요성을 촉진하고 있으며, 콘텐츠 제공자들은 이를 통해 더 많은 관심을 얻고자 한다. 본 논문에서는 검색된 콘텐츠를 응답 생성에 사용할 때 생성형 엔진의 선호도를 자동으로 학습하고, 웹 콘텐츠를 재작성하여 더 많은 관심을 끌기 위한 프레임워크인 AutoGEO를 소개한다. AutoGEO는 먼저 최신 LLMs에 생성형 엔진의 선호도를 설명하도록 요청하고, 이러한 설명에서 의미 있는 선호도 규칙을 추출한다. 그런 다음, 이러한 선호도 규칙을 AutoGEO_API라는 프롬프트 기반 GEO 시스템의 컨텍스트 엔지니어링으로 사용하고, AutoGEO_Mini라는 비용 효율적인 GEO 모델을 훈련하기 위한 규칙 기반 보상으로 활용한다. 표준 GEO-Bench와 실제 사용자 쿼리를 사용하여 새롭게 구축한 두 벤치마크에서의 실험은 AutoGEO가 검색 유틸리티를 보존하면서 콘텐츠 관심도를 향상시키는 데 효과적임을 입증한다. 분석 결과, 학습된 규칙의 견고성과 다양한 도메인에서의 독특한 선호도를 포착하는 능력, 그리고 AutoGEO 시스템이 이러한 규칙을 콘텐츠 최적화에 내재화하는 능력이 확인되었다. 코드는 https://github.com/cxcscmu/AutoGEO에서 공개되었다.
English
By employing large language models (LLMs) to retrieve documents and generate
natural language responses, Generative Engines, such as Google AI overview and
ChatGPT, provide significantly enhanced user experiences and have rapidly
become the new form of search. Their rapid adoption also drives the needs of
Generative Engine Optimization (GEO), as content providers are eager to gain
more traction from them. In this paper, we introduce AutoGEO, a framework to
automatically learn generative engine preferences when using retrieved contents
for response generation, and rewrite web contents for more such traction.
AutoGEO first prompts frontier LLMs to explain generative engine preferences
and extract meaningful preference rules from these explanations. Then it uses
preference rules as context engineering for AutoGEO_API, a
prompt-based GEO system, and as rule-based rewards to train
AutoGEO_Mini, a cost-effective GEO model. Experiments on the standard
GEO-Bench and two newly constructed benchmarks using real user queries
demonstrate the effectiveness of AutoGEO in enhancing content traction while
preserving search utility. Analyses confirm the learned rules' robustness and
abilities to capture unique preferences in variant domains, and AutoGEO
systems' ability to embed them in content optimization. The code is released at
https://github.com/cxcscmu/AutoGEO.