ChatPaper.aiChatPaper

Projeto Adaptativo de Kernel para Otimização Bayesiana é Fácil como Bolo com LLMs

Adaptive Kernel Design for Bayesian Optimization Is a Piece of CAKE with LLMs

September 22, 2025
Autores: Richard Cornelius Suwandi, Feng Yin, Juntao Wang, Renjie Li, Tsung-Hui Chang, Sergios Theodoridis
cs.AI

Resumo

A eficiência da otimização bayesiana (BO) depende fortemente da escolha do kernel do processo gaussiano (GP), que desempenha um papel central no equilíbrio entre exploração e exploração sob orçamentos limitados de avaliação. Métodos tradicionais de BO frequentemente dependem de estratégias fixas ou heurísticas para seleção de kernel, o que pode resultar em convergência lenta ou soluções subótimas quando o kernel escolhido é inadequado para a função objetivo subjacente. Para abordar essa limitação, propomos uma nova abordagem chamada Evolução de Kernel Consciente do Contexto (CAKE) para aprimorar a BO com modelos de linguagem de grande escala (LLMs). Especificamente, o CAKE utiliza LLMs como operadores de crossover e mutação para gerar e refinar kernels de GP de forma adaptativa com base nos dados observados ao longo do processo de otimização. Para maximizar o poder do CAKE, propomos ainda o Ranking de Kernel de Aquisição BIC (BAKER) para selecionar o kernel mais eficaz, equilibrando o ajuste do modelo medido pelo critério de informação bayesiano (BIC) com a melhoria esperada em cada iteração da BO. Experimentos extensivos demonstram que nosso novo método de BO baseado em CAKE supera consistentemente as abordagens estabelecidas em uma variedade de tarefas do mundo real, incluindo otimização de hiperparâmetros, ajuste de controladores e design de chips fotônicos. Nosso código está disponível publicamente em https://github.com/cake4bo/cake.
English
The efficiency of Bayesian optimization (BO) relies heavily on the choice of the Gaussian process (GP) kernel, which plays a central role in balancing exploration and exploitation under limited evaluation budgets. Traditional BO methods often rely on fixed or heuristic kernel selection strategies, which can result in slow convergence or suboptimal solutions when the chosen kernel is poorly suited to the underlying objective function. To address this limitation, we propose a freshly-baked Context-Aware Kernel Evolution (CAKE) to enhance BO with large language models (LLMs). Concretely, CAKE leverages LLMs as the crossover and mutation operators to adaptively generate and refine GP kernels based on the observed data throughout the optimization process. To maximize the power of CAKE, we further propose BIC-Acquisition Kernel Ranking (BAKER) to select the most effective kernel through balancing the model fit measured by the Bayesian information criterion (BIC) with the expected improvement at each iteration of BO. Extensive experiments demonstrate that our fresh CAKE-based BO method consistently outperforms established baselines across a range of real-world tasks, including hyperparameter optimization, controller tuning, and photonic chip design. Our code is publicly available at https://github.com/cake4bo/cake.
PDF12September 23, 2025