La combinaison des grands modèles de langage avec les algorithmes évolutionnaires produit des optimiseurs de prompts puissants.

papers.abstract

Les modèles de langage de grande taille (LLMs) excellent dans diverses tâches, mais ils dépendent de prompts soigneusement conçus qui nécessitent souvent un effort humain considérable. Pour automatiser ce processus, nous proposons dans cet article un nouveau cadre d'optimisation discrète des prompts, appelé EvoPrompt, qui s'inspire des algorithmes évolutionnaires (EAs) en raison de leurs bonnes performances et de leur convergence rapide. Pour permettre aux EAs de fonctionner sur des prompts discrets, qui sont des expressions en langage naturel devant être cohérentes et lisibles par l'homme, nous connectons les LLMs avec les EAs. Cette approche nous permet de tirer simultanément parti des puissantes capacités de traitement du langage des LLMs et des performances d'optimisation efficaces des EAs. Plus précisément, en s'abstenant de tout gradient ou paramètre, EvoPrompt commence par une population de prompts et génère itérativement de nouveaux prompts avec les LLMs en se basant sur les opérateurs évolutionnaires, améliorant ainsi la population en fonction de l'ensemble de développement. Nous optimisons les prompts pour des LLMs à la fois propriétaires et open-source, incluant GPT-3.5 et Alpaca, sur 9 ensembles de données couvrant des tâches de compréhension et de génération de langage. EvoPrompt surpasse significativement les prompts conçus par l'homme et les méthodes existantes de génération automatique de prompts, avec des gains allant jusqu'à 25% et 14% respectivement. De plus, EvoPrompt démontre que la connexion entre les LLMs et les EAs crée des synergies, ce qui pourrait inspirer des recherches supplémentaires sur la combinaison des LLMs et des algorithmes conventionnels.

English

Large Language Models (LLMs) excel in various tasks, but they rely on carefully crafted prompts that often demand substantial human effort. To automate this process, in this paper, we propose a novel framework for discrete prompt optimization, called EvoPrompt, which borrows the idea of evolutionary algorithms (EAs) as they exhibit good performance and fast convergence. To enable EAs to work on discrete prompts, which are natural language expressions that need to be coherent and human-readable, we connect LLMs with EAs. This approach allows us to simultaneously leverage the powerful language processing capabilities of LLMs and the efficient optimization performance of EAs. Specifically, abstaining from any gradients or parameters, EvoPrompt starts from a population of prompts and iteratively generates new prompts with LLMs based on the evolutionary operators, improving the population based on the development set. We optimize prompts for both closed- and open-source LLMs including GPT-3.5 and Alpaca, on 9 datasets spanning language understanding and generation tasks. EvoPrompt significantly outperforms human-engineered prompts and existing methods for automatic prompt generation by up to 25% and 14% respectively. Furthermore, EvoPrompt demonstrates that connecting LLMs with EAs creates synergies, which could inspire further research on the combination of LLMs and conventional algorithms.

La combinaison des grands modèles de langage avec les algorithmes évolutionnaires produit des optimiseurs de prompts puissants.

Connecting Large Language Models with Evolutionary Algorithms Yields Powerful Prompt Optimizers

papers.abstract

Support