Die Verbindung großer Sprachmodelle mit evolutionären Algorithmen führt zu leistungsstarken Prompt-Optimierern.

papers.abstract

Große Sprachmodelle (LLMs) zeichnen sich in verschiedenen Aufgaben aus, sind jedoch auf sorgfältig gestaltete Prompts angewiesen, die oft erheblichen menschlichen Aufwand erfordern. Um diesen Prozess zu automatisieren, schlagen wir in diesem Artikel ein neuartiges Framework für die diskrete Prompt-Optimierung vor, genannt EvoPrompt, das die Idee evolutionärer Algorithmen (EAs) übernimmt, da diese eine gute Leistung und schnelle Konvergenz aufweisen. Um EAs auf diskrete Prompts anwenden zu können, die natürliche Sprachausdrücke sind und kohärent sowie menschenlesbar sein müssen, verbinden wir LLMs mit EAs. Dieser Ansatz ermöglicht es uns, gleichzeitig die leistungsstarken Sprachverarbeitungsfähigkeiten von LLMs und die effiziente Optimierungsleistung von EAs zu nutzen. Insbesondere verzichtet EvoPrompt auf Gradienten oder Parameter und beginnt mit einer Population von Prompts, um iterativ neue Prompts mit LLMs basierend auf evolutionären Operatoren zu generieren und die Population anhand des Entwicklungsdatensatzes zu verbessern. Wir optimieren Prompts für sowohl proprietäre als auch Open-Source-LLMs, einschließlich GPT-3.5 und Alpaca, auf 9 Datensätzen, die Sprachverständnis- und Generierungsaufgaben umfassen. EvoPrompt übertrifft menschlich gestaltete Prompts und bestehende Methoden zur automatischen Prompt-Generierung signifikant um bis zu 25 % bzw. 14 %. Darüber hinaus zeigt EvoPrompt, dass die Verbindung von LLMs mit EAs Synergien schafft, die weitere Forschungen zur Kombination von LLMs und konventionellen Algorithmen inspirieren könnten.

English

Large Language Models (LLMs) excel in various tasks, but they rely on carefully crafted prompts that often demand substantial human effort. To automate this process, in this paper, we propose a novel framework for discrete prompt optimization, called EvoPrompt, which borrows the idea of evolutionary algorithms (EAs) as they exhibit good performance and fast convergence. To enable EAs to work on discrete prompts, which are natural language expressions that need to be coherent and human-readable, we connect LLMs with EAs. This approach allows us to simultaneously leverage the powerful language processing capabilities of LLMs and the efficient optimization performance of EAs. Specifically, abstaining from any gradients or parameters, EvoPrompt starts from a population of prompts and iteratively generates new prompts with LLMs based on the evolutionary operators, improving the population based on the development set. We optimize prompts for both closed- and open-source LLMs including GPT-3.5 and Alpaca, on 9 datasets spanning language understanding and generation tasks. EvoPrompt significantly outperforms human-engineered prompts and existing methods for automatic prompt generation by up to 25% and 14% respectively. Furthermore, EvoPrompt demonstrates that connecting LLMs with EAs creates synergies, which could inspire further research on the combination of LLMs and conventional algorithms.

Die Verbindung großer Sprachmodelle mit evolutionären Algorithmen führt zu leistungsstarken Prompt-Optimierern.

Connecting Large Language Models with Evolutionary Algorithms Yields Powerful Prompt Optimizers

papers.abstract

Support