HeurAgenix : Exploiter les LLM pour résoudre des défis complexes d'optimisation combinatoire

Résumé

Les algorithmes heuristiques jouent un rôle crucial dans la résolution des problèmes d'optimisation combinatoire (OC), mais les conceptions traditionnelles dépendent fortement de l'expertise manuelle et peinent à généraliser leurs performances sur des instances diverses. Nous présentons HeurAgenix, un cadre hyper-heuristique en deux étapes alimenté par des modèles de langage de grande taille (LLM), qui évolue d'abord des heuristiques puis les sélectionne automatiquement. Dans la phase d'évolution des heuristiques, HeurAgenix utilise un LLM pour comparer des solutions heuristiques initiales avec des solutions de meilleure qualité et en extraire des stratégies d'évolution réutilisables. Pendant la résolution de problèmes, il choisit dynamiquement l'heuristique la plus prometteuse pour chaque état du problème, guidé par la capacité de perception du LLM. Pour plus de flexibilité, ce sélecteur peut être soit un LLM de pointe, soit un modèle léger affiné avec un coût d'inférence réduit. Pour atténuer la rareté des supervisions fiables causée par la complexité des OC, nous affinons le sélecteur heuristique léger avec un mécanisme de double récompense qui exploite conjointement les signaux des préférences de sélection et de la perception de l'état, permettant une sélection robuste malgré les annotations bruitées. Des expériences approfondies sur des benchmarks canoniques montrent que HeurAgenix surpasse non seulement les hyper-heuristiques basées sur des LLM existantes, mais rivalise ou dépasse également les solveurs spécialisés. Le code est disponible à l'adresse https://github.com/microsoft/HeurAgenix.

English

Heuristic algorithms play a vital role in solving combinatorial optimization (CO) problems, yet traditional designs depend heavily on manual expertise and struggle to generalize across diverse instances. We introduce HeurAgenix, a two-stage hyper-heuristic framework powered by large language models (LLMs) that first evolves heuristics and then selects among them automatically. In the heuristic evolution phase, HeurAgenix leverages an LLM to compare seed heuristic solutions with higher-quality solutions and extract reusable evolution strategies. During problem solving, it dynamically picks the most promising heuristic for each problem state, guided by the LLM's perception ability. For flexibility, this selector can be either a state-of-the-art LLM or a fine-tuned lightweight model with lower inference cost. To mitigate the scarcity of reliable supervision caused by CO complexity, we fine-tune the lightweight heuristic selector with a dual-reward mechanism that jointly exploits singals from selection preferences and state perception, enabling robust selection under noisy annotations. Extensive experiments on canonical benchmarks show that HeurAgenix not only outperforms existing LLM-based hyper-heuristics but also matches or exceeds specialized solvers. Code is available at https://github.com/microsoft/HeurAgenix.

HeurAgenix : Exploiter les LLM pour résoudre des défis complexes d'optimisation combinatoire

HeurAgenix: Leveraging LLMs for Solving Complex Combinatorial Optimization Challenges

Résumé

Support