Neuraal Voorspeller-Corrector: Het Oplossen van Homotopieproblemen met Reinforcement Learning
Neural Predictor-Corrector: Solving Homotopy Problems with Reinforcement Learning
February 3, 2026
Auteurs: Jiayao Mai, Bangyan Liao, Zhenjun Zhao, Yingping Zeng, Haoang Li, Javier Civera, Tailin Wu, Yi Zhou, Peidong Liu
cs.AI
Samenvatting
Het Homotopie-paradigma, een algemeen principe voor het oplossen van uitdagende problemen, komt voor in diverse domeinen zoals robuuste optimalisatie, globale optimalisatie, het vinden van polynoomwortels en steekproefname. Praktische oplossers voor deze problemen volgen typisch een predictor-corrector (PC) structuur, maar steunen op handmatig gemaakte heuristieken voor stapgroottes en iteratie-einde, die vaak suboptimaal en taakspecifiek zijn. Om dit aan te pakken, verenigen we deze problemen onder een enkel kader, wat het ontwerp van een algemene neurale oplosser mogelijk maakt. Voortbouwend op deze verenigde visie, stellen we Neural Predictor-Corrector (NPC) voor, die handmatige heuristieken vervangt door automatisch aangeleerde beleidsregels. NPC formuleert beleidsselectie als een sequentieel besluitvormingsprobleem en benut reinforcement learning om efficiënte strategieën automatisch te ontdekken. Om de generalisatie verder te verbeteren, introduceren we een geamortiseerd trainingsmechanisme, dat eenmalige offline training voor een klasse van problemen en efficiënte online inferentie op nieuwe instanties mogelijk maakt. Experimenten op vier representatieve homotopieproblemen tonen aan dat onze methode effectief generaliseert naar ongeziene instanties. Het overtreft consistent klassieke en gespecialiseerde baseline-methoden in efficiëntie, terwijl het superieure stabiliteit aantoont over taken heen, wat de waarde benadrukt van het verenigen van homotopiemethoden in een enkel neuraal kader.
English
The Homotopy paradigm, a general principle for solving challenging problems, appears across diverse domains such as robust optimization, global optimization, polynomial root-finding, and sampling. Practical solvers for these problems typically follow a predictor-corrector (PC) structure, but rely on hand-crafted heuristics for step sizes and iteration termination, which are often suboptimal and task-specific. To address this, we unify these problems under a single framework, which enables the design of a general neural solver. Building on this unified view, we propose Neural Predictor-Corrector (NPC), which replaces hand-crafted heuristics with automatically learned policies. NPC formulates policy selection as a sequential decision-making problem and leverages reinforcement learning to automatically discover efficient strategies. To further enhance generalization, we introduce an amortized training mechanism, enabling one-time offline training for a class of problems and efficient online inference on new instances. Experiments on four representative homotopy problems demonstrate that our method generalizes effectively to unseen instances. It consistently outperforms classical and specialized baselines in efficiency while demonstrating superior stability across tasks, highlighting the value of unifying homotopy methods into a single neural framework.