ChatPaper.aiChatPaper

Neuronales Prädiktor-Korrektor-Verfahren: Lösung von Homotopieproblemen mit Reinforcement Learning

Neural Predictor-Corrector: Solving Homotopy Problems with Reinforcement Learning

February 3, 2026
papers.authors: Jiayao Mai, Bangyan Liao, Zhenjun Zhao, Yingping Zeng, Haoang Li, Javier Civera, Tailin Wu, Yi Zhou, Peidong Liu
cs.AI

papers.abstract

Das Homotopie-Paradigma, ein allgemeines Prinzip zur Lösung anspruchsvoller Probleme, findet sich in verschiedenen Bereichen wie robuster Optimierung, globaler Optimierung, Polynomnullstellensuche und Sampling. Praktische Löser für diese Probleme folgen typischerweise einer Prädiktor-Korrektor (PC)-Struktur, greifen jedoch auf handgefertigte Heuristiken für Schrittweiten und Iterationsabbruch zurück, die oft suboptimal und aufgabenspezifisch sind. Um dies zu adressieren, fassen wir diese Probleme in einem einheitlichen Rahmen zusammen, der den Entwurf eines allgemeinen neuronalen Lösers ermöglicht. Aufbauend auf dieser vereinheitlichten Sichtweise schlagen wir Neural Predictor-Corrector (NPC) vor, das handgefertigte Heuristiken durch automatisch gelernte Strategien ersetzt. NPC formuliert die Strategieauswahl als sequenzielles Entscheidungsproblem und nutzt bestärkendes Lernen, um effiziente Strategien automatisch zu entdecken. Um die Generalisierung weiter zu verbessern, führen wir einen amortisierten Trainingsmechanismus ein, der ein einmaliges Offline-Training für eine Problemklasse und effiziente Online-Inferenz für neue Instanzen ermöglicht. Experimente an vier repräsentativen Homotopieproblemen zeigen, dass unsere Methode effektiv auf unbekannte Instanzen generalisiert. Sie übertrifft klassische und spezialisierte Baseline-Methoden durchweg in der Effizienz und zeigt gleichzeitig überlegene Stabilität über verschiedene Aufgaben hinweg, was den Wert der Vereinheitlichung von Homotopieverfahren in einem einzigen neuronalen Rahmen unterstreicht.
English
The Homotopy paradigm, a general principle for solving challenging problems, appears across diverse domains such as robust optimization, global optimization, polynomial root-finding, and sampling. Practical solvers for these problems typically follow a predictor-corrector (PC) structure, but rely on hand-crafted heuristics for step sizes and iteration termination, which are often suboptimal and task-specific. To address this, we unify these problems under a single framework, which enables the design of a general neural solver. Building on this unified view, we propose Neural Predictor-Corrector (NPC), which replaces hand-crafted heuristics with automatically learned policies. NPC formulates policy selection as a sequential decision-making problem and leverages reinforcement learning to automatically discover efficient strategies. To further enhance generalization, we introduce an amortized training mechanism, enabling one-time offline training for a class of problems and efficient online inference on new instances. Experiments on four representative homotopy problems demonstrate that our method generalizes effectively to unseen instances. It consistently outperforms classical and specialized baselines in efficiency while demonstrating superior stability across tasks, highlighting the value of unifying homotopy methods into a single neural framework.
PDF111February 5, 2026