Predittore-Corrector Neurale: Risoluzione di Problemi di Omotopia con Apprendimento per Rinforzo

Abstract

Il paradigma dell'omotopia, un principio generale per la risoluzione di problemi complessi, compare in ambiti diversificati come l'ottimizzazione robusta, l'ottimizzazione globale, il calcolo degli zeri di polinomi e il campionamento. I risolutori pratici per questi problemi seguono tipicamente una struttura predittore-correttore (PC), ma si basano su euristiche artigianali per la dimensione del passo e la terminazione delle iterazioni, che sono spesso subottimali e specifiche per il compito. Per affrontare questa limitazione, unifichiamo questi problemi in un unico quadro teorico, che consente la progettazione di un risolutore neurale generale. Basandosi su questa visione unificata, proponiamo Neural Predictor-Corrector (NPC), che sostituisce le euristiche artigianali con politiche apprese automaticamente. NPC formula la selezione delle politiche come un problema decisionale sequenziale e sfrutta l'apprendimento per rinforzo per scoprire automaticamente strategie efficienti. Per migliorare ulteriormente la generalizzazione, introduciamo un meccanismo di addestramento ammortizzato, che consente un unico addestramento offline per una classe di problemi e un'inferenza online efficiente su nuove istanze. Esperimenti su quattro problemi di omotopia rappresentativi dimostrano che il nostro metodo generalizza efficacemente a istanze non viste. Supera costantemente i baseline classici e specializzati in termini di efficienza, mostrando al contempo una stabilità superiore tra i diversi compiti, evidenziando il valore dell'unificazione dei metodi di omotopia in un unico framework neurale.

English

The Homotopy paradigm, a general principle for solving challenging problems, appears across diverse domains such as robust optimization, global optimization, polynomial root-finding, and sampling. Practical solvers for these problems typically follow a predictor-corrector (PC) structure, but rely on hand-crafted heuristics for step sizes and iteration termination, which are often suboptimal and task-specific. To address this, we unify these problems under a single framework, which enables the design of a general neural solver. Building on this unified view, we propose Neural Predictor-Corrector (NPC), which replaces hand-crafted heuristics with automatically learned policies. NPC formulates policy selection as a sequential decision-making problem and leverages reinforcement learning to automatically discover efficient strategies. To further enhance generalization, we introduce an amortized training mechanism, enabling one-time offline training for a class of problems and efficient online inference on new instances. Experiments on four representative homotopy problems demonstrate that our method generalizes effectively to unseen instances. It consistently outperforms classical and specialized baselines in efficiency while demonstrating superior stability across tasks, highlighting the value of unifying homotopy methods into a single neural framework.

Predittore-Corrector Neurale: Risoluzione di Problemi di Omotopia con Apprendimento per Rinforzo

Neural Predictor-Corrector: Solving Homotopy Problems with Reinforcement Learning

Abstract

Support