Pequeno Ganho de Nash: Contração Certificada para Equilíbrios de Nash em Jogos Diferenciáveis

Resumo

As garantias clássicas de convergência para aprendizado baseado em gradiente em jogos exigem que o pseudo-gradiente seja (fortemente) monótono na geometria euclidiana, conforme demonstrado por Rosen (1965), uma condição que frequentemente falha mesmo em jogos simples com acoplamentos fortes entre jogadores. Introduzimos o Small-Gain Nash (SGN), uma condição de pequeno ganho em bloco numa geometria personalizada com pesos por bloco. O SGN converte limites locais de curvatura e de acoplamento Lipschitz entre jogadores em um certificado tratável de contração. Ele constrói uma métrica de bloco ponderada na qual o pseudo-gradiente se torna fortemente monótono em qualquer região onde esses limites se mantêm, mesmo quando é não monótono no sentido euclidiano. O fluxo contínuo é exponencialmente contráctil nesta geometria projetada, e as discretizações de Euler projetado e RK4 convergem sob limites explícitos de tamanho de passo derivados da margem SGN e de uma constante Lipschitz local. Nossa análise revela uma "faixa de escala de tempo" certificada, um certificado não assintótico baseado em métrica que desempenha um papel semelhante ao TTUR: em vez de forçar uma separação assintótica de escalas de tempo via tamanhos de passo desiguais e decrescentes, o SGN identifica uma faixa finita de pesos métricos relativos para a qual uma dinâmica com tamanho de passo único é comprovadamente contráctil. Validamos o framework em jogos quadráticos onde a análise de monotonicidade euclidiana falha em prever a convergência, mas o SGN a certifica com sucesso, e estendemos a construção para geometrias *mirror*/Fisher para gradiente de política com entropia regularizada em jogos de Markov. O resultado é um *pipeline* de certificação offline que estima parâmetros de curvatura, acoplamento e Lipschitz em regiões compactas, otimiza pesos de bloco para ampliar a margem SGN e retorna um certificado de convergência estruturante e computável consistindo de uma métrica, taxa de contração e tamanhos de passo seguros para jogos não monótonos.

English

Classical convergence guarantees for gradient-based learning in games require the pseudo-gradient to be (strongly) monotone in Euclidean geometry as shown by rosen(1965), a condition that often fails even in simple games with strong cross-player couplings. We introduce Small-Gain Nash (SGN), a block small-gain condition in a custom block-weighted geometry. SGN converts local curvature and cross-player Lipschitz coupling bounds into a tractable certificate of contraction. It constructs a weighted block metric in which the pseudo-gradient becomes strongly monotone on any region where these bounds hold, even when it is non-monotone in the Euclidean sense. The continuous flow is exponentially contracting in this designed geometry, and projected Euler and RK4 discretizations converge under explicit step-size bounds derived from the SGN margin and a local Lipschitz constant. Our analysis reveals a certified ``timescale band'', a non-asymptotic, metric-based certificate that plays a TTUR-like role: rather than forcing asymptotic timescale separation via vanishing, unequal step sizes, SGN identifies a finite band of relative metric weights for which a single-step-size dynamics is provably contractive. We validate the framework on quadratic games where Euclidean monotonicity analysis fails to predict convergence, but SGN successfully certifies it, and extend the construction to mirror/Fisher geometries for entropy-regularized policy gradient in Markov games. The result is an offline certification pipeline that estimates curvature, coupling, and Lipschitz parameters on compact regions, optimizes block weights to enlarge the SGN margin, and returns a structural, computable convergence certificate consisting of a metric, contraction rate, and safe step-sizes for non-monotone games.

Pequeno Ganho de Nash: Contração Certificada para Equilíbrios de Nash em Jogos Diferenciáveis

Small-Gain Nash: Certified Contraction to Nash Equilibria in Differentiable Games

Resumo

Support