ChatPaper.aiChatPaper

Addestramento Interattivo: Ottimizzazione delle Reti Neurali Guidata dal Feedback

Interactive Training: Feedback-Driven Neural Network Optimization

October 2, 2025
Autori: Wentao Zhang, Yang Young Lu, Yuntian Deng
cs.AI

Abstract

L'addestramento tradizionale delle reti neurali segue tipicamente ricette di ottimizzazione fisse e predefinite, mancando della flessibilità necessaria per rispondere dinamicamente a instabilità o problemi emergenti durante il training. In questo articolo, introduciamo Interactive Training, un framework open-source che consente interventi in tempo reale e guidati dal feedback durante l'addestramento delle reti neurali, sia da parte di esperti umani che di agenti AI automatizzati. Al suo interno, Interactive Training utilizza un server di controllo per mediare la comunicazione tra utenti o agenti e il processo di addestramento in corso, permettendo agli utenti di regolare dinamicamente gli iperparametri dell'ottimizzatore, i dati di training e i checkpoint del modello. Attraverso tre casi di studio, dimostriamo che Interactive Training raggiunge una maggiore stabilità del training, una ridotta sensibilità agli iperparametri iniziali e una migliore adattabilità alle esigenze evolutive degli utenti, aprendo la strada a un futuro paradigma di addestramento in cui gli agenti AI monitorano autonomamente i log di training, risolvono proattivamente le instabilità e ottimizzano le dinamiche di addestramento.
English
Traditional neural network training typically follows fixed, predefined optimization recipes, lacking the flexibility to dynamically respond to instabilities or emerging training issues. In this paper, we introduce Interactive Training, an open-source framework that enables real-time, feedback-driven intervention during neural network training by human experts or automated AI agents. At its core, Interactive Training uses a control server to mediate communication between users or agents and the ongoing training process, allowing users to dynamically adjust optimizer hyperparameters, training data, and model checkpoints. Through three case studies, we demonstrate that Interactive Training achieves superior training stability, reduced sensitivity to initial hyperparameters, and improved adaptability to evolving user needs, paving the way toward a future training paradigm where AI agents autonomously monitor training logs, proactively resolve instabilities, and optimize training dynamics.
PDF403October 3, 2025