Entrenamiento Interactivo: Optimización de Redes Neuronales Basada en Retroalimentación
Interactive Training: Feedback-Driven Neural Network Optimization
October 2, 2025
Autores: Wentao Zhang, Yang Young Lu, Yuntian Deng
cs.AI
Resumen
El entrenamiento tradicional de redes neuronales generalmente sigue recetas de optimización fijas y predefinidas, careciendo de la flexibilidad para responder dinámicamente a inestabilidades o problemas emergentes durante el entrenamiento. En este artículo, presentamos Entrenamiento Interactivo, un marco de código abierto que permite la intervención en tiempo real y guiada por retroalimentación durante el entrenamiento de redes neuronales, ya sea por expertos humanos o agentes de IA automatizados. En su núcleo, Entrenamiento Interactivo utiliza un servidor de control para mediar la comunicación entre los usuarios o agentes y el proceso de entrenamiento en curso, permitiendo a los usuarios ajustar dinámicamente los hiperparámetros del optimizador, los datos de entrenamiento y los puntos de control del modelo. A través de tres estudios de caso, demostramos que el Entrenamiento Interactivo logra una mayor estabilidad en el entrenamiento, reduce la sensibilidad a los hiperparámetros iniciales y mejora la adaptabilidad a las necesidades cambiantes de los usuarios, allanando el camino hacia un paradigma de entrenamiento futuro en el que los agentes de IA monitoreen de manera autónoma los registros de entrenamiento, resuelvan proactivamente las inestabilidades y optimicen la dinámica del entrenamiento.
English
Traditional neural network training typically follows fixed, predefined
optimization recipes, lacking the flexibility to dynamically respond to
instabilities or emerging training issues. In this paper, we introduce
Interactive Training, an open-source framework that enables real-time,
feedback-driven intervention during neural network training by human experts or
automated AI agents. At its core, Interactive Training uses a control server to
mediate communication between users or agents and the ongoing training process,
allowing users to dynamically adjust optimizer hyperparameters, training data,
and model checkpoints. Through three case studies, we demonstrate that
Interactive Training achieves superior training stability, reduced sensitivity
to initial hyperparameters, and improved adaptability to evolving user needs,
paving the way toward a future training paradigm where AI agents autonomously
monitor training logs, proactively resolve instabilities, and optimize training
dynamics.