arXiv: 2511.03958v1
Marco de Colaboración Multiagente para la Generación de Problemas Matemáticos
Multi-Agent Collaborative Framework For Math Problem Generation
November 6, 2025
Autores: Kia Karbasi, Kevin Hong, Mohammad Amin Samadi, Gregory Pottie
cs.MAcs.MAcs.CLcs.HCI.2.11; I.2.6; K.3.1
Resumen
La generación automática de preguntas (AQG, por sus siglas en inglés) para la educación matemática sigue siendo un objetivo difícil de alcanzar para los Sistemas Tutores Inteligentes y los educadores. Si bien los modelos de lenguaje basados en transformadores preentrenados han avanzado significativamente en la generación de lenguaje natural, a menudo tienen dificultades para controlar con precisión la complejidad del problema y las demandas cognitivas. En este artículo, presentamos un marco colaborativo multiagente como un método novedoso para incorporar el cálculo en tiempo de inferencia en la AQG. Este enfoque aprovecha múltiples agentes que refinan iterativamente pares de preguntas-respuestas generadas para equilibrar mejor la complejidad y la demanda cognitiva. Evaluamos las preguntas generadas según cinco criterios de meta-evaluación: relevancia, importancia, claridad, correspondencia de dificultad y capacidad de respuesta, para evaluar la capacidad del sistema de controlar la complejidad requerida y la calidad de las preguntas. Las evaluaciones preliminares muestran que este marco colaborativo multiagente eleva la calidad del contenido educativo generado al fomentar un equilibrio más matizado entre el desafío cognitivo y la claridad. Estos resultados prometedores sugieren que la integración de flujos de trabajo colaborativos multiagente puede producir contenido más controlado y pedagógicamente valioso, lo que podría impulsar la generación automatizada de contenido educativo y los entornos de aprendizaje adaptativo.
English
Automatic question generation (AQG) for mathematics education remains an elusive goal for Intelligent Tutoring Systems and educators. While pre-trained transformer-based language models have significantly advanced natural language generation, they often struggle to precisely control problem complexity and cognitive demands. In this paper, we introduce a collaborative multi-agent framework as a novel method of incorporating inference-time computation into AQG. This approach leverages multiple agents that iteratively refine generated question-answer pairs to better balance complexity and cognitive demand. We evaluate the generated questions on five meta-evaluation criteria: relevance, importance, clarity, difficulty matching, answerability, to assess the system's ability to control the required complexity and quality of the questions. Preliminary evaluations show that this collaborative multi-agent framework elevates the quality of generated educational content by fostering a more nuanced balance between cognitive challenge and clarity. These promising outcomes suggest that integrating collaborative multi-agent workflows can yield more controlled, pedagogically valuable content that can help advance automated educational content generation and adaptive learning environments.