arXiv: 2511.03958v1
Cadre de Collaboration Multi-Agents pour la Génération de Problèmes Mathématiques
Multi-Agent Collaborative Framework For Math Problem Generation
November 6, 2025
Auteurs: Kia Karbasi, Kevin Hong, Mohammad Amin Samadi, Gregory Pottie
cs.MAcs.MAcs.CLcs.HCI.2.11; I.2.6; K.3.1
Résumé
La génération automatique de questions (GAQ) pour l'éducation mathématique reste un objectif difficile à atteindre pour les systèmes de tutorat intelligents et les éducateurs. Bien que les modèles de langage basés sur des transformeurs pré-entraînés aient considérablement fait progresser la génération de langage naturel, ils peinent souvent à contrôler avec précision la complexité des problèmes et les exigences cognitives. Dans cet article, nous introduisons un cadre collaboratif multi-agents comme une nouvelle méthode pour intégrer le calcul en temps d'inférence dans la GAQ. Cette approche exploite plusieurs agents qui affinent itérativement les paires question-réponse générées pour mieux équilibrer la complexité et la demande cognitive. Nous évaluons les questions générées selon cinq critères de méta-évaluation : pertinence, importance, clarté, adéquation de la difficulté et possibilité de réponse, afin d'évaluer la capacité du système à contrôler la complexité et la qualité requises des questions. Les évaluations préliminaires montrent que ce cadre collaboratif multi-agents améliore la qualité du contenu éducatif généré en favorisant un équilibre plus nuancé entre le défi cognitif et la clarté. Ces résultats prometteurs suggèrent que l'intégration de workflows collaboratifs multi-agents peut produire un contenu plus contrôlé et pédagogiquement précieux, susceptible de faire progresser la génération automatisée de contenu éducatif et les environnements d'apprentissage adaptatifs.
English
Automatic question generation (AQG) for mathematics education remains an elusive goal for Intelligent Tutoring Systems and educators. While pre-trained transformer-based language models have significantly advanced natural language generation, they often struggle to precisely control problem complexity and cognitive demands. In this paper, we introduce a collaborative multi-agent framework as a novel method of incorporating inference-time computation into AQG. This approach leverages multiple agents that iteratively refine generated question-answer pairs to better balance complexity and cognitive demand. We evaluate the generated questions on five meta-evaluation criteria: relevance, importance, clarity, difficulty matching, answerability, to assess the system's ability to control the required complexity and quality of the questions. Preliminary evaluations show that this collaborative multi-agent framework elevates the quality of generated educational content by fostering a more nuanced balance between cognitive challenge and clarity. These promising outcomes suggest that integrating collaborative multi-agent workflows can yield more controlled, pedagogically valuable content that can help advance automated educational content generation and adaptive learning environments.