ChatPaper.aiChatPaper

RoMath: Математический бенчмарк на румынском языке

RoMath: A Mathematical Reasoning Benchmark in Romanian

September 17, 2024
Авторы: Adrian Cosma, Ana-Maria Bucur, Emilian Radoi
cs.AI

Аннотация

Математика долгое время передавалась через естественный язык, в основном для понимания человеком. С появлением механизированной математики и помощников по доказательствам возникает растущая необходимость понимания неформального математического текста, однако большинство существующих бенчмарков сосредотачиваются исключительно на английском языке, игнорируя другие языки. В данной статье представлен RoMath - набор бенчмарков по математическому рассуждению на румынском языке, включающий три набора данных: RoMath-Баккалауреат, RoMath-Соревнования и RoMath-Синтетический, охватывающие различные математические области и уровни сложности, с целью улучшения моделей на неанглийских языках и стимулирования развития мультиязычного искусственного интеллекта. Сосредотачиваясь на румынском языке, языке с ограниченными ресурсами и уникальными лингвистическими особенностями, RoMath решает ограничения англо-центричных моделей и подчеркивает необходимость специализированных ресурсов за пределами простого автоматического перевода. Мы проводим оценку нескольких моделей языка с открытым весом, подчеркивая важность создания ресурсов для недостаточно представленных языков. Мы предоставляем доступ к коду и набору данных.
English
Mathematics has long been conveyed through natural language, primarily for human understanding. With the rise of mechanized mathematics and proof assistants, there is a growing need to understand informal mathematical text, yet most existing benchmarks focus solely on English, overlooking other languages. This paper introduces RoMath, a Romanian mathematical reasoning benchmark suite comprising three datasets: RoMath-Baccalaureate, RoMath-Competitions and RoMath-Synthetic, which cover a range of mathematical domains and difficulty levels, aiming to improve non-English language models and promote multilingual AI development. By focusing on Romanian, a low-resource language with unique linguistic features, RoMath addresses the limitations of Anglo-centric models and emphasizes the need for dedicated resources beyond simple automatic translation. We benchmark several open-weight language models, highlighting the importance of creating resources for underrepresented languages. We make the code and dataset available.

Summary

AI-Generated Summary

PDF32November 16, 2024