ChatPaper.aiChatPaper

Valutazione dell'IA Generativa Multimodale con gli Standard Educativi Coreani

Evaluating Multimodal Generative AI with Korean Educational Standards

February 21, 2025
Autori: Sanghee Park, Geewook Kim
cs.AI

Abstract

Questo articolo presenta il Korean National Educational Test Benchmark (KoNET), un nuovo benchmark progettato per valutare i Sistemi di Intelligenza Artificiale Generativa Multimodale utilizzando i test educativi nazionali coreani. KoNET comprende quattro esami: il Korean Elementary General Educational Development Test (KoEGED), il Middle (KoMGED), l'High (KoHGED) e il College Scholastic Ability Test (KoCSAT). Questi esami sono rinomati per i loro standard rigorosi e le domande diversificate, facilitando un'analisi completa delle prestazioni dell'IA attraverso diversi livelli educativi. Concentrandosi sulla lingua coreana, KoNET fornisce approfondimenti sulle prestazioni dei modelli in lingue meno esplorate. Valutiamo una gamma di modelli - open-source, open-access e API chiuse - esaminando difficoltà, diversità degli argomenti e tassi di errore umano. Il codice e il costruttore del dataset saranno resi completamente open-source all'indirizzo https://github.com/naver-ai/KoNET.
English
This paper presents the Korean National Educational Test Benchmark (KoNET), a new benchmark designed to evaluate Multimodal Generative AI Systems using Korean national educational tests. KoNET comprises four exams: the Korean Elementary General Educational Development Test (KoEGED), Middle (KoMGED), High (KoHGED), and College Scholastic Ability Test (KoCSAT). These exams are renowned for their rigorous standards and diverse questions, facilitating a comprehensive analysis of AI performance across different educational levels. By focusing on Korean, KoNET provides insights into model performance in less-explored languages. We assess a range of models - open-source, open-access, and closed APIs - by examining difficulties, subject diversity, and human error rates. The code and dataset builder will be made fully open-sourced at https://github.com/naver-ai/KoNET.

Summary

AI-Generated Summary

PDF103February 24, 2025