ChatPaper.aiChatPaper

EduRABSA: Een dataset met onderwijsrecensies voor aspectgebaseerde sentimentanalyse-taken

EduRABSA: An Education Review Dataset for Aspect-based Sentiment Analysis Tasks

August 23, 2025
Auteurs: Yan Cathy Hua, Paul Denny, Jörg Wicker, Katerina Taskova
cs.AI

Samenvatting

Elk jaar ontvangen de meeste onderwijsinstellingen een enorme hoeveelheid tekstuele feedback van studenten over vakken, docenten en de algehele ervaring. Het omzetten van deze ruwe feedback in bruikbare inzichten is echter verre van eenvoudig. Het is al lang een uitdaging om automatische opinieanalyseoplossingen toe te passen op dergelijke onderwijsreviewteksten vanwege de complexiteit van de inhoud en de vereisten voor rapportage op laaggranulair niveau. Aspectgebaseerde Sentimentanalyse (ABSA) biedt een veelbelovende oplossing met zijn rijke, op sub-zinsniveau werkende opinieanalysecapaciteiten. Bestaand ABSA-onderzoek en -bronnen zijn echter zeer sterk gericht op het commerciële domein. In het onderwijs zijn ze schaars en moeilijk te ontwikkelen vanwege beperkte openbare datasets en strikte gegevensbescherming. Een hoogwaardige, geannoteerde dataset is dringend nodig om onderzoek in dit onderbedeelde gebied vooruit te helpen. In dit werk presenteren we EduRABSA (Education Review ABSA), de eerste openbare, geannoteerde ABSA-onderwijsreviewdataset die drie reviewonderwerptypen (vak, onderwijspersoneel, universiteit) in het Engels omvat en alle belangrijkste ABSA-taken, inclusief de onderbelichte impliciete aspect- en impliciete opinie-extractie. We delen ook ASQE-DPT (Data Processing Tool), een offline, lichtgewicht, installatievrij handmatig gegevensannotatietool die gelabelde datasets genereert voor uitgebreide ABSA-taken vanuit een enkele-taakannotatie. Samen dragen deze bronnen bij aan de ABSA-gemeenschap en het onderwijsdomein door de datasetbarrière weg te nemen, onderzoeks transparantie en reproduceerbaarheid te ondersteunen, en het creëren en delen van verdere bronnen mogelijk te maken. De dataset, annotatietool, en scripts en statistieken voor datasetverwerking en -bemonstering zijn beschikbaar op https://github.com/yhua219/edurabsa_dataset_and_annotation_tool.
English
Every year, most educational institutions seek and receive an enormous volume of text feedback from students on courses, teaching, and overall experience. Yet, turning this raw feedback into useful insights is far from straightforward. It has been a long-standing challenge to adopt automatic opinion mining solutions for such education review text data due to the content complexity and low-granularity reporting requirements. Aspect-based Sentiment Analysis (ABSA) offers a promising solution with its rich, sub-sentence-level opinion mining capabilities. However, existing ABSA research and resources are very heavily focused on the commercial domain. In education, they are scarce and hard to develop due to limited public datasets and strict data protection. A high-quality, annotated dataset is urgently needed to advance research in this under-resourced area. In this work, we present EduRABSA (Education Review ABSA), the first public, annotated ABSA education review dataset that covers three review subject types (course, teaching staff, university) in the English language and all main ABSA tasks, including the under-explored implicit aspect and implicit opinion extraction. We also share ASQE-DPT (Data Processing Tool), an offline, lightweight, installation-free manual data annotation tool that generates labelled datasets for comprehensive ABSA tasks from a single-task annotation. Together, these resources contribute to the ABSA community and education domain by removing the dataset barrier, supporting research transparency and reproducibility, and enabling the creation and sharing of further resources. The dataset, annotation tool, and scripts and statistics for dataset processing and sampling are available at https://github.com/yhua219/edurabsa_dataset_and_annotation_tool.
PDF02September 1, 2025