ChatPaper.aiChatPaper

EduRABSA: アスペクト基盤感情分析タスクのための教育レビューデータセット

EduRABSA: An Education Review Dataset for Aspect-based Sentiment Analysis Tasks

August 23, 2025
著者: Yan Cathy Hua, Paul Denny, Jörg Wicker, Katerina Taskova
cs.AI

要旨

毎年、ほとんどの教育機関は、コース、教授法、そして全体的な経験に関する学生からの膨大な量のテキストフィードバックを収集し、受け取っています。しかし、この生のフィードバックを有用な洞察に変換することは、決して簡単ではありません。教育レビューテキストデータに対して自動的な意見マイニングソリューションを採用することは、内容の複雑さと低粒度の報告要件のため、長年の課題となっています。アスペクトベース感情分析(ABSA)は、その豊富なサブセンテンスレベルの意見マイニング能力により、有望な解決策を提供します。しかし、既存のABSA研究とリソースは、商業ドメインに非常に偏っています。教育分野では、公開データセットの限界と厳格なデータ保護のため、それらは希少で開発が困難です。このリソース不足の領域における研究を進めるためには、高品質な注釈付きデータセットが緊急に必要とされています。本研究では、EduRABSA(Education Review ABSA)を紹介します。これは、英語で書かれた3つのレビュー対象タイプ(コース、教員、大学)をカバーし、未開拓の暗黙的アスペクトと暗黙的意見抽出を含むすべての主要なABSAタスクを網羅した、初の公開注釈付きABSA教育レビューデータセットです。また、ASQE-DPT(Data Processing Tool)も共有します。これは、オフラインで軽量、インストール不要の手動データ注釈ツールであり、単一タスクの注釈から包括的なABSAタスクのためのラベル付きデータセットを生成します。これらのリソースは、データセットの障壁を取り除き、研究の透明性と再現性を支援し、さらなるリソースの作成と共有を可能にすることで、ABSAコミュニティと教育分野に貢献します。データセット、注釈ツール、およびデータセット処理とサンプリングのためのスクリプトと統計は、https://github.com/yhua219/edurabsa_dataset_and_annotation_tool で利用可能です。
English
Every year, most educational institutions seek and receive an enormous volume of text feedback from students on courses, teaching, and overall experience. Yet, turning this raw feedback into useful insights is far from straightforward. It has been a long-standing challenge to adopt automatic opinion mining solutions for such education review text data due to the content complexity and low-granularity reporting requirements. Aspect-based Sentiment Analysis (ABSA) offers a promising solution with its rich, sub-sentence-level opinion mining capabilities. However, existing ABSA research and resources are very heavily focused on the commercial domain. In education, they are scarce and hard to develop due to limited public datasets and strict data protection. A high-quality, annotated dataset is urgently needed to advance research in this under-resourced area. In this work, we present EduRABSA (Education Review ABSA), the first public, annotated ABSA education review dataset that covers three review subject types (course, teaching staff, university) in the English language and all main ABSA tasks, including the under-explored implicit aspect and implicit opinion extraction. We also share ASQE-DPT (Data Processing Tool), an offline, lightweight, installation-free manual data annotation tool that generates labelled datasets for comprehensive ABSA tasks from a single-task annotation. Together, these resources contribute to the ABSA community and education domain by removing the dataset barrier, supporting research transparency and reproducibility, and enabling the creation and sharing of further resources. The dataset, annotation tool, and scripts and statistics for dataset processing and sampling are available at https://github.com/yhua219/edurabsa_dataset_and_annotation_tool.
PDF02September 1, 2025