TinyEmo: 메트릭 프로젝션을 통한 감정 추론 축소화
TinyEmo: Scaling down Emotional Reasoning via Metric Projection
October 9, 2024
저자: Cristian Gutierrez
cs.AI
초록
본 논문은 감정 추론 및 분류를 위한 작은 다중 모달 언어 모델 패밀리인 TinyEmo를 소개합니다. 우리의 접근 방식은 다음과 같은 특징을 갖고 있습니다: (1) 사전 훈련 및 세부 조정 단계에 사용되는 합성 감정 지시 데이터셋, (2) 언어 모델로부터 분류를 위임하는 Metric Projector를 특징으로 하여 더 효율적인 훈련과 추론이 가능하며, (3) 감정 추론을 위한 다중 모달 대형 언어 모델 (MM-LLM), 그리고 (4) 편견 탐지를 위한 반자동화된 프레임워크. TinyEmo는 유사한 모델보다 훨씬 적은 매개변수를 사용하면서도 감정 분류와 감정 추론을 수행할 수 있습니다. 이 효율성은 더 다양한 감정 데이터셋을 자유롭게 통합하여, 우리의 가장 작은 모델(700M 매개변수)이 일반적인 목적의 MM-LLM을 기반으로 한 7B 매개변수를 가진 더 큰 최첨단 모델을 능가하는 분류 작업에서 강력한 성능을 발휘할 수 있도록 합니다. 게다가 Metric Projector는 해석 가능성과 추가적인 훈련 없이 대형 모델에서 간접적인 편견 탐지를 가능하게 하며, AI 시스템을 이해하고 개선하는 방법을 제공합니다.
우리는 코드, 모델 및 데이터셋을 https://github.com/ggcr/TinyEmo 에서 공개합니다.
English
This paper introduces TinyEmo, a family of small multi-modal language models
for emotional reasoning and classification. Our approach features: (1) a
synthetic emotional instruct dataset for both pre-training and fine-tuning
stages, (2) a Metric Projector that delegates classification from the language
model allowing for more efficient training and inference, (3) a multi-modal
large language model (MM-LLM) for emotional reasoning, and (4) a semi-automated
framework for bias detection. TinyEmo is able to perform emotion classification
and emotional reasoning, all while using substantially fewer parameters than
comparable models. This efficiency allows us to freely incorporate more diverse
emotional datasets, enabling strong performance on classification tasks, with
our smallest model (700M parameters) outperforming larger state-of-the-art
models based on general-purpose MM-LLMs with over 7B parameters. Additionally,
the Metric Projector allows for interpretability and indirect bias detection in
large models without additional training, offering an approach to understand
and improve AI systems.
We release code, models, and dataset at https://github.com/ggcr/TinyEmoSummary
AI-Generated Summary