ChatPaper.aiChatPaper

TinyEmo: メトリック射影を介した感情推論のスケーリングダウン

TinyEmo: Scaling down Emotional Reasoning via Metric Projection

October 9, 2024
著者: Cristian Gutierrez
cs.AI

要旨

本論文では、感情の推論と分類のための小規模なマルチモーダル言語モデルファミリーであるTinyEmoを紹介します。当アプローチには以下が特徴として挙げられます:(1) 事前学習および微調整段階のための合成感情指示データセット、(2) 言語モデルからの分類を委任するメトリックプロジェクタにより、より効率的なトレーニングと推論が可能となります、(3) 感情の推論のためのマルチモーダル大規模言語モデル(MM-LLM)、および(4) バイアス検出のための半自動フレームワーク。TinyEmoは、類似のモデルよりもはるかに少ないパラメータを使用しながら、感情分類と感情の推論を実行できます。この効率性により、より多様な感情データセットを自由に組み込むことが可能となり、700Mパラメータの最小モデルですら、一般的な用途向けMM-LLMに基づく7Bパラメータを超える大規模な最先端モデルを上回る性能を発揮します。さらに、メトリックプロジェクタにより、追加のトレーニングなしで大規模モデルにおける解釈可能性と間接的なバイアス検出が可能となり、AIシステムの理解と改善の手法を提供します。 コード、モデル、およびデータセットは、https://github.com/ggcr/TinyEmo で公開しています。
English
This paper introduces TinyEmo, a family of small multi-modal language models for emotional reasoning and classification. Our approach features: (1) a synthetic emotional instruct dataset for both pre-training and fine-tuning stages, (2) a Metric Projector that delegates classification from the language model allowing for more efficient training and inference, (3) a multi-modal large language model (MM-LLM) for emotional reasoning, and (4) a semi-automated framework for bias detection. TinyEmo is able to perform emotion classification and emotional reasoning, all while using substantially fewer parameters than comparable models. This efficiency allows us to freely incorporate more diverse emotional datasets, enabling strong performance on classification tasks, with our smallest model (700M parameters) outperforming larger state-of-the-art models based on general-purpose MM-LLMs with over 7B parameters. Additionally, the Metric Projector allows for interpretability and indirect bias detection in large models without additional training, offering an approach to understand and improve AI systems. We release code, models, and dataset at https://github.com/ggcr/TinyEmo

Summary

AI-Generated Summary

PDF42November 16, 2024