Il rumore può contenere conoscenza trasferibile: comprendere l'adattamento di dominio eterogeneo semi-supervisionato da una prospettiva empirica
Noise May Contain Transferable Knowledge: Understanding Semi-supervised Heterogeneous Domain Adaptation from an Empirical Perspective
February 19, 2025
Autori: Yuan Yao, Xiaopu Zhang, Yu Zhang, Jian Jin, Qiang Yang
cs.AI
Abstract
L'adattamento di dominio eterogeneo semi-supervisionato (SHDA) affronta l'apprendimento attraverso domini con rappresentazioni e distribuzioni di caratteristiche distinte, in cui i campioni sorgente sono etichettati mentre la maggior parte dei campioni target non lo sono, con solo una piccola frazione etichettata. Inoltre, non esiste una corrispondenza uno-a-uno tra i campioni sorgente e target. Sebbene siano stati sviluppati vari metodi SHDA per affrontare questo problema, la natura della conoscenza trasferita attraverso domini eterogenei rimane poco chiara. Questo articolo approfondisce questa questione da una prospettiva empirica. Abbiamo condotto esperimenti estesi su circa 330 task SHDA, impiegando due metodi di apprendimento supervisionato e sette metodi SHDA rappresentativi. Sorprendentemente, le nostre osservazioni indicano che sia le informazioni di categoria che quelle di caratteristica dei campioni sorgente non influenzano significativamente le prestazioni del dominio target. Inoltre, il rumore estratto da distribuzioni semplici, quando utilizzato come campioni sorgente, può contenere conoscenza trasferibile. Sulla base di questa intuizione, abbiamo eseguito una serie di esperimenti per scoprire i principi sottostanti della conoscenza trasferibile in SHDA. Nello specifico, abbiamo progettato un Framework Unificato per il Trasferimento di Conoscenza (KTF) per SHDA. Basandoci sul KTF, abbiamo scoperto che la conoscenza trasferibile in SHDA deriva principalmente dalla trasferibilità e dalla discriminabilità del dominio sorgente. Di conseguenza, garantire queste proprietà nei campioni sorgente, indipendentemente dalla loro origine (ad esempio, immagine, testo, rumore), può migliorare l'efficacia del trasferimento di conoscenza nei task SHDA. I codici e i dataset sono disponibili all'indirizzo https://github.com/yyyaoyuan/SHDA.
English
Semi-supervised heterogeneous domain adaptation (SHDA) addresses learning
across domains with distinct feature representations and distributions, where
source samples are labeled while most target samples are unlabeled, with only a
small fraction labeled. Moreover, there is no one-to-one correspondence between
source and target samples. Although various SHDA methods have been developed to
tackle this problem, the nature of the knowledge transferred across
heterogeneous domains remains unclear. This paper delves into this question
from an empirical perspective. We conduct extensive experiments on about 330
SHDA tasks, employing two supervised learning methods and seven representative
SHDA methods. Surprisingly, our observations indicate that both the category
and feature information of source samples do not significantly impact the
performance of the target domain. Additionally, noise drawn from simple
distributions, when used as source samples, may contain transferable knowledge.
Based on this insight, we perform a series of experiments to uncover the
underlying principles of transferable knowledge in SHDA. Specifically, we
design a unified Knowledge Transfer Framework (KTF) for SHDA. Based on the KTF,
we find that the transferable knowledge in SHDA primarily stems from the
transferability and discriminability of the source domain. Consequently,
ensuring those properties in source samples, regardless of their origin (e.g.,
image, text, noise), can enhance the effectiveness of knowledge transfer in
SHDA tasks. The codes and datasets are available at
https://github.com/yyyaoyuan/SHDA.Summary
AI-Generated Summary