ChatPaper.aiChatPaper

Задача-специфичное обучение с учетом квантования с нулевым разметочным примером для обнаружения объектов

Task-Specific Zero-shot Quantization-Aware Training for Object Detection

July 22, 2025
Авторы: Changhao Li, Xinrui Chen, Ji Wang, Kang Zhao, Jianfei Chen
cs.AI

Аннотация

Квантование является ключевой техникой для уменьшения размера сети и вычислительной сложности за счет представления параметров сети с меньшей точностью. Традиционные методы квантования требуют доступа к исходным обучающим данным, что часто ограничено из-за проблем конфиденциальности или безопасности. Квантование без данных (Zero-shot Quantization, ZSQ) решает эту проблему, используя синтетические данные, сгенерированные из предварительно обученных моделей, что устраняет необходимость в реальных обучающих данных. В последнее время ZSQ было расширено для задач детекции объектов. Однако существующие методы используют немаркированные синтетические изображения, не учитывающие специфику задачи детекции, что приводит к неоптимальной производительности. В данной статье мы предлагаем новый подход к ZSQ, ориентированный на задачи детекции объектов, который состоит из двух основных этапов. Во-первых, мы вводим стратегию выборки ограничивающих рамок и категорий для синтеза специфичного для задачи калибровочного набора из предварительно обученной сети, восстанавливая расположение, размеры и распределение категорий объектов без какого-либо предварительного знания. Во-вторых, мы интегрируем специфичное для задачи обучение в процесс дистилляции знаний для восстановления производительности квантованных сетей детекции. Эксперименты, проведенные на наборах данных MS-COCO и Pascal VOC, демонстрируют эффективность и передовые результаты нашего метода. Наш код доступен по адресу: https://github.com/DFQ-Dojo/dfq-toolkit.
English
Quantization is a key technique to reduce network size and computational complexity by representing the network parameters with a lower precision. Traditional quantization methods rely on access to original training data, which is often restricted due to privacy concerns or security challenges. Zero-shot Quantization (ZSQ) addresses this by using synthetic data generated from pre-trained models, eliminating the need for real training data. Recently, ZSQ has been extended to object detection. However, existing methods use unlabeled task-agnostic synthetic images that lack the specific information required for object detection, leading to suboptimal performance. In this paper, we propose a novel task-specific ZSQ framework for object detection networks, which consists of two main stages. First, we introduce a bounding box and category sampling strategy to synthesize a task-specific calibration set from the pre-trained network, reconstructing object locations, sizes, and category distributions without any prior knowledge. Second, we integrate task-specific training into the knowledge distillation process to restore the performance of quantized detection networks. Extensive experiments conducted on the MS-COCO and Pascal VOC datasets demonstrate the efficiency and state-of-the-art performance of our method. Our code is publicly available at: https://github.com/DFQ-Dojo/dfq-toolkit .
PDF91July 23, 2025