ChatPaper.aiChatPaper

Addestramento Consapevole della Quantizzazione Zero-shot Specifico per il Compito di Rilevamento Oggetti

Task-Specific Zero-shot Quantization-Aware Training for Object Detection

July 22, 2025
Autori: Changhao Li, Xinrui Chen, Ji Wang, Kang Zhao, Jianfei Chen
cs.AI

Abstract

La quantizzazione è una tecnica chiave per ridurre le dimensioni della rete e la complessità computazionale rappresentando i parametri della rete con una precisione inferiore. I metodi tradizionali di quantizzazione si basano sull'accesso ai dati di addestramento originali, che spesso sono limitati a causa di preoccupazioni relative alla privacy o sfide di sicurezza. La Quantizzazione Zero-Shot (ZSQ) affronta questo problema utilizzando dati sintetici generati da modelli pre-addestrati, eliminando la necessità di dati di addestramento reali. Recentemente, la ZSQ è stata estesa al rilevamento di oggetti. Tuttavia, i metodi esistenti utilizzano immagini sintetiche non etichettate e indipendenti dal compito, che mancano delle informazioni specifiche necessarie per il rilevamento di oggetti, portando a prestazioni subottimali. In questo articolo, proponiamo un nuovo framework ZSQ specifico per il compito per le reti di rilevamento di oggetti, che consiste in due fasi principali. Innanzitutto, introduciamo una strategia di campionamento delle bounding box e delle categorie per sintetizzare un set di calibrazione specifico per il compito dalla rete pre-addestrata, ricostruendo le posizioni, le dimensioni e le distribuzioni delle categorie degli oggetti senza alcuna conoscenza a priori. In secondo luogo, integriamo l'addestramento specifico per il compito nel processo di distillazione della conoscenza per ripristinare le prestazioni delle reti di rilevamento quantizzate. Esperimenti estensivi condotti sui dataset MS-COCO e Pascal VOC dimostrano l'efficienza e le prestazioni all'avanguardia del nostro metodo. Il nostro codice è disponibile pubblicamente all'indirizzo: https://github.com/DFQ-Dojo/dfq-toolkit.
English
Quantization is a key technique to reduce network size and computational complexity by representing the network parameters with a lower precision. Traditional quantization methods rely on access to original training data, which is often restricted due to privacy concerns or security challenges. Zero-shot Quantization (ZSQ) addresses this by using synthetic data generated from pre-trained models, eliminating the need for real training data. Recently, ZSQ has been extended to object detection. However, existing methods use unlabeled task-agnostic synthetic images that lack the specific information required for object detection, leading to suboptimal performance. In this paper, we propose a novel task-specific ZSQ framework for object detection networks, which consists of two main stages. First, we introduce a bounding box and category sampling strategy to synthesize a task-specific calibration set from the pre-trained network, reconstructing object locations, sizes, and category distributions without any prior knowledge. Second, we integrate task-specific training into the knowledge distillation process to restore the performance of quantized detection networks. Extensive experiments conducted on the MS-COCO and Pascal VOC datasets demonstrate the efficiency and state-of-the-art performance of our method. Our code is publicly available at: https://github.com/DFQ-Dojo/dfq-toolkit .
PDF91July 23, 2025