ChatPaper.aiChatPaper

Frequentiegestuurde Actiediffusie via Subfrequentie-Manifold Doorloping

Frequency-Guided Action Diffusion via Sub-Frequency Manifold Traversal

May 27, 2026
Auteurs: Junlin Wang
cs.AI

Samenvatting

Het leren van visuomotorische beleidsregels via gedragsnabootsing omvat doorgaans het imiteren van expert-demonstraties die door menselijke operators zijn verzameld. Natuurlijke menselijke demonstraties bevatten echter inherent hoogfrequente ruis, zoals intermitterende schokken, pauzes en actie-jitter. Het trainen van beleidsregels om deze ruwe trajecten direct te imiteren, zorgt er onvermijdelijk voor dat het model deze suboptimale gedragingen overneemt. Deze pathologie is bijzonder uitgesproken bij diffusiegebaseerde beleidsregels, waar iteratieve ruisonderdrukkingsstappen per ongeluk hoogfrequente artefacten kunnen versterken ten koste van betekenisvolle fijnschalige details. Om deze beperkingen aan te pakken, presenteren we een nieuw frequentiegebaseerd algoritme dat impliciete spectrale manoeuvres en vloeiende actiegeneratie mogelijk maakt. Onze methode, de Frequentiegeleidingsoperator (FGO), stuurt het generatieproces van diffusiebeleid door de ruizige samples geleidelijk door tussenliggende subfrequentiemanifolds met uitbreidende spectrale banden te leiden. FGO is gevalideerd op 15 robotmanipulatietaken uit 5 benchmarks en behaalt superieure prestaties in het verbeteren van actiegladheid en temporele consistentie, terwijl de details die nodig zijn voor succesvolle taakuitvoering behouden blijven. Projectwebsite: https://henrywjl.github.io/frequency-guidance-operator/
English
Learning visuomotor policies via behavior cloning typically involves mimicking expert demonstrations collected by human operators. However, natural human demonstrations inherently contain high-frequency noise, such as intermittent jerks, pauses, and action jitter. Training policies to directly imitate these raw trajectories inevitably causes the model to inherit these suboptimal behaviors. This pathology is particularly pronounced in diffusion-based policies, where iterative denoising steps can inadvertently amplify high-frequency artifacts at the expense of meaningful fine-grained details. To address these limitations, we present a novel frequency-based algorithm that enables implicit spectral maneuvering and smooth action generation. Our method, Frequency Guidance Operator (FGO), steers the generation process of diffusion polices by progressively driving the noisy samples through intermediate sub-frequency manifolds with expanding spectral bands. Validated on 15 robotic manipulation tasks from 5 benchmarks, FGO achieves superior performance in enhancing action smoothness and temporal consistency while preserving the details necessary for successful task execution. Project website: https://henrywjl.github.io/frequency-guidance-operator/