Seedance 2.0 : Faire progresser la génération vidéo face à la complexité du monde

Résumé

Seedance 2.0 est un nouveau modèle natif de génération multimodale audio-vidéo, officiellement publié en Chine début février 2026. Comparé à ses prédécesseurs Seedance 1.0 et 1.5 Pro, Seedance 2.0 adopte une architecture unifiée, hautement efficace et à grande échelle pour la génération conjointe audio-vidéo multimodale. Cela lui permet de prendre en charge quatre modalités d'entrée : texte, image, audio et vidéo, en intégrant l'une des suites les plus complètes à ce jour de fonctionnalités de référencement et d'édition de contenu multimodal disponibles dans l'industrie. Il offre des améliorations substantielles et équilibrées dans toutes les sous-dimensions clés de la génération vidéo et audio. Lors des évaluations d'experts et des tests utilisateurs publics, le modèle a démontré des performances équivalentes aux niveaux leaders dans le domaine. Seedance 2.0 prend en charge la génération directe de contenu audio-vidéo d'une durée de 4 à 15 secondes, avec des résolutions de sortie natives de 480p et 720p. Pour les entrées multimodales comme référence, sa plateforme ouverte actuelle prend en charge jusqu'à 3 clips vidéo, 9 images et 3 clips audio. De plus, nous proposons la version Seedance 2.0 Fast, une variante accélérée de Seedance 2.0 conçue pour augmenter la vitesse de génération dans les scénarios à faible latence. Seedance 2.0 a apporté des améliorations significatives à ses capacités de génération fondamentales et à ses performances de génération multimodale, offrant ainsi une expérience créative améliorée pour les utilisateurs finaux.

English

Seedance 2.0 is a new native multi-modal audio-video generation model, officially released in China in early February 2026. Compared with its predecessors, Seedance 1.0 and 1.5 Pro, Seedance 2.0 adopts a unified, highly efficient, and large-scale architecture for multi-modal audio-video joint generation. This allows it to support four input modalities: text, image, audio, and video, by integrating one of the most comprehensive suites of multi-modal content reference and editing capabilities available in the industry to date. It delivers substantial, well-rounded improvements across all key sub-dimensions of video and audio generation. In both expert evaluations and public user tests, the model has demonstrated performance on par with the leading levels in the field. Seedance 2.0 supports direct generation of audio-video content with durations ranging from 4 to 15 seconds, with native output resolutions of 480p and 720p. For multi-modal inputs as reference, its current open platform supports up to 3 video clips, 9 images, and 3 audio clips. In addition, we provide Seedance 2.0 Fast version, an accelerated variant of Seedance 2.0 designed to boost generation speed for low-latency scenarios. Seedance 2.0 has delivered significant improvements to its foundational generation capabilities and multi-modal generation performance, bringing an enhanced creative experience for end users.

Seedance 2.0 : Faire progresser la génération vidéo face à la complexité du monde

Seedance 2.0: Advancing Video Generation for World Complexity

Résumé

Support