Rapport Technique de Qwen3Qwen3 Technical Report
Dans ce travail, nous prĂ©sentons Qwen3, la derniĂšre version de la famille de modĂšles Qwen. Qwen3 comprend une sĂ©rie de grands modĂšles de langage (LLM) conçus pour amĂ©liorer les performances, l'efficacitĂ© et les capacitĂ©s multilingues. La sĂ©rie Qwen3 inclut des modĂšles Ă architecture dense et Ă architecture Mixture-of-Experts (MoE), avec des Ă©chelles de paramĂštres allant de 0,6 Ă 235 milliards. Une innovation clĂ© de Qwen3 est l'intĂ©gration d'un mode de rĂ©flexion (pour un raisonnement complexe et multi-Ă©tapes) et d'un mode non-rĂ©flexion (pour des rĂ©ponses rapides et contextuelles) dans un cadre unifiĂ©. Cela Ă©limine le besoin de basculer entre diffĂ©rents modĂšlesâtels que les modĂšles optimisĂ©s pour le chat (par exemple, GPT-4o) et les modĂšles dĂ©diĂ©s au raisonnement (par exemple, QwQ-32B)âet permet un changement de mode dynamique basĂ© sur les requĂȘtes de l'utilisateur ou les modĂšles de chat. Par ailleurs, Qwen3 introduit un mĂ©canisme de budget de rĂ©flexion, permettant aux utilisateurs d'allouer les ressources de calcul de maniĂšre adaptative lors de l'infĂ©rence, Ă©quilibrant ainsi la latence et les performances en fonction de la complexitĂ© de la tĂąche. De plus, en exploitant les connaissances des modĂšles phares, nous rĂ©duisons considĂ©rablement les ressources de calcul nĂ©cessaires pour construire des modĂšles Ă plus petite Ă©chelle, tout en assurant des performances trĂšs compĂ©titives. Les Ă©valuations empiriques dĂ©montrent que Qwen3 atteint des rĂ©sultats de pointe sur divers benchmarks, incluant des tĂąches de gĂ©nĂ©ration de code, de raisonnement mathĂ©matique, de tĂąches d'agents, etc., rivalisant avec des modĂšles MoE plus grands et des modĂšles propriĂ©taires. Par rapport Ă son prĂ©dĂ©cesseur Qwen2.5, Qwen3 Ă©tend le support multilingue de 29 Ă 119 langues et dialectes, amĂ©liorant l'accessibilitĂ© mondiale grĂące Ă une meilleure comprĂ©hension et gĂ©nĂ©ration interlangues. Pour faciliter la reproductibilitĂ© et la recherche et dĂ©veloppement communautaire, tous les modĂšles Qwen3 sont accessibles publiquement sous licence Apache 2.0.