ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
April 14th, 2025
PixelFlow : Modèles génératifs dans l'espace des pixels avec des flux
PixelFlow: Pixel-Space Generative Models with Flow
Shoufa Chen, Chongjian Ge, Shilong Zhang, Peize Sun, Ping Luo
•
Apr 10, 2025
•
19
6
InteractVLM : Raisonnement sur les interactions 3D à partir de modèles fondamentaux 2D
InteractVLM: 3D Interaction Reasoning from 2D Foundational Models
Sai Kumar Dwivedi, Dimitrije Antić, Shashank Tripathi, Omid Taheri, Cordelia Schmid, Michael J. Black, Dimitrios Tzionas
•
Apr 7, 2025
•
5
2
SQL-R1 : Entraînement d'un modèle de raisonnement de langage naturel vers SQL par apprentissage par renforcement
SQL-R1: Training Natural Language to SQL Reasoning Model By Reinforcement Learning
Peixian Ma, Xialie Zhuang, Chengjin Xu, Xuhui Jiang, Ran Chen, Jian Guo
•
Apr 11, 2025
•
26
2
Les SAE peuvent améliorer le désapprentissage : Autoencodeurs Sparse Dynamiques comme garde-fous pour un désapprentissage précis dans les LLM
SAEs Can Improve Unlearning: Dynamic Sparse Autoencoder Guardrails for Precision Unlearning in LLMs
Aashiq Muhamed, Jacopo Bonato, Mona Diab, Virginia Smith
•
Apr 11, 2025
•
4
2
BlenderGym : Évaluation des systèmes de modèles fondamentaux pour l'édition graphique
BlenderGym: Benchmarking Foundational Model Systems for Graphics Editing
Yunqi Gu, Ian Huang, Jihyeon Je, Guandao Yang, Leonidas Guibas
•
Apr 2, 2025
•
6
2
Les LLM de niveau doctorat comprennent-ils vraiment l'addition élémentaire ? Exploration de l'apprentissage de règles versus la mémorisation dans les grands modèles de langage
Do PhD-level LLMs Truly Grasp Elementary Addition? Probing Rule Learning vs. Memorization in Large Language Models
Yang Yan, Yu Lu, Renjun Xu, Zhenzhong Lan
•
Apr 7, 2025
•
11
6
Guidance sans entraînement dans la génération texte-vidéo via une planification multimodale et une initialisation structurée du bruit
Training-free Guidance in Text-to-Video Generation via Multimodal Planning and Structured Noise Initialization
Jialu Li, Shoubin Yu, Han Lin, Jaemin Cho, Jaehong Yoon, Mohit Bansal
•
Apr 11, 2025
•
7
2
UKBOB : Un milliard de masques annotés par IRM pour la segmentation généralisable d'images médicales 3D
UKBOB: One Billion MRI Labeled Masks for Generalizable 3D Medical Image Segmentation
Emmanuelle Bourigault, Amir Jamaludin, Abdullah Hamdi
•
Apr 9, 2025
•
7
2
In-2-4D : Interpolation d'images à vue unique pour la génération 4D
In-2-4D: Inbetweening from Two Single-View Images to 4D Generation
Sauradip Nag, Daniel Cohen-Or, Hao Zhang, Ali Mahdavi-Amiri
•
Apr 11, 2025
•
10
2
ZipIR : Transformateur de diffusion pyramidale latente pour la restauration d'images haute résolution
ZipIR: Latent Pyramid Diffusion Transformer for High-Resolution Image Restoration
Yongsheng Yu, Haitian Zheng, Zhifei Zhang, Jianming Zhang, Yuqian Zhou, Connelly Barnes, Yuchen Liu, Wei Xiong, Zhe Lin, Jiebo Luo
•
Apr 11, 2025
•
18
2
Chroniques Visuelles : Utilisation de Modèles de Langage Multimodaux pour Analyser des Collections Massives d'Images
Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images
Boyang Deng, Songyou Peng, Kyle Genova, Gordon Wetzstein, Noah Snavely, Leonidas Guibas, Thomas Funkhouser
•
Apr 11, 2025
•
11
2
FlexIP : Contrôle dynamique de la préservation et de la personnalité pour une génération d'images personnalisée
FlexIP: Dynamic Control of Preservation and Personality for Customized Image Generation
Linyan Huang, Haonan Lin, Yanning Zhou, Kaiwen Xiao
•
Apr 10, 2025
•
12
2
Autoencodeurs à Diffusion Latente : Vers un Apprentissage de Représentations Non Supervisé Efficace et Significatif en Imagerie Médicale
Latent Diffusion Autoencoders: Toward Efficient and Meaningful Unsupervised Representation Learning in Medical Imaging
Gabriele Lozupone, Alessandro Bria, Francesco Fontanella, Frederick J. A. Meijer, Claudio De Stefano, Henkjan Huisman
•
Apr 11, 2025
•
5
2
VLM-R1 : Un modèle de vision et langage de grande taille de style R1 stable et généralisable
VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model
Haozhan Shen, Peng Liu, Jingcheng Li, Chunxin Fang, Yibo Ma, Jiajia Liao, Qiaoli Shen, Zilun Zhang, Kangjia Zhao, Qianqian Zhang, Ruochen Xu, Tiancheng Zhao
•
Apr 10, 2025
•
31
2
ModernBERT ou DeBERTaV3 ? Examen de l'influence de l'architecture et des données sur les performances des modèles encodeurs Transformer
ModernBERT or DeBERTaV3? Examining Architecture and Data Influence on Transformer Encoder Models Performance
Wissam Antoun, Benoît Sagot, Djamé Seddah
•
Apr 11, 2025
•
10
3
GigaTok : Mise à l'échelle des tokenizers visuels à 3 milliards de paramètres pour la génération d'images autorégressive
GigaTok: Scaling Visual Tokenizers to 3 Billion Parameters for Autoregressive Image Generation
Tianwei Xiong, Jun Hao Liew, Zilong Huang, Jiashi Feng, Xihui Liu
•
Apr 11, 2025
•
47
2
Seaweed-7B : Entraînement économique d'un modèle de base pour la génération vidéo
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model
Team Seawead, Ceyuan Yang, Zhijie Lin, Yang Zhao, Shanchuan Lin, Zhibei Ma, Haoyuan Guo, Hao Chen, Lu Qi, Sen Wang, Feng Cheng, Feilong Zuo Xuejiao Zeng, Ziyan Yang, Fangyuan Kong, Zhiwu Qing, Fei Xiao, Meng Wei, Tuyen Hoang, Siyu Zhang, Peihao Zhu, Qi Zhao, Jiangqiao Yan, Liangke Gui, Sheng Bi, Jiashi Li, Yuxi Ren, Rui Wang, Huixia Li, Xuefeng Xiao, Shu Liu, Feng Ling, Heng Zhang, Houmin Wei, Huafeng Kuang, Jerry Duncan, Junda Zhang, Junru Zheng, Li Sun, Manlin Zhang, Renfei Sun, Xiaobin Zhuang, Xiaojie Li, Xin Xia, Xuyan Chi, Yanghua Peng, Yuping Wang, Yuxuan Wang, Zhongkai Zhao, Zhuo Chen, Zuquan Song, Zhenheng Yang, Jiashi Feng, Jianchao Yang, Lu Jiang
•
Apr 11, 2025
•
122
11
MineWorld : un modèle de monde interactif en temps réel et open-source sur Minecraft
MineWorld: a Real-Time and Open-Source Interactive World Model on Minecraft
Junliang Guo, Yang Ye, Tianyu He, Haoyu Wu, Yushu Jiang, Tim Pearce, Jiang Bian
•
Apr 11, 2025
•
39
3
SpecReason : Calcul rapide et précis à l'inférence via un raisonnement spéculatif
SpecReason: Fast and Accurate Inference-Time Compute via Speculative Reasoning
Rui Pan, Yinwei Dai, Zhihao Zhang, Gabriele Oliaro, Zhihao Jia, Ravi Netravali
•
Apr 10, 2025
•
5
2
CoRAG : Génération Augmentée par Récupération Collaborative
CoRAG: Collaborative Retrieval-Augmented Generation
Aashiq Muhamed, Mona Diab, Virginia Smith
•
Apr 2, 2025
•
10
2