ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
February 25th, 2025
Étude de l'impact des méthodes de quantification sur la sécurité et la fiabilité des grands modèles de langage
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models
Artyom Kharinaev, Viktor Moskvoretskii, Egor Shvetsov, Kseniia Studenikina, Bykov Mikhail, Evgeny Burnaev
•
Feb 18, 2025
•
7
2
Planification réfléchie : Modèles vision-langage pour la manipulation robotique à long terme en plusieurs étapes
Reflective Planning: Vision-Language Models for Multi-Stage Long-Horizon Robotic Manipulation
Yunhai Feng, Jiaming Han, Zhuoran Yang, Xiangyu Yue, Sergey Levine, Jianlan Luo
•
Feb 23, 2025
•
13
2
VideoGrain : Modulation de l'attention spatio-temporelle pour l'édition vidéo multi-granulaire
VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing
Xiangpeng Yang, Linchao Zhu, Hehe Fan, Yi Yang
•
Feb 24, 2025
•
79
5
Stable-SPAM : Comment s'entraîner en 4 bits avec plus de stabilité qu'avec Adam en 16 bits
Stable-SPAM: How to Train in 4-Bit More Stably than 16-Bit Adam
Tianjin Huang, Haotian Hu, Zhenyu Zhang, Gaojie Jin, Xiang Li, Li Shen, Tianlong Chen, Lu Liu, Qingsong Wen, Zhangyang Wang, Shiwei Liu
•
Feb 24, 2025
•
18
2
Rendre LoRA à nouveau performant : Amélioration de LoRA grâce à des valeurs singulières adaptatives et à un alignement d'optimisation par mélange d'experts
Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment
Chenghao Fan, Zhenyi Lu, Sichen Liu, Xiaoye Qu, Wei Wei, Chengfeng Gu, Yu Cheng
•
Feb 24, 2025
•
29
4
Mobile-Agent-V : Apprentissage des opérations sur appareils mobiles par collaboration multi-agent guidée par vidéo
Mobile-Agent-V: Learning Mobile Device Operation Through Video-Guided Multi-Agent Collaboration
Junyang Wang, Haiyang Xu, Xi Zhang, Ming Yan, Ji Zhang, Fei Huang, Jitao Sang
•
Feb 24, 2025
•
13
2
X-Dancer : Génération de vidéos de danse humaine à partir de musique expressive
X-Dancer: Expressive Music to Human Dance Video Generation
Zeyuan Chen, Hongyi Xu, Guoxian Song, You Xie, Chenxu Zhang, Xin Chen, Chao Wang, Di Chang, Linjie Luo
•
Feb 24, 2025
•
11
3
InductionBench : les LLM échouent dans la classe de complexité la plus simple
InductionBench: LLMs Fail in the Simplest Complexity Class
Wenyue Hua, Tyler Wong, Sun Fei, Liangming Pan, Adam Jardine, William Yang Wang
•
Feb 20, 2025
•
7
2
Généralisation linguistique de la mise à l'échelle au moment du test dans le raisonnement mathématique
Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning
Guijin Son, Jiwoo Hong, Hyunwoo Ko, James Thorne
•
Feb 24, 2025
•
26
2
MutaGReP : Recherche de plans ancrés dans le dépôt sans exécution pour l'utilisation de code
MutaGReP: Execution-Free Repository-Grounded Plan Search for Code-Use
Zaid Khan, Ali Farhadi, Ranjay Krishna, Luca Weihs, Mohit Bansal, Tanmay Gupta
•
Feb 21, 2025
•
5
2
Slamming : Entraîner un modèle de langage vocal sur un seul GPU en une journée
Slamming: Training a Speech Language Model on One GPU in a Day
Gallil Maimon, Avishai Elmakies, Yossi Adi
•
Feb 19, 2025
•
69
2
MONSTER : Répertoire d'Évaluation de Séries Temporelles Scalable de Monash
MONSTER: Monash Scalable Time Series Evaluation Repository
Angus Dempster, Navid Mohammadi Foumani, Chang Wei Tan, Lynn Miller, Amish Mishra, Mahsa Salehi, Charlotte Pelletier, Daniel F. Schmidt, Geoffrey I. Webb
•
Feb 21, 2025
•
3
2
Évaluation comparative du raisonnement temporel et de l'alignement à travers les dynasties chinoises
Benchmarking Temporal Reasoning and Alignment Across Chinese Dynasties
Zhenglin Wang, Jialong Wu, Pengfei LI, Yong Jiang, Deyu Zhou
•
Feb 24, 2025
•
8
4
Attention à l'écart ! Évaluations statiques et interactives des grands modèles audio
Mind the Gap! Static and Interactive Evaluations of Large Audio Models
Minzhi Li, William Barr Held, Michael J Ryan, Kunat Pipatanakul, Potsawee Manakul, Hao Zhu, Diyi Yang
•
Feb 21, 2025
•
4
2
Au-delà de la publication : Considérations sur l'accès aux systèmes d'IA générative
Beyond Release: Access Considerations for Generative AI Systems
Irene Solaiman, Rishi Bommasani, Dan Hendrycks, Ariel Herbert-Voss, Yacine Jernite, Aviya Skowron, Andrew Trask
•
Feb 23, 2025
•
16
4
Le serpent dans la sphère brownienne
The snake in the Brownian sphere
Omer Angel, Emmanuel Jacob, Brett Kolesnik, Grégory Miermont
•
Feb 18, 2025
•
2
2
TAG : Un Cadre Décentralisé pour l'Apprentissage par Renforcement Hiérarchique Multi-Agent
TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning
Giuseppe Paolo, Abdelhakim Benechehab, Hamza Cherkaoui, Albert Thomas, Balázs Kégl
•
Feb 21, 2025
•
9
2
CodeCriticBench : Un Benchmark Holistique de Critique de Code pour les Grands Modèles de Langage
CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models
Alexander Zhang, Marcus Dong, Jiaheng Liu, Wei Zhang, Yejie Wang, Jian Yang, Ge Zhang, Tianyu Liu, Zhongyuan Peng, Yingshui Tan, Yuanxing Zhang, Zhexu Wang, Weixun Wang, Yancheng He, Ken Deng, Wangchunshu Zhou, Wenhao Huang, Zhaoxiang Zhang
•
Feb 23, 2025
•
27
3
Pandora3D : Un Cadre Complet pour la Génération de Formes 3D et de Textures de Haute Qualité
Pandora3D: A Comprehensive Framework for High-Quality 3D Shape and Texture Generation
Jiayu Yang, Taizhang Shang, Weixuan Sun, Xibin Song, Ziang Cheng, Senbo Wang, Shenzhou Chen, Weizhe Liu, Hongdong Li, Pan Ji
•
Feb 20, 2025
•
6
2
DICEPTION : Un modèle de diffusion généraliste pour les tâches de perception visuelle
DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks
Canyu Zhao, Mingyu Liu, Huanyi Zheng, Muzhi Zhu, Zhiyue Zhao, Hao Chen, Tong He, Chunhua Shen
•
Feb 24, 2025
•
53
3
Estimation précoce et instantanée de la confiance dans la qualité de la traduction
Early-Exit and Instant Confidence Translation Quality Estimation
Vilém Zouhar, Maike Züfle, Beni Egressy, Julius Cheng, Jan Niehues
•
Feb 20, 2025
•
4
2
MegaLoc : Un système de recherche pour les localiser tous
MegaLoc: One Retrieval to Place Them All
Gabriele Berton, Carlo Masone
•
Feb 24, 2025
•
3
2
Diagnostic de la gravité du COVID-19 à partir d'images radiographiques thoraciques à l'aide d'architectures ViT et CNN
Diagnosing COVID-19 Severity from Chest X-Ray Images Using ViT and CNN Architectures
Luis Lara, Lucia Eve Berger, Rajesh Raju, Shawn Whitfield
•
Feb 23, 2025
•
2
2
Raisonnement sur l'Incohérence Multimodale (MMIR) : Un Nouveau Benchmark pour les Modèles de Raisonnement Multimodal
Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models
Qianqi Yan, Yue Fan, Hongquan Li, Shan Jiang, Yang Zhao, Xinze Guan, Ching-Chen Kuo, Xin Eric Wang
•
Feb 22, 2025
•
18
2
Prévision de la croissance des modèles d'IA open-weight sur Hugging Face
Forecasting Open-Weight AI Model Growth on Hugging Face
Kushal Raj Bhandari, Pin-Yu Chen, Jianxi Gao
•
Feb 21, 2025
•
10
3
RIFLEx : Une solution gratuite pour l'extrapolation de longueur dans les Transformers de diffusion vidéo
RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers
Min Zhao, Guande He, Yixiao Chen, Hongzhou Zhu, Chongxuan Li, Jun Zhu
•
Feb 21, 2025
•
20
3
GCC : Constance de Couleur Générative par Diffusion d'une Mire Chromatique
GCC: Generative Color Constancy via Diffusing a Color Checker
Chen-Wei Chang, Cheng-De Fan, Chia-Che Chang, Yi-Chen Lo, Yu-Chee Tseng, Jiun-Long Huang, Yu-Lun Liu
•
Feb 24, 2025
•
28
2
Audio-FLAN : Une version préliminaire
Audio-FLAN: A Preliminary Release
Liumeng Xue, Ziya Zhou, Jiahao Pan, Zixuan Li, Shuai Fan, Yinghao Ma, Sitong Cheng, Dongchao Yang, Haohan Guo, Yujia Xiao, Xinsheng Wang, Zixuan Shen, Chuanbo Zhu, Xinshen Zhang, Tianchi Liu, Ruibin Yuan, Zeyue Tian, Haohe Liu, Emmanouil Benetos, Ge Zhang, Yike Guo, Wei Xue
•
Feb 23, 2025
•
37
2
Compréhension autonome de contextes longs par un agent auto-apprenant
Self-Taught Agentic Long Context Understanding
Yufan Zhuang, Xiaodong Yu, Jialian Wu, Ximeng Sun, Ze Wang, Jiang Liu, Yusheng Su, Jingbo Shang, Zicheng Liu, Emad Barsoum
•
Feb 21, 2025
•
3
2
M3-AGIQA : Évaluation Multimodale, Multi-Tours et Multi-Aspects de la Qualité des Images Générées par IA
M3-AGIQA: Multimodal, Multi-Round, Multi-Aspect AI-Generated Image Quality Assessment
Chuan Cui, Kejiang Chen, Zhihua Wei, Wen Shen, Weiming Zhang, Nenghai Yu
•
Feb 21, 2025
•
2
2
Ainsi Parlait le Modèle de Langage à Grand Contexte
Thus Spake Long-Context Large Language Model
Xiaoran Liu, Ruixiao Li, Mianqiu Huang, Zhigeng Liu, Yuerong Song, Qipeng Guo, Siyang He, Qiqi Wang, Linlin Li, Qun Liu, Yaqian Zhou, Xuanjing Huang, Xipeng Qiu
•
Feb 24, 2025
•
73
6
Génération de Langage Persuasif Contextualisé pour le Marketing Automatisé
Grounded Persuasive Language Generation for Automated Marketing
Jibang Wu, Chenghao Yang, Simon Mahns, Chaoqi Wang, Hao Zhu, Fei Fang, Haifeng Xu
•
Feb 24, 2025
•
12
3
Les Community Notes peuvent-elles remplacer les vérificateurs de faits professionnels ?
Can Community Notes Replace Professional Fact-Checkers?
Nadav Borenstein, Greta Warren, Desmond Elliott, Isabelle Augenstein
•
Feb 19, 2025
•
6
2