ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
March 31st, 2025
Pensez avant de recommander : Libérer le pouvoir de raisonnement latent pour la recommandation séquentielle
Think Before Recommend: Unleashing the Latent Reasoning Power for Sequential Recommendation
Jiakai Tang, Sunhao Dai, Teng Shi, Jun Xu, Xu Chen, Wen Chen, Wu Jian, Yuning Jiang
•
Mar 28, 2025
•
35
2
Génération de Têtes Parlantes 3D à Fidélité Perceptive : Nouvelles Définitions, Représentation Speech-Mesh et Métriques d'Évaluation
Perceptually Accurate 3D Talking Head Generation: New Definitions, Speech-Mesh Representation, and Evaluation Metrics
Lee Chae-Yeon, Oh Hyun-Bin, Han EunGi, Kim Sung-Bin, Suekyeong Nam, Tae-Hyun Oh
•
Mar 26, 2025
•
22
3
MedAgent-Pro : Vers un diagnostic médical basé sur des preuves multimodales via un flux de travail agentif de raisonnement
MedAgent-Pro: Towards Multi-modal Evidence-based Medical Diagnosis via Reasoning Agentic Workflow
Ziyue Wang, Junde Wu, Chang Han Low, Yueming Jin
•
Mar 21, 2025
•
6
2
ORIGEN : Ancrage de l'orientation 3D en génération texte-image sans apprentissage préalable
ORIGEN: Zero-Shot 3D Orientation Grounding in Text-to-Image Generation
Yunhong Min, Daehyeon Choi, Kyeongmin Yeo, Jihyun Lee, Minhyuk Sung
•
Mar 28, 2025
•
24
3
Exploration des tendances et effets de la mise à l'échelle des données dans l'apprentissage par renforcement à partir de retours humains
Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback
Wei Shen, Guanlin Liu, Zheng Wu, Ruofei Zhu, Qingping Yang, Chao Xin, Yu Yue, Lin Yan
•
Mar 28, 2025
•
44
2
PHYSIQUE : Évaluation des modèles de fondation sur la résolution de problèmes de physique universitaire
PHYSICS: Benchmarking Foundation Models on University-Level Physics Problem Solving
Kaiyue Feng, Yilun Zhao, Yixin Liu, Tianyu Yang, Chen Zhao, John Sous, Arman Cohan
•
Mar 26, 2025
•
17
2
Reconstruction d'humains avec un squelette biomécaniquement précis
Reconstructing Humans with a Biomechanically Accurate Skeleton
Yan Xia, Xiaowei Zhou, Etienne Vouga, Qixing Huang, Georgios Pavlakos
•
Mar 27, 2025
•
9
2
Une étude sur le raisonnement efficace pour les modèles de raisonnement à grande échelle : langage, multimodalité et au-delà
A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond
Xiaoye Qu, Yafu Li, Zhaochen Su, Weigao Sun, Jianhao Yan, Dongrui Liu, Ganqu Cui, Daizong Liu, Shuxian Liang, Junxian He, Peng Li, Wei Wei, Jing Shao, Chaochao Lu, Yue Zhang, Xian-Sheng Hua, Bowen Zhou, Yu Cheng
•
Mar 27, 2025
•
39
4
Votre ViT est en réalité un modèle de segmentation d'images.
Your ViT is Secretly an Image Segmentation Model
Tommie Kerssies, Niccolò Cavagnero, Alexander Hermans, Narges Norouzi, Giuseppe Averta, Bastian Leibe, Gijs Dubbelman, Daan de Geus
•
Mar 24, 2025
•
21
2
Hi3DGen : Génération de géométrie 3D haute fidélité à partir d'images via un pontage des normales
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging
Chongjie Ye, Yushuang Wu, Ziteng Lu, Jiahao Chang, Xiaoyang Guo, Jiaqing Zhou, Hao Zhao, Xiaoguang Han
•
Mar 28, 2025
•
11
2
Défis et perspectives pour l'IA appliquée au génie logiciel
Challenges and Paths Towards AI for Software Engineering
Alex Gu, Naman Jain, Wen-Ding Li, Manish Shetty, Yijia Shao, Ziyang Li, Diyi Yang, Kevin Ellis, Koushik Sen, Armando Solar-Lezama
•
Mar 28, 2025
•
4
2
OThink-MR1 : Stimulation des capacités de raisonnement généralisé multimodal par apprentissage par renforcement dynamique
OThink-MR1: Stimulating multimodal generalized reasoning capabilities via dynamic reinforcement learning
Zhiyuan Liu, Yuting Zhang, Feng Liu, Changwang Zhang, Ying Sun, Jun Wang
•
Mar 20, 2025
•
26
3
AdaptiVocab : Amélioration de l'efficacité des LLM dans des domaines ciblés grâce à une adaptation légère du vocabulaire
AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation
Itay Nakash, Nitay Calderon, Eyal Ben David, Elad Hoffer, Roi Reichart
•
Mar 25, 2025
•
75
2
SparseFlex : Modélisation 3D haute résolution et à topologie arbitraire
SparseFlex: High-Resolution and Arbitrary-Topology 3D Shape Modeling
Xianglong He, Zi-Xin Zou, Chia-Hao Chen, Yuan-Chen Guo, Ding Liang, Chun Yuan, Wanli Ouyang, Yan-Pei Cao, Yangguang Li
•
Mar 27, 2025
•
9
2
Une analyse approfondie des activations massives dans les modèles de langage de grande taille
A Refined Analysis of Massive Activations in LLMs
Louis Owen, Nilabhra Roy Chowdhury, Abhay Kumar, Fabian Güra
•
Mar 28, 2025
•
14
3
Zero4D : Génération de vidéos 4D sans entraînement à partir d'une seule vidéo utilisant un modèle de diffusion vidéo prêt à l'emploi
Zero4D: Training-Free 4D Video Generation From Single Video Using Off-the-Shelf Video Diffusion Model
Jangho Park, Taesung Kwon, Jong Chul Ye
•
Mar 28, 2025
•
18
2
Segmenter tout mouvement dans les vidéos
Segment Any Motion in Videos
Nan Huang, Wenzhao Zheng, Chenfeng Xu, Kurt Keutzer, Shanghang Zhang, Angjoo Kanazawa, Qianqian Wang
•
Mar 28, 2025
•
17
2
ReFeed : Raffinement multidimensionnel de la synthèse par raisonnement réflexif sur les retours
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback
Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
•
Mar 27, 2025
•
20
3
SWI : Parler avec intention dans les grands modèles de langage
SWI: Speaking with Intent in Large Language Models
Yuwei Yin, EunJeong Hwang, Giuseppe Carenini
•
Mar 27, 2025
•
2
2
Free4D : Génération de scènes 4D sans réglage avec cohérence spatio-temporelle
Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency
Tianqi Liu, Zihao Huang, Zhaoxi Chen, Guangcong Wang, Shoukang Hu, Liao Shen, Huiqiang Sun, Zhiguo Cao, Wei Li, Ziwei Liu
•
Mar 26, 2025
•
21
2
X^{2}-Gaussien : Projection Gaussienne Radiative 4D pour la Reconstruction Tomographique en Temps Continu
X^{2}-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction
Weihao Yu, Yuanhao Cai, Ruyi Zha, Zhiwen Fan, Chenxin Li, Yixuan Yuan
•
Mar 27, 2025
•
3
2
4D-Bench : Évaluation des modèles de langage multi-modaux pour la compréhension d'objets en 4D
4D-Bench: Benchmarking Multi-modal Large Language Models for 4D Object Understanding
Wenxuan Zhu, Bing Li, Cheng Zheng, Jinjie Mai, Jun Chen, Letian Jiang, Abdullah Hamdi, Sara Rojas Martinez, Chia-Wen Lin, Mohamed Elhoseiny, Bernard Ghanem
•
Mar 22, 2025
•
8
3
Sur les grands modèles multimodaux en tant que classificateurs d'images pour des mondes ouverts
On Large Multimodal Models as Open-World Image Classifiers
Alessandro Conti, Massimiliano Mancini, Enrico Fini, Yiming Wang, Paolo Rota, Elisa Ricci
•
Mar 27, 2025
•
5
2