ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
May 9th, 2025
Perception, Raisonnement, Pensée et Planification : Une Étude sur les Grands Modèles de Raisonnement Multimodal
Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models
Yunxin Li, Zhenyu Liu, Zitao Li, Xuanyu Zhang, Zhenran Xu, Xinyu Chen, Haoyuan Shi, Shenyuan Jiang, Xintong Wang, Jifang Wang, Shouzheng Huang, Xinping Zhao, Borui Jiang, Lanqing Hong, Longyue Wang, Zhuotao Tian, Baoxing Huai, Wenhan Luo, Weihua Luo, Zheng Zhang, Baotian Hu, Min Zhang
•
May 8, 2025
•
74
1
Flow-GRPO : Entraînement de modèles de correspondance de flux via l'apprentissage par renforcement en ligne
Flow-GRPO: Training Flow Matching Models via Online RL
Jie Liu, Gongye Liu, Jiajun Liang, Yangguang Li, Jiaheng Liu, Xintao Wang, Pengfei Wan, Di Zhang, Wanli Ouyang
•
May 8, 2025
•
34
2
Chaînes de pensée évolutives via un raisonnement élastique
Scalable Chain of Thoughts via Elastic Reasoning
Yuhui Xu, Hanze Dong, Lei Wang, Doyen Sahoo, Junnan Li, Caiming Xiong
•
May 8, 2025
•
16
1
Agent Sentient en tant que Juge : Évaluation de la Cognition Sociale d'Ordre Supérieur dans les Modèles de Langage à Grande Échelle
Sentient Agent as a Judge: Evaluating Higher-Order Social Cognition in Large Language Models
Bang Zhang, Ruotian Ma, Qingxuan Jiang, Peisong Wang, Jiaqi Chen, Zheng Xie, Xingyu Chen, Yue Wang, Fanghua Ye, Jian Li, Yifan Yang, Zhaopeng Tu, Xiaolong Li
•
May 1, 2025
•
16
3
Génération de Scènes 3D : Un Panorama
3D Scene Generation: A Survey
Beichen Wen, Haozhe Xie, Zhaoxi Chen, Fangzhou Hong, Ziwei Liu
•
May 8, 2025
•
10
1
FG-CLIP : Alignement Fin des Représentations Visuelles et Textuelles
FG-CLIP: Fine-Grained Visual and Textual Alignment
Chunyu Xie, Bin Wang, Fanjing Kong, Jincheng Li, Dawei Liang, Gengshen Zhang, Dawei Leng, Yuhui Yin
•
May 8, 2025
•
10
1
ICon : Contribution en Contexte pour la Sélection Automatique de Données
ICon: In-Context Contribution for Automatic Data Selection
Yixin Yang, Qingxiu Dong, Linli Yao, Fangwei Zhu, Zhifang Sui
•
May 8, 2025
•
9
1
X-Reasoner : Vers un raisonnement généralisable à travers les modalités et les domaines
X-Reasoner: Towards Generalizable Reasoning Across Modalities and Domains
Qianchu Liu, Sheng Zhang, Guanghui Qin, Timothy Ossowski, Yu Gu, Ying Jin, Sid Kiblawi, Sam Preston, Mu Wei, Paul Vozila, Tristan Naumann, Hoifung Poon
•
May 6, 2025
•
8
2
Génération de conceptions LEGO physiquement stables et constructibles à partir de texte
Generating Physically Stable and Buildable LEGO Designs from Text
Ava Pun, Kangle Deng, Ruixuan Liu, Deva Ramanan, Changliu Liu, Jun-Yan Zhu
•
May 8, 2025
•
7
1
StreamBridge : Transformer votre modèle de langage massif vidéo hors ligne en un assistant de streaming proactif
StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant
Haibo Wang, Bo Feng, Zhengfeng Lai, Mingze Xu, Shiyu Li, Weifeng Ge, Afshin Dehghan, Meng Cao, Ping Huang
•
May 8, 2025
•
7
1
LiftFeat : Appariement de caractéristiques locales avec prise en compte de la géométrie 3D
LiftFeat: 3D Geometry-Aware Local Feature Matching
Yepeng Liu, Wenpeng Lai, Zhou Zhao, Yuxuan Xiong, Jinchi Zhu, Jun Cheng, Yongchao Xu
•
May 6, 2025
•
6
1
Raisonnement translinguistique par mise à l'échelle au moment du test
Crosslingual Reasoning through Test-Time Scaling
Zheng-Xin Yong, M. Farid Adilazuarda, Jonibek Mansurov, Ruochen Zhang, Niklas Muennighoff, Carsten Eickhoff, Genta Indra Winata, Julia Kreutzer, Stephen H. Bach, Alham Fikri Aji
•
May 8, 2025
•
5
1
PlaceIt3D : Placement d'objets guidé par le langage dans des scènes 3D réelles
PlaceIt3D: Language-Guided Object Placement in Real 3D Scenes
Ahmed Abdelreheem, Filippo Aleotti, Jamie Watson, Zawar Qureshi, Abdelrahman Eldesokey, Peter Wonka, Gabriel Brostow, Sara Vicente, Guillermo Garcia-Hernando
•
May 8, 2025
•
5
1
WaterDrum : Marquage numérique pour une métrique centrée sur les données de désapprentissage
WaterDrum: Watermarking for Data-centric Unlearning Metric
Xinyang Lu, Xinyuan Niu, Gregory Kang Ruey Lau, Bui Thi Cam Nhung, Rachael Hwee Ling Sim, Fanyu Wen, Chuan-Sheng Foo, See-Kiong Ng, Bryan Kian Hsiang Low
•
May 8, 2025
•
5
1
Redonner de la valeur au RL : Améliorer la mise à l'échelle en temps de test en unifiant les raisonneurs LLM avec les vérificateurs
Putting the Value Back in RL: Better Test-Time Scaling by Unifying LLM Reasoners With Verifiers
Kusha Sareen, Morgane M Moss, Alessandro Sordoni, Rishabh Agarwal, Arian Hosseini
•
May 7, 2025
•
4
1
BrowseComp-ZH : Évaluation des capacités de navigation web des grands modèles de langage en chinois
BrowseComp-ZH: Benchmarking Web Browsing Ability of Large Language Models in Chinese
Peilin Zhou, Bruce Leon, Xiang Ying, Can Zhang, Yifan Shao, Qichen Ye, Dading Chong, Zhiling Jin, Chenxuan Xie, Meng Cao, Yuxin Gu, Sixin Hong, Jing Ren, Jian Chen, Chao Liu, Yining Hua
•
Apr 27, 2025
•
4
1
Modèles Vision-Langage-Action : Concepts, Progrès, Applications et Défis
Vision-Language-Action Models: Concepts, Progress, Applications and Challenges
Ranjan Sapkota, Yang Cao, Konstantinos I. Roumeliotis, Manoj Karkee
•
May 7, 2025
•
3
1
SIMPLEMIX : Un mélange déconcertant de simplicité entre données hors-politique et sur-politique dans l'apprentissage des préférences des modèles de langage
SIMPLEMIX: Frustratingly Simple Mixing of Off- and On-policy Data in Language Model Preference Learning
Tianjian Li, Daniel Khashabi
•
May 5, 2025
•
3
1
Les jetons de Chaîne de Pensée sont des variables de programme informatique.
Chain-of-Thought Tokens are Computer Program Variables
Fangwei Zhu, Peiyi Wang, Zhifang Sui
•
May 8, 2025
•
1
1