ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
April 16th, 2025
ReZero : Amélioration des capacités de recherche des LLM en essayant une fois de plus
ReZero: Enhancing LLM search ability by trying one-more-time
Alan Dao, Thinh Le
•
Apr 15, 2025
•
14
2
VisualPuzzles : Découpler l'évaluation du raisonnement multimodal des connaissances spécifiques au domaine
VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge
Yueqi Song, Tianyue Ou, Yibo Kong, Zecheng Li, Graham Neubig, Xiang Yue
•
Apr 14, 2025
•
11
2
NormalCrafter : Apprentissage de normales temporellement cohérentes à partir de vidéo A priori de diffusion
NormalCrafter: Learning Temporally Consistent Normals from Video Diffusion Priors
Yanrui Bin, Wenbo Hu, Haoyuan Wang, Xinya Chen, Bing Wang
•
Apr 15, 2025
•
17
2
Entraînement efficace des modèles de récompense de processus par apprentissage actif
Efficient Process Reward Model Training via Active Learning
Keyu Duan, Zichen Liu, Xin Mao, Tianyu Pang, Changyu Chen, Qiguang Chen, Michael Qizhe Shieh, Longxu Dou
•
Apr 14, 2025
•
13
2
Heimdall : mise à l'échelle en phase de test pour la vérification générative
Heimdall: test-time scaling on the generative verification
Wenlei Shi, Xing Jin
•
Apr 14, 2025
•
32
2
Comment les données d'instruction et de raisonnement influencent le post-entraînement : Qualité des données à travers le prisme des gradients par couche
How Instruction and Reasoning Data shape Post-Training: Data Quality through the Lens of Layer-wise Gradients
Ming Li, Yanhong Li, Ziyue Li, Tianyi Zhou
•
Apr 14, 2025
•
40
2
RealHarm : Un recueil d'échecs réels d'applications de modèles de langage
RealHarm: A Collection of Real-World Language Model Application Failures
Pierre Le Jeune, Jiaen Liu, Luca Rossi, Matteo Dora
•
Apr 14, 2025
•
11
3
Compression efficace de modèles de langage hybrides par élagage SSM basé sur les groupes
Efficient Hybrid Language Model Compression through Group-Aware SSM Pruning
Ali Taghibakhshi, Sharath Turuvekere Sreenivas, Saurav Muralidharan, Marcin Chochowski, Yashaswi Karnati, Raviraj Joshi, Ameya Sunil Mahabaleshwarkar, Zijia Chen, Yoshi Suhara, Oluwatobi Olabiyi, Daniel Korzekwa, Mostofa Patwary, Mohammad Shoeybi, Jan Kautz, Bryan Catanzaro, Ashwath Aithal, Nima Tajbakhsh, Pavlo Molchanov
•
Apr 15, 2025
•
10
2
Modèles de raisonnement efficaces : une étude approfondie
Efficient Reasoning Models: A Survey
Sicheng Feng, Gongfan Fang, Xinyin Ma, Xinchao Wang
•
Apr 15, 2025
•
18
4
xVerify : Vérificateur de réponses efficace pour l'évaluation des modèles de raisonnement
xVerify: Efficient Answer Verifier for Reasoning Model Evaluations
Ding Chen, Qingchen Yu, Pengyuan Wang, Wentao Zhang, Bo Tang, Feiyu Xiong, Xinchi Li, Minchuan Yang, Zhiyu Li
•
Apr 14, 2025
•
84
2
Élagage adaptatif des calculs pour le Transformer à oubli
Adaptive Computation Pruning for the Forgetting Transformer
Zhixuan Lin, Johan Obando-Ceron, Xu Owen He, Aaron Courville
•
Apr 9, 2025
•
3
2
AI-University : Une plateforme basée sur des modèles de langage pour l'alignement pédagogique dans les salles de classe scientifiques
AI-University: An LLM-based platform for instructional alignment to scientific classrooms
Mostafa Faghih Shojaei, Rahul Gulati, Benjamin A. Jasperson, Shangshang Wang, Simone Cimolato, Dangli Cao, Willie Neiswanger, Krishna Garikipati
•
Apr 11, 2025
•
9
2
DeepMath-103K : Un jeu de données mathématique à grande échelle, exigeant, décontaminé et vérifiable pour faire progresser le raisonnement
DeepMath-103K: A Large-Scale, Challenging, Decontaminated, and Verifiable Mathematical Dataset for Advancing Reasoning
Zhiwei He, Tian Liang, Jiahao Xu, Qiuzhi Liu, Xingyu Chen, Yue Wang, Linfeng Song, Dian Yu, Zhenwen Liang, Wenxuan Wang, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu
•
Apr 15, 2025
•
12
6
D^2iT : Transformateur à Diffusion Dynamique pour une Génération d'Images Précise
D^2iT: Dynamic Diffusion Transformer for Accurate Image Generation
Weinan Jia, Mengqi Huang, Nan Chen, Lei Zhang, Zhendong Mao
•
Apr 13, 2025
•
12
2
DataDecide : Comment prédire les meilleures données de pré-entraînement avec de petites expériences
DataDecide: How to Predict Best Pretraining Data with Small Experiments
Ian Magnusson, Nguyen Tai, Ben Bogin, David Heineman, Jena D. Hwang, Luca Soldaini, Akshita Bhagia, Jiacheng Liu, Dirk Groeneveld, Oyvind Tafjord, Noah A. Smith, Pang Wei Koh, Jesse Dodge
•
Apr 15, 2025
•
17
2
L'évolutivité de la simplicité : Analyse empirique de l'apprentissage vision-langage avec un seul transformateur
The Scalability of Simplicity: Empirical Analysis of Vision-Language Learning with a Single Transformer
Weixian Lei, Jiacong Wang, Haochen Wang, Xiangtai Li, Jun Hao Liew, Jiashi Feng, Zilong Huang
•
Apr 14, 2025
•
15
3
Rapport Technique de Seedream 3.0
Seedream 3.0 Technical Report
Yu Gao, Lixue Gong, Qiushan Guo, Xiaoxia Hou, Zhichao Lai, Fanshi Li, Liang Li, Xiaochen Lian, Chao Liao, Liyang Liu, Wei Liu, Yichun Shi, Shiqi Sun, Yu Tian, Zhi Tian, Peng Wang, Rui Wang, Xuanda Wang, Xun Wang, Ye Wang, Guofeng Wu, Jie Wu, Xin Xia, Xuefeng Xiao, Zhonghua Zhai, Xinyu Zhang, Qi Zhang, Yuwei Zhang, Shijia Zhao, Jianchao Yang, Weilin Huang
•
Apr 15, 2025
•
52
6
Entraînement efficace de modèles génératifs via préchauffage des représentations intégrées
Efficient Generative Model Training via Embedded Representation Warmup
Deyuan Liu, Peng Sun, Xufeng Li, Tao Lin
•
Apr 14, 2025
•
12
2
Rapport du Challenge PVUW 2025 : Progrès dans la compréhension au niveau pixel de vidéos complexes en conditions réelles
PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild
Henghui Ding, Chang Liu, Nikhila Ravi, Shuting He, Yunchao Wei, Song Bai, Philip Torr, Kehuan Song, Xinglin Xie, Kexin Zhang, Licheng Jiao, Lingling Li, Shuyuan Yang, Xuqiang Cao, Linnan Zhao, Jiaxuan Zhao, Fang Liu, Mengjiao Wang, Junpei Zhang, Xu Liu, Yuting Yang, Mengru Ma, Hao Fang, Runmin Cong, Xiankai Lu, Zhiyang Che, Wei Zhan, Tianming Liang, Haichao Jiang, Wei-Shi Zheng, Jian-Fang Hu, Haobo Yuan, Xiangtai Li, Tao Zhang, Lu Qi, Ming-Hsuan Yang
•
Apr 15, 2025
•
6
2
LazyReview : Un ensemble de données pour détecter la pensée paresseuse dans les évaluations par les pairs en TAL
LazyReview A Dataset for Uncovering Lazy Thinking in NLP Peer Reviews
Sukannya Purkayastha, Zhuang Li, Anne Lauscher, Lizhen Qu, Iryna Gurevych
•
Apr 15, 2025
•
4
2
Modèles d'Espaces d'États pour la Détection de Changements en Télédétection
Change State Space Models for Remote Sensing Change Detection
Elman Ghazaei, Erchan Aptoula
•
Apr 15, 2025
•
1
2
Pixel-SAIL : Un seul transformateur pour la compréhension ancrée au niveau des pixels
Pixel-SAIL: Single Transformer For Pixel-Grounded Understanding
Tao Zhang, Xiangtai Li, Zilong Huang, Yanwei Li, Weixian Lei, Xueqing Deng, Shihao Chen, Shunping Ji, Jiashi Feng
•
Apr 14, 2025
•
28
3
Distillation par diffusion avec optimisation directe des préférences pour une complétion efficace de scènes 3D LiDAR
Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion
An Zhaol, Shengyuan Zhang, Ling Yang, Zejian Li, Jiale Wu, Haoran Xu, AnYang Wei, Perry Pengyun GU Lingyun Sun
•
Apr 15, 2025
•
5
2
Une approche minimaliste du raisonnement des LLM : de l'échantillonnage par rejet au renforcement
A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce
Wei Xiong, Jiarui Yao, Yuhui Xu, Bo Pang, Lei Wang, Doyen Sahoo, Junnan Li, Nan Jiang, Tong Zhang, Caiming Xiong, Hanze Dong
•
Apr 15, 2025
•
14
6
Résumé des présentations multimodales avec des modèles vision-langage : Étude de l'effet des modalités et de la structure
Summarization of Multimodal Presentations with Vision-Language Models: Study of the Effect of Modalities and Structure
Théo Gigant, Camille Guinaudeau, Frédéric Dufaux
•
Apr 14, 2025
•
3
2
Arène de Texte
TextArena
Leon Guertler, Bobby Cheng, Simon Yu, Bo Liu, Leshem Choshen, Cheston Tan
•
Apr 15, 2025
•
27
3
L'alignement du débruitage génératif avec les objectifs discriminatifs libère le potentiel de la diffusion pour la perception visuelle
Aligning Generative Denoising with Discriminative Objectives Unleashes Diffusion for Visual Perception
Ziqi Pang, Xin Xu, Yu-Xiong Wang
•
Apr 15, 2025
•
2
2
Genius : Un cadre généralisable et entièrement non supervisé d'auto-apprentissage pour le raisonnement avancé
Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning
Fangzhi Xu, Hang Yan, Chang Ma, Haiteng Zhao, Qiushi Sun, Kanzhi Cheng, Junxian He, Jun Liu, Zhiyong Wu
•
Apr 11, 2025
•
54
2
Modélisation de vidéos longues multimodales basée sur un contexte dynamique temporel
Multimodal Long Video Modeling Based on Temporal Dynamic Context
Haoran Hao, Jiaming Han, Yiyuan Zhang, Xiangyu Yue
•
Apr 14, 2025
•
4
2
SimpleAR : Repousser les frontières de la génération visuelle autorégressive grâce au pré-entraînement, au fine-tuning supervisé et à l'apprentissage par renforcement
SimpleAR: Pushing the Frontier of Autoregressive Visual Generation through Pretraining, SFT, and RL
Junke Wang, Zhi Tian, Xun Wang, Xinyu Zhang, Weilin Huang, Zuxuan Wu, Yu-Gang Jiang
•
Apr 15, 2025
•
12
1