ChatPaper.aiChatPaper.ai
Accueil

arXiv

HuggingFace

TarifsCompteEspace de travail

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Articles de Recherche en IA Quotidiens

Articles de recherche en IA sélectionnés quotidiennement avec traductions

TabSTAR : Un modèle tabulaire fondamental avec des représentations sémantiquement adaptées à la cible
TabSTAR: A Foundation Tabular Model With Semantically Target-Aware Representations

Alan Arazi, Eilam Shapira, Roi Reichart•May 23, 2025•1034

QwenLong-L1 : Vers des modèles de raisonnement à grand contexte avec apprentissage par renforcement
QwenLong-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning

Fanqi Wan, Weizhou Shen, Shengyi Liao, Yingcheng Shi, Chenliang Li, Ziyi Yang, Ji Zhang, Fei Huang, Jingren Zhou, Ming Yan•May 23, 2025•753

Distillation d'un agent LLM en petits modèles avec des outils de recherche et de code
Distilling LLM Agent into Small Models with Retrieval and Code Tools

Minki Kang, Jongwon Jeong, Seanie Lee, Jaewoong Cho, Sung Ju Hwang•May 23, 2025•715

Quartet : L'entraînement natif en FP4 peut être optimal pour les grands modèles de langage
Quartet: Native FP4 Training Can Be Optimal for Large Language Models

Roberto L. Castro, Andrei Panferov, Soroush Tabesh, Oliver Sieberling, Jiale Chen, Mahdi Nikdan, Saleh Ashkboos, Dan Alistarh•May 20, 2025•702

Le Modèle de Raisonnement est Têtu : Diagnostic du Contournement des Instructions dans les Modèles de Raisonnement
Reasoning Model is Stubborn: Diagnosing Instruction Overriding in Reasoning Models

Doohyuk Jang, Yoonjeon Kim, Chanjae Park, Hyun Ryu, Eunho Yang•May 22, 2025•592

Un RL pour tous les voir : Apprentissage par renforcement visuel unifié des triples
One RL to See Them All: Visual Triple Unified Reinforcement Learning

Yan Ma, Linge Du, Xuyang Shen, Shaoxiang Chen, Pengfei Li, Qibing Ren, Lizhuang Ma, Yuchao Dai, Pengfei Liu, Junjie Yan•May 23, 2025•552

PhyX : Votre modèle possède-t-il l'"intelligence" nécessaire pour le raisonnement physique ?
PhyX: Does Your Model Have the "Wits" for Physical Reasoning?

Hui Shen, Taiqiang Wu, Qi Han, Yunta Hsieh, Jizhou Wang, Yuyue Zhang, Yuxin Cheng, Zijian Hao, Yuansheng Ni, Xin Wang, Zhongwei Wan, Kai Zhang, Wendong Xu, Jing Xiong, Ping Luo, Wenhu Chen, Chaofan Tao, Zhuoqing Mao, Ngai Wong•May 21, 2025•474

QwenLong-CPRS : Vers des LLMs infinis avec optimisation dynamique du contexte
QwenLong-CPRS: Towards infty-LLMs with Dynamic Context Optimization

Weizhou Shen, Chenliang Li, Fanqi Wan, Shengyi Liao, Shaopeng Lai, Bo Zhang, Yingcheng Shi, Yuning Wu, Gang Fu, Zhansheng Li, Bin Yang, Ji Zhang, Fei Huang, Jingren Zhou, Ming Yan•May 23, 2025•393

Mise à l'échelle de la génération d'images et de vidéos via une recherche évolutive en phase de test
Scaling Image and Video Generation via Test-Time Evolutionary Search

Haoran He, Jiajun Liang, Xintao Wang, Pengfei Wan, Di Zhang, Kun Gai, Ling Pan•May 23, 2025•382

MOOSE-Chem3 : Vers un classement d'hypothèses guidé par l'expérimentation via un retour d'expérience simulé
MOOSE-Chem3: Toward Experiment-Guided Hypothesis Ranking via Simulated Experimental Feedback

Wanhao Liu, Zonglin Yang, Jue Wang, Lidong Bing, Di Zhang, Dongzhan Zhou, Yuqiang Li, Houqiang Li, Erik Cambria, Wanli Ouyang•May 23, 2025•293

Le Modèle Connaît Déjà le Meilleur Bruit : Sélection Active Bayésienne du Bruit via l'Attention dans un Modèle de Diffusion Vidéo
Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention in Video Diffusion Model

Kwanyoung Kim, Sanghyun Kim•May 23, 2025•293

VeriThinker : Apprendre à vérifier rend les modèles de raisonnement efficaces
VeriThinker: Learning to Verify Makes Reasoning Model Efficient

Zigeng Chen, Xinyin Ma, Gongfan Fang, Ruonan Yu, Xinchao Wang•May 23, 2025•232

Les classificateurs par diffusion comprennent la compositionnalité, mais sous certaines conditions.
Diffusion Classifiers Understand Compositionality, but Conditions Apply

Yujin Jeong, Arnas Uselis, Seong Joon Oh, Anna Rohrbach•May 23, 2025•183

AudioTrust : Évaluation multidimensionnelle de la fiabilité des modèles de langage audio de grande envergure
AudioTrust: Benchmarking the Multifaceted Trustworthiness of Audio Large Language Models

Kai Li, Can Shen, Yile Liu, Jirui Han, Kelong Zheng, Xuechao Zou, Zhe Wang, Xingjian Du, Shun Zhang, Hanjun Luo, Yingbin Jin, Xinxin Xing, Ziyang Ma, Yue Liu, Xiaojun Jia, Yifan Zhang, Junfeng Fang, Kun Wang, Yibo Yan, Haoyang Li, Yiming Li, Xiaobin Zhuang, Yang Liu, Haibo Hu, Zhuo Chen, Zhizheng Wu, Xiaolin Hu, Eng-Siong Chng, XiaoFeng Wang, Wenyuan Xu, Wei Dong, Xinfeng Li•May 22, 2025•172

Direct3D-S2 : Génération 3D à l'échelle du gigascale simplifiée grâce à l'attention spatiale parcimonieuse
Direct3D-S2: Gigascale 3D Generation Made Easy with Spatial Sparse Attention

Shuang Wu, Youtian Lin, Feihu Zhang, Yifei Zeng, Yikang Yang, Yajie Bao, Jiachen Qian, Siyu Zhu, Philip Torr, Xun Cao, Yao Yao•May 23, 2025•162

Position d'incertitude : Une étude interlinguistique des biais positionnels dans les grands modèles de langage
Position of Uncertainty: A Cross-Linguistic Study of Positional Bias in Large Language Models

Menschikov Mikhail, Alexander Kharitonov, Maiia Kotyga, Vadim Porvatov, Anna Zhukovskaya, David Kagramanyan, Egor Shvetsov, Evgeny Burnaev•May 22, 2025•162

s3 : Vous n'avez pas besoin d'autant de données pour entraîner un agent de recherche via l'apprentissage par renforcement
s3: You Don't Need That Much Data to Train a Search Agent via RL

Pengcheng Jiang, Xueqiang Xu, Jiacheng Lin, Jinfeng Xiao, Zifeng Wang, Jimeng Sun, Jiawei Han•May 20, 2025•152

FullFront : Évaluation des MLLM à travers l'ensemble du flux de travail d'ingénierie front-end
FullFront: Benchmarking MLLMs Across the Full Front-End Engineering Workflow

Haoyu Sun, Huichen Will Wang, Jiawei Gu, Linjie Li, Yu Cheng•May 23, 2025•142

Optimisation des politiques par renforcement de la pensée : Relier les conseils externes et les capacités internes
Thought-Augmented Policy Optimization: Bridging External Guidance and Internal Capabilities

Jinyang Wu, Chonghua Liao, Mingkuan Feng, Shuai Zhang, Zhengqi Wen, Pengpeng Shao, Huazhe Xu, Jianhua Tao•May 21, 2025•142

Time-R1 : Vers un raisonnement temporel complet dans les LLM
Time-R1: Towards Comprehensive Temporal Reasoning in LLMs

Zijia Liu, Peixuan Han, Haofei Yu, Haoru Li, Jiaxuan You•May 16, 2025•143

Enseigner avec des mensonges : DPO de curriculum sur des négatifs synthétiques pour la détection d'hallucinations
Teaching with Lies: Curriculum DPO on Synthetic Negatives for Hallucination Detection

Shrey Pandit, Ashwin Vinod, Liu Leqi, Ying Ding•May 23, 2025•132

Nuits claires à l'horizon : Vers la restauration d'images nocturnes par tous les temps
Clear Nights Ahead: Towards Multi-Weather Nighttime Image Restoration

Yuetong Liu, Yunqiu Xu, Yang Wei, Xiuli Bi, Bin Xiao•May 22, 2025•112

Speechless : Entraînement aux instructions vocales sans parole pour les langues à ressources limitées
Speechless: Speech Instruction Training Without Speech for Low Resource Languages

Alan Dao, Dinh Bach Vu, Huy Hoang Ha, Tuan Le Duc Anh, Shreyas Gopal, Yue Heng Yeo, Warren Keng Hoong Low, Eng Siong Chng, Jia Qi Yip•May 23, 2025•102

RBench-V : Une évaluation primaire pour les modèles de raisonnement visuel avec sorties multi-modales
RBench-V: A Primary Assessment for Visual Reasoning Models with Multi-modal Outputs

Meng-Hao Guo, Xuanyu Chu, Qianrui Yang, Zhe-Han Mo, Yiqing Shen, Pei-lin Li, Xinjie Lin, Jinnian Zhang, Xin-Sheng Chen, Yi Zhang, Kiyohiro Nakayama, Zhengyang Geng, Houwen Peng, Han Hu, Shi-Nin Hu•May 22, 2025•103

Enseigner aux grands modèles de langage à maintenir la fidélité contextuelle grâce à des tâches synthétiques et à l'apprentissage par renforcement
Teaching Large Language Models to Maintain Contextual Faithfulness via Synthetic Tasks and Reinforcement Learning

Shuzheng Si, Haozhe Zhao, Cheng Gao, Yuzhuo Bai, Zhitong Wang, Bofei Gao, Kangyang Luo, Wenhao Li, Yufei Huang, Gang Chen, Fanchao Qi, Minjia Zhang, Baobao Chang, Maosong Sun•May 22, 2025•105

Trinity-RFT : Un cadre généraliste et unifié pour le réglage fin par renforcement des grands modèles de langage
Trinity-RFT: A General-Purpose and Unified Framework for Reinforcement Fine-Tuning of Large Language Models

Xuchen Pan, Yanxi Chen, Yushuo Chen, Yuchang Sun, Daoyuan Chen, Wenhao Zhang, Yuexiang Xie, Yilun Huang, Yilei Zhang, Dawei Gao, Yaliang Li, Bolin Ding, Jingren Zhou•May 23, 2025•92

ScanBot : Vers un balayage intelligent de surfaces dans les systèmes robotiques incarnés
ScanBot: Towards Intelligent Surface Scanning in Embodied Robotic Systems

Zhiling Chen, Yang Zhang, Fardin Jalil Piran, Qianyu Zhou, Jiong Tang, Farhad Imani•May 22, 2025•92

Les modèles vision-langage sont-ils sûrs en pratique ? Une étude comparative basée sur des mèmes
Are Vision-Language Models Safe in the Wild? A Meme-Based Benchmark Study

DongGeon Lee, Joonwon Jang, Jihae Jeong, Hwanjo Yu•May 21, 2025•82

Apprentissage par Renforcement avec Données Synthétiques : La Définition de la Tâche Suffit
Synthetic Data RL: Task Definition Is All You Need

Yiduo Guo, Zhen Guo, Chuanwei Huang, Zi-Ang Wang, Zekai Zhang, Haofei Yu, Huishuai Zhang, Yikang Shen•May 18, 2025•82

DanceTogether! Génération interactive de vidéos multipersonnes préservant l'identité
DanceTogether! Identity-Preserving Multi-Person Interactive Video Generation

Junhao Chen, Mingjin Chen, Jianjin Xu, Xiang Li, Junting Dong, Mingze Sun, Puhua Jiang, Hongxiang Li, Yuhang Yang, Hao Zhao, Xiaoxiao Long, Ruqi Huang•May 23, 2025•62

RePrompt : Reprompting augmenté par le raisonnement pour la génération texte-image via l'apprentissage par renforcement
RePrompt: Reasoning-Augmented Reprompting for Text-to-Image Generation via Reinforcement Learning

Mingrui Wu, Lu Wang, Pu Zhao, Fangkai Yang, Jianjin Zhang, Jianfeng Liu, Yuefeng Zhan, Weihao Han, Hao Sun, Jiayi Ji, Xiaoshuai Sun, Qingwei Lin, Weiwei Deng, Dongmei Zhang, Feng Sun, Qi Zhang, Rongrong Ji•May 23, 2025•62

Transformer Copilot : Apprentissage à partir du journal d'erreurs dans le réglage fin des LLM
Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning

Jiaru Zou, Yikun Ban, Zihao Li, Yunzhe Qi, Ruizhong Qiu, Ling Yang, Jingrui He•May 22, 2025•62

Sur la conception d'algorithmes de gradient de politique régularisés par KL pour le raisonnement des grands modèles de langage
On the Design of KL-Regularized Policy Gradient Algorithms for LLM Reasoning

Yifan Zhang, Yifeng Liu, Huizhuo Yuan, Yang Yuan, Quanquan Gu, Andrew C Yao•May 23, 2025•52

Post-formation interactive pour les modèles vision-langage-action
Interactive Post-Training for Vision-Language-Action Models

Shuhan Tan, Kairan Dou, Yue Zhao, Philipp Krähenbühl•May 22, 2025•52

ReflAct : Prise de décision ancrée dans le monde réel pour les agents LLM via la réflexion sur l'état cible
ReflAct: World-Grounded Decision Making in LLM Agents via Goal-State Reflection

Jeonghye Kim, Sojeong Rhee, Minbeom Kim, Dohyung Kim, Sangmook Lee, Youngchul Sung, Kyomin Jung•May 21, 2025•52

Les grands modèles de langage apprennent implicitement à voir et à entendre simplement en lisant.
Large Language Models Implicitly Learn to See and Hear Just By Reading

Prateek Verma, Mert Pilanci•May 20, 2025•53

Recherche guidée par la valeur pour un raisonnement en chaîne de pensée efficace
Value-Guided Search for Efficient Chain-of-Thought Reasoning

Kaiwen Wang, Jin Peng Zhou, Jonathan Chang, Zhaolin Gao, Nathan Kallus, Kianté Brantley, Wen Sun•May 23, 2025•42

Tous les modèles ne conviennent pas à la délégation experte : Sur la cohérence du routage local dans les modèles de mélange d'experts
Not All Models Suit Expert Offloading: On Local Routing Consistency of Mixture-of-Expert Models

Jingcong Liang, Siyuan Wang, Miren Tian, Yitong Li, Duyu Tang, Zhongyu Wei•May 21, 2025•32

Maintenez la sécurité ! Évaluation de la préservation des politiques de sécurité dans les contextes de grands modèles de langage face aux attaques indirectes dans les systèmes de question-réponse
Keep Security! Benchmarking Security Policy Preservation in Large Language Model Contexts Against Indirect Attacks in Question Answering

Hwan Chang, Yumin Kim, Yonghyun Jun, Hwanhee Lee•May 21, 2025•32

Réexamen des connexions résiduelles : Mises à jour orthogonales pour des réseaux profonds stables et efficaces
Revisiting Residual Connections: Orthogonal Updates for Stable and Efficient Deep Networks

Giyeong Oh, Woohyun Cho, Siyeol Kim, Suhwan Choi, Younjae Yu•May 17, 2025•32

FREESON : Raisonnement Augmenté par Récupération sans Récupérateur via MCTS de Traversée de Corpus
FREESON: Retriever-Free Retrieval-Augmented Reasoning via Corpus-Traversing MCTS

Chaeeun Kim, Seungone Kim•May 22, 2025•22

Amélioration du raisonnement des LLM grâce à la prise de notes dynamique pour les questions complexes
Augmenting LLM Reasoning with Dynamic Notes Writing for Complex QA

Rishabh Maheshwary, Masoud Hashemi, Khyati Mahajan, Shiva Krishna Reddy Malay, Sai Rajeswar, Sathwik Tejaswi Madhusudhan, Spandana Gella, Vikas Yadav•May 22, 2025•22

NOVER : Entraînement incitatif pour les modèles de langage via l'apprentissage par renforcement sans vérificateur
NOVER: Incentive Training for Language Models via Verifier-Free Reinforcement Learning

Wei Liu, Siya Qi, Xinyu Wang, Chen Qian, Yali Du, Yulan He•May 21, 2025•25

TIME : Un benchmark multi-niveau pour l'évaluation du raisonnement temporel des LLM dans des scénarios du monde réel
TIME: A Multi-level Benchmark for Temporal Reasoning of LLMs in Real-World Scenarios

Shaohang Wei, Wei Li, Feifan Song, Wen Luo, Tianyi Zhuang, Haochen Tan, Zhijiang Guo, Houfeng Wang•May 19, 2025•22

NileChat : Vers des modèles de langage à grande échelle linguistiquement diversifiés et culturellement conscients pour les communautés locales
NileChat: Towards Linguistically Diverse and Culturally Aware LLMs for Local Communities

Abdellah El Mekki, Houdaifa Atou, Omer Nacar, Shady Shehata, Muhammad Abdul-Mageed•May 23, 2025•12

FuxiMT : Sparsification des grands modèles de langage pour la traduction automatique multilingue centrée sur le chinois
FuxiMT: Sparsifying Large Language Models for Chinese-Centric Multilingual Machine Translation

Shaolin Zhu, Tianyu Dong, Bo Li, Deyi Xiong•May 20, 2025•12

Réorganisation universelle des séquences biologiques pour un séquençage de novo des peptides amélioré
Universal Biological Sequence Reranking for Improved De Novo Peptide Sequencing

Zijie Qiu, Jiaqi Wei, Xiang Zhang, Sheng Xu, Kai Zou, Zhi Jin, Zhiqiang Gao, Nanqing Dong, Siqi Sun•May 23, 2025•02