ChatPaper.aiChatPaper.ai
Accueil

arXiv

HuggingFace

TarifsCompteEspace de travail

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Articles de Recherche en IA Quotidiens

Articles de recherche en IA sélectionnés quotidiennement avec traductions

Construction de bases de connaissances pour le Text-to-SQL enrichi par des connaissances
Knowledge Base Construction for Knowledge-Augmented Text-to-SQL

Jinheon Baek, Horst Samulowitz, Oktie Hassanzadeh, Dharmashankar Subramanian, Sola Shirai, Alfio Gliozzo, Debarun Bhattacharjya•May 28, 2025•11

Optimisation Inverse des Préférences pour le Suivi d'Instructions Complexes
Reverse Preference Optimization for Complex Instruction Following

Xiang Huang, Ting-En Lin, Feiteng Fang, Yuchuan Wu, Hangyu Li, Yuzhong Qu, Fei Huang, Yongbin Li•May 28, 2025•31

Le mécanisme d'entropie de l'apprentissage par renforcement pour les modèles de langage raisonné
The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Ganqu Cui, Yuchen Zhang, Jiacheng Chen, Lifan Yuan, Zhi Wang, Yuxin Zuo, Haozhan Li, Yuchen Fan, Huayu Chen, Weize Chen, Zhiyuan Liu, Hao Peng, Lei Bai, Wanli Ouyang, Yu Cheng, Bowen Zhou, Ning Ding•May 28, 2025•1123

SWE-rebench : Un pipeline automatisé pour la collecte de tâches et l'évaluation décontaminée d'agents en génie logiciel
SWE-rebench: An Automated Pipeline for Task Collection and Decontaminated Evaluation of Software Engineering Agents

Ibragim Badertdinov, Alexander Golubev, Maksim Nekrashevich, Anton Shevtsov, Simon Karasik, Andrei Andriushchenko, Maria Trofimova, Daria Litvintseva, Boris Yangel•May 26, 2025•842

R2R : Navigation efficace des chemins de raisonnement divergents grâce au routage de tokens entre modèles petits et grands
R2R: Efficiently Navigating Divergent Reasoning Paths with Small-Large Model Token Routing

Tianyu Fu, Yi Ge, Yichen You, Enshu Liu, Zhihang Yuan, Guohao Dai, Shengen Yan, Huazhong Yang, Yu Wang•May 27, 2025•682

Rapport Technique du Skywork Open Reasoner 1
Skywork Open Reasoner 1 Technical Report

Jujie He, Jiacai Liu, Chris Yuhao Liu, Rui Yan, Chaojie Wang, Peng Cheng, Xiaoyu Zhang, Fuxiang Zhang, Jiacheng Xu, Wei Shen, Siyuan Li, Liang Zeng, Tianwen Wei, Cheng Cheng, Bo An, Yang Liu, Yahui Zhou•May 28, 2025•526

Sherlock : Raisonnement auto-corrigé dans les modèles vision-langage
Sherlock: Self-Correcting Reasoning in Vision-Language Models

Yi Ding, Ruqi Zhang•May 28, 2025•502

Post-entraînement non supervisé pour le raisonnement des LLM multi-modaux via GRPO
Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO

Lai Wei, Yuting Li, Chen Wang, Yue Wang, Linghe Kong, Weiran Huang, Lichao Sun•May 28, 2025•452

Chain-of-Zoom : Super-résolution extrême via autorégression d'échelle et alignement des préférences
Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

Bryan Sangwoo Kim, Jeongsol Kim, Jong Chul Ye•May 24, 2025•434

SageAttention2++ : Une implémentation plus efficace de SageAttention2
SageAttention2++: A More Efficient Implementation of SageAttention2

Jintao Zhang, Xiaoming Xu, Jia Wei, Haofeng Huang, Pengle Zhang, Chendong Xiang, Jun Zhu, Jianfei Chen•May 27, 2025•412

Progrès dans le raisonnement multimodal via l'apprentissage par renforcement avec démarrage à froid
Advancing Multimodal Reasoning via Reinforcement Learning with Cold Start

Lai Wei, Yuting Li, Kaipeng Zheng, Chen Wang, Yue Wang, Linghe Kong, Lichao Sun, Weiran Huang•May 28, 2025•362

RenderFormer : Rendu neuronal basé sur des Transformers pour des maillages triangulaires avec illumination globale
RenderFormer: Transformer-based Neural Rendering of Triangle Meshes with Global Illumination

Chong Zeng, Yue Dong, Pieter Peers, Hongzhi Wu, Xin Tong•May 28, 2025•333

Encourager le raisonnement vidéo via la prédiction du prochain événement
Fostering Video Reasoning via Next-Event Prediction

Haonan Wang, Hongfu Liu, Xiangyan Liu, Chao Du, Kenji Kawaguchi, Ye Wang, Tianyu Pang•May 28, 2025•272

DeepResearchGym : Un environnement d'évaluation gratuit, transparent et reproductible pour la recherche approfondie
DeepResearchGym: A Free, Transparent, and Reproducible Evaluation Sandbox for Deep Research

João Coelho, Jingjie Ning, Jingyuan He, Kangrui Mao, Abhijay Paladugu, Pranav Setlur, Jiahe Jin, Jamie Callan, João Magalhães, Bruno Martins, Chenyan Xiong•May 25, 2025•252

Exploitation des négatifs difficiles pour la recherche spécifique à un domaine dans les systèmes d'entreprise
Hard Negative Mining for Domain-Specific Retrieval in Enterprise Systems

Hansa Meghwani, Amit Agarwal, Priyaranjan Pattnayak, Hitesh Laxmichand Patel, Srikant Panda•May 23, 2025•252

FS-DAG : Réseaux de graphes d'adaptation de domaine en apprentissage par quelques exemples pour la compréhension de documents visuellement riches
FS-DAG: Few Shot Domain Adapting Graph Networks for Visually Rich Document Understanding

Amit Agarwal, Srikant Panda, Kulbhushan Pachauri•May 22, 2025•222

Universal Reasoner : Un raisonneur unique, composable et prêt à l'emploi pour les LLMs figés
Universal Reasoner: A Single, Composable Plug-and-Play Reasoner for Frozen LLMs

Jaemin Kim, Hangeol Chang, Hyunmin Hwang, Choonghan Kim, Jong Chul Ye•May 25, 2025•212

WebDancer : Vers une Agence Autonome de Recherche d'Information
WebDancer: Towards Autonomous Information Seeking Agency

Jialong Wu, Baixuan Li, Runnan Fang, Wenbiao Yin, Liwen Zhang, Zhengwei Tao, Dingchu Zhang, Zekun Xi, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou•May 28, 2025•185

Évaluer la qualité à travers les langues : Une approche multilingue pour le filtrage des données de prétraitement avec des modèles de langage
Judging Quality Across Languages: A Multilingual Approach to Pretraining Data Filtering with Language Models

Mehdi Ali, Manuel Brack, Max Lübbering, Elias Wendt, Abbas Goher Khan, Richard Rutmann, Alex Jude, Maurice Kraus, Alexander Arno Weber, Felix Stollenwerk, David Kaczér, Florian Mai, Lucie Flek, Rafet Sifa, Nicolas Flores-Herr, Joachim Köhler, Patrick Schramowski, Michael Fromm, Kristian Kersting•May 28, 2025•182

Prédisons phrase par phrase
Let's Predict Sentence by Sentence

Hyeonbin Hwang, Byeongguk Jeon, Seungone Kim, Jiyeon Kim, Hoyeon Chang, Sohee Yang, Seungpil Won, Dohaeng Lee, Youbin Ahn, Minjoon Seo•May 28, 2025•172

Qu'est-ce qui permet la génération de panoramas à 360 degrés à partir de texte avec Stable Diffusion ?
What Makes for Text to 360-degree Panorama Generation with Stable Diffusion?

Jinhong Ni, Chang-Bin Zhang, Qiang Zhang, Jing Zhang•May 28, 2025•152

SVRPBench : Un benchmark réaliste pour le problème de routage de véhicules stochastique
SVRPBench: A Realistic Benchmark for Stochastic Vehicle Routing Problem

Ahmed Heakl, Yahia Salaheldin Shaaban, Martin Takac, Salem Lahlou, Zangir Iklassov•May 28, 2025•152

Sécurité personnalisée dans les LLM : Un benchmark et une approche basée sur un agent planificateur
Personalized Safety in LLMs: A Benchmark and A Planning-Based Agent Approach

Yuchen Wu, Edward Sun, Kaijie Zhu, Jianxun Lian, Jose Hernandez-Orallo, Aylin Caliskan, Jindong Wang•May 24, 2025•142

La réduction de tokens devrait dépasser l'efficacité dans les modèles génératifs -- De la vision, du langage à la multimodalité.
Token Reduction Should Go Beyond Efficiency in Generative Models -- From Vision, Language to Multimodality

Zhenglun Kong, Yize Li, Fanhu Zeng, Lei Xin, Shvat Messica, Xue Lin, Pu Zhao, Manolis Kellis, Hao Tang, Marinka Zitnik•May 23, 2025•143

Vers une théorie dynamique de l'esprit : Évaluation de l'adaptation des LLM à l'évolution temporelle des états humains
Towards Dynamic Theory of Mind: Evaluating LLM Adaptation to Temporal Evolution of Human States

Yang Xiao, Jiashuo Wang, Qiancheng Xu, Changhe Song, Chunpu Xu, Yi Cheng, Wenjie Li, Pengfei Liu•May 23, 2025•142

Penser avec des images générées
Thinking with Generated Images

Ethan Chern, Zhulin Hu, Steffi Chern, Siqi Kou, Jiadi Su, Yan Ma, Zhijie Deng, Pengfei Liu•May 28, 2025•133

CHIMERA : Base de connaissances sur la recombinaison d'idées dans la littérature scientifique
CHIMERA: A Knowledge Base of Idea Recombination in Scientific Literature

Noy Sternlicht, Tom Hope•May 27, 2025•133

Renforcement du raisonnement multi-tours dans les agents LLM via l'attribution de crédit au niveau des tours
Reinforcing Multi-Turn Reasoning in LLM Agents via Turn-Level Credit Assignment

Siliang Zeng, Quan Wei, William Brown, Oana Frunza, Yuriy Nevmyvaka, Mingyi Hong•May 17, 2025•132

LIMOPro : Raffinement du raisonnement pour une mise à l'échelle efficace et performante lors des tests
LIMOPro: Reasoning Refinement for Efficient and Effective Test-time Scaling

Yang Xiao, Jiashuo Wang, Ruifeng Yuan, Chunpu Xu, Kaishuai Xu, Wenjie Li, Pengfei Liu•May 25, 2025•122

VRAG-RL : Renforcer la RAG basée sur la perception visuelle pour la compréhension d'informations visuellement riches via un raisonnement itératif avec apprentissage par renforcement
VRAG-RL: Empower Vision-Perception-Based RAG for Visually Rich Information Understanding via Iterative Reasoning with Reinforcement Learning

Qiuchen Wang, Ruixue Ding, Yu Zeng, Zehui Chen, Lin Chen, Shihang Wang, Pengjun Xie, Fei Huang, Feng Zhao•May 28, 2025•103

EPiC : Apprentissage efficace du contrôle de caméra vidéo avec un guidage précis ancre-vidéo
EPiC: Efficient Video Camera Control Learning with Precise Anchor-Video Guidance

Zun Wang, Jaemin Cho, Jialu Li, Han Lin, Jaehong Yoon, Yue Zhang, Mohit Bansal•May 28, 2025•92

RICO : Amélioration de la précision et de l'exhaustivité dans la recaption d'images via la reconstruction visuelle
RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction

Yuchi Wang, Yishuo Cai, Shuhuai Ren, Sihan Yang, Linli Yao, Yuanxin Liu, Yuanxing Zhang, Pengfei Wan, Xu Sun•May 28, 2025•72

PrismLayers : Données ouvertes pour des modèles génératifs d'images transparentes multicouches de haute qualité
PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models

Junwen Chen, Heyang Jiang, Yanbin Wang, Keming Wu, Ji Li, Chao Zhang, Keiji Yanai, Dong Chen, Yuhui Yuan•May 28, 2025•62

Text2Grad : Apprentissage par Renforcement à partir de Retours en Langage Naturel
Text2Grad: Reinforcement Learning from Natural Language Feedback

Hanyang Wang, Lu Wang, Chaoyun Zhang, Tianjun Mao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang•May 28, 2025•62

Pièges des vérificateurs basés sur des règles et des modèles — Une étude de cas sur le raisonnement mathématique
Pitfalls of Rule- and Model-based Verifiers -- A Case Study on Mathematical Reasoning

Yuzhen Huang, Weihao Zeng, Xingshan Zeng, Qi Zhu, Junxian He•May 28, 2025•62

Prot2Token : Un cadre unifié pour la modélisation des protéines via la prédiction du prochain jeton
Prot2Token: A Unified Framework for Protein Modeling via Next-Token Prediction

Mahdi Pourmirzaei, Farzaneh Esmaili, Salhuldin Alqarghuli, Mohammadreza Pourmirzaei, Ye Han, Kai Chen, Mohsen Rezaei, Duolin Wang, Dong Xu•May 26, 2025•62

MangaVQA et MangaLMM : Un Benchmark et un Modèle Spécialisé pour la Compréhension Multimodale des Mangas
MangaVQA and MangaLMM: A Benchmark and Specialized Model for Multimodal Manga Understanding

Jeonghun Baek, Kazuki Egashira, Shota Onohara, Atsuyuki Miyai, Yuki Imajuku, Hikaru Ikuta, Kiyoharu Aizawa•May 26, 2025•62

Billet aller simple : Encodeur unifié indépendant du temps pour la distillation des modèles de diffusion texte-image
One-Way Ticket:Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion Models

Senmao Li, Lei Wang, Kai Wang, Tao Liu, Jiehang Xie, Joost van de Weijer, Fahad Shahbaz Khan, Shiqi Yang, Yaxing Wang, Jian Yang•May 28, 2025•52

Tout comme les humains ont besoin de vaccins, les modèles aussi : l'immunisation des modèles pour lutter contre les fausses informations.
Just as Humans Need Vaccines, So Do Models: Model Immunization to Combat Falsehoods

Shaina Raza, Rizwan Qureshi, Marcelo Lotif, Aman Chadha, Deval Pandya, Christos Emmanouilidis•May 23, 2025•52

Styl3R : Reconstruction 3D stylisée instantanée pour scènes et styles arbitraires
Styl3R: Instant 3D Stylized Reconstruction for Arbitrary Scenes and Styles

Peng Wang, Xiang Liu, Peidong Liu•May 27, 2025•42

Sélection efficace de données à grande échelle par distillation d'influence
Efficient Data Selection at Scale via Influence Distillation

Mahdi Nikdan, Vincent Cohen-Addad, Dan Alistarh, Vahab Mirrokni•May 25, 2025•42

GRE Suite : Inférence de géolocalisation via des modèles vision-langage affinés et des chaînes de raisonnement améliorées
GRE Suite: Geo-localization Inference via Fine-Tuned Vision-Language Models and Enhanced Reasoning Chains

Chun Wang, Xiaoran Pan, Zihao Pan, Haofan Wang, Yiren Song•May 24, 2025•42

Safe-Sora : Génération sécurisée de vidéos à partir de texte via le tatouage graphique
Safe-Sora: Safe Text-to-Video Generation via Graphical Watermarking

Zihan Su, Xuerui Qiu, Hongbin Xu, Tangyu Jiang, Junhao Zhuang, Chun Yuan, Ming Li, Shengfeng He, Fei Richard Yu•May 19, 2025•42

Greffage d'encodeur visuel Zero-Shot via substituts de LLM
Zero-Shot Vision Encoder Grafting via LLM Surrogates

Kaiyu Yue, Vasu Singla, Menglin Jia, John Kirchenbauer, Rifaa Qadri, Zikui Cai, Abhinav Bhatele, Furong Huang, Tom Goldstein•May 28, 2025•32

FastTD3 : Apprentissage par renforcement simple, rapide et performant pour le contrôle de robots humanoïdes
FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

Younggyo Seo, Carmelo Sferrazza, Haoran Geng, Michal Nauman, Zhao-Heng Yin, Pieter Abbeel•May 28, 2025•32

AITEE — Tuteur Agentique pour le Génie Électrique
AITEE -- Agentic Tutor for Electrical Engineering

Christopher Knievel, Alexander Bernhardt, Christian Bernhardt•May 27, 2025•32

HoPE : Hybride de Position Embedding pour la généralisation de longueur dans les modèles vision-langage
HoPE: Hybrid of Position Embedding for Length Generalization in Vision-Language Models

Haoran Li, Yingjie Qin, Baoyuan Ou, Lai Xu, Ruiwen Xu•May 26, 2025•32

Évaluation comparative de la recommandation, de la classification et du suivi basés sur le graphe de connaissances Hugging Face
Benchmarking Recommendation, Classification, and Tracing Based on Hugging Face Knowledge Graph

Qiaosheng Chen, Kaijia Huang, Xiao Zhou, Weiqing Luo, Yuanning Cui, Gong Cheng•May 23, 2025•32

Apprentissage par méta d'un modèle de transformeur en contexte du cortex visuel supérieur humain
Meta-Learning an In-Context Transformer Model of Human Higher Visual Cortex

Muquan Yu, Mu Nan, Hossein Adeli, Jacob S. Prince, John A. Pyles, Leila Wehbe, Margaret M. Henderson, Michael J. Tarr, Andrew F. Luo•May 21, 2025•32

Caractérisation des biais : Évaluation des modèles de langage de grande envergure en chinois simplifié versus chinois traditionnel
Characterizing Bias: Benchmarking Large Language Models in Simplified versus Traditional Chinese

Hanjia Lyu, Jiebo Luo, Jian Kang, Allison Koenecke•May 28, 2025•22

À l'endroit ? Démêler la compréhension de l'orientation dans les MLLM grâce à des tâches de perception multi-axes à granularité fine
Right Side Up? Disentangling Orientation Understanding in MLLMs with Fine-grained Multi-axis Perception Tasks

Keanu Nichols, Nazia Tasnim, Yan Yuting, Nicholas Ikechukwu, Elva Zou, Deepti Ghadiyaram, Bryan Plummer•May 27, 2025•22

Révélation des Neurones et Experts Spécifiques aux Instructions : Un Cadre Analytique pour les Capacités de Suivi d'Instructions des Modèles de Langage à Grande Échelle
Unveiling Instruction-Specific Neurons & Experts: An Analytical Framework for LLM's Instruction-Following Capabilities

Junyan Zhang, Yubo Gao, Yibo Yan, Jungang Li, Zhaorui Hou, Sicheng Tao, Shuliang Liu, Song Dai, Yonghua Hei, Junzhuo Li, Xuming Hu•May 27, 2025•21

MUSEG : Renforcement de la compréhension temporelle vidéo via un ancrage multi-segment basé sur des horodatages
MUSEG: Reinforcing Video Temporal Understanding via Timestamp-Aware Multi-Segment Grounding

Fuwen Luo, Shengfeng Lou, Chi Chen, Ziyue Wang, Chenliang Li, Weizhou Shen, Jiyue Guo, Peng Li, Ming Yan, Ji Zhang, Fei Huang, Yang Liu•May 27, 2025•22

Effacement précis des concepts dans les paramètres des grands modèles de langage
Precise In-Parameter Concept Erasure in Large Language Models

Yoav Gur-Arieh, Clara Suslik, Yihuai Hong, Fazl Barez, Mor Geva•May 28, 2025•12

Vers un pré-entraînement évolutif langage-image pour l'imagerie médicale 3D
Towards Scalable Language-Image Pre-training for 3D Medical Imaging

Chenhui Zhao, Yiwei Lyu, Asadur Chowdury, Edward Harake, Akhil Kondepudi, Akshay Rao, Xinhai Hou, Honglak Lee, Todd Hollon•May 28, 2025•12

Les grands modèles de langage peuvent-ils inférer des relations causales à partir de textes du monde réel ?
Can Large Language Models Infer Causal Relationships from Real-World Text?

Ryan Saklad, Aman Chadha, Oleg Pavlov, Raha Moraffah•May 25, 2025•12

Première Finition de Recherche : Mise à l'échelle Efficace en Temps de Test dans les Grands Modèles de Langage
First Finish Search: Efficient Test-Time Scaling in Large Language Models

Aradhye Agarwal, Ayan Sengupta, Tanmoy Chakraborty•May 23, 2025•12

IQBench : Quelle est l'« intelligence » des modèles vision-langage ? Une étude avec des tests de QI humains
IQBench: How "Smart'' Are Vision-Language Models? A Study with Human IQ Tests

Tan-Hanh Pham, Phu-Vinh Nguyen, Dang The Hung, Bui Trong Duong, Vu Nguyen Thanh, Chris Ngo, Tri Quang Truong, Truong-Son Hy•May 17, 2025•02