ChatPaper.aiChatPaper.ai
Accueil

arXiv

HuggingFace

TarifsCompteEspace de travail

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Articles de Recherche en IA Quotidiens

Articles de recherche en IA sélectionnés quotidiennement avec traductions

Sera-t-il encore vrai demain ? Classification multilingue des questions pérennes pour améliorer la fiabilité des systèmes de question-réponse
Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA

Sergey Pletenev, Maria Marina, Nikolay Ivanov, Daria Galimzianova, Nikita Krayko, Mikhail Salnikov, Vasily Konovalov, Alexander Panchenko, Viktor Moskvoretskii•May 27, 2025•1114

Exploitation de l'auto-attention pour l'incitation contextuelle dépendante de l'entrée dans les LLM
Leveraging Self-Attention for Input-Dependent Soft Prompting in LLMs

Ananth Muppidi, Abhilash Nandy, Sambaran Bandyopadhyay•Jun 5, 2025•322

MORSE-500 : Un benchmark vidéo contrôlable par programmation pour tester en profondeur le raisonnement multimodal
MORSE-500: A Programmatically Controllable Video Benchmark to Stress-Test Multimodal Reasoning

Zikui Cai, Andrew Wang, Anirudh Satheesh, Ankit Nakhawa, Hyunwoo Jae, Keenan Powell, Minghui Liu, Neel Jay, Sungbin Oh, Xiyao Wang, Yongyuan Liang, Tom Goldstein, Furong Huang•Jun 5, 2025•312

FusionAudio-1.2M : Vers une description audio fine avec fusion contextuelle multimodale
FusionAudio-1.2M: Towards Fine-grained Audio Captioning with Multimodal Contextual Fusion

Shunian Chen, Xinyuan Xie, Zheshu Chen, Liyan Zhao, Owen Lee, Zhan Su, Qilin Sun, Benyou Wang•Jun 1, 2025•292

PartCrafter : Génération de maillages 3D structurés via des transformeurs de diffusion latente compositionnelle
PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers

Yuchen Lin, Chenguo Lin, Panwang Pan, Honglei Yan, Yiqiang Feng, Yadong Mu, Katerina Fragkiadaki•Jun 5, 2025•283

La vérité dans le peu : sélection de données à haute valeur pour un raisonnement multimodal efficace
Truth in the Few: High-Value Data Selection for Efficient Multi-Modal Reasoning

Shenshen Li, Kaiyuan Deng, Lei Wang, Hao Yang, Chong Peng, Peng Yan, Fumin Shen, Heng Tao Shen, Xing Xu•Jun 5, 2025•242

Sentinel : Modèle SOTA pour se protéger contre les injections de prompts
Sentinel: SOTA model to protect against prompt injections

Dror Ivry, Oran Nahum•Jun 5, 2025•212

L'extension de la modalité est-elle la voie appropriée vers l'omni-modalité ?
Is Extending Modality The Right Path Towards Omni-Modality?

Tinghui Zhu, Kai Zhang, Muhao Chen, Yu Su•Jun 2, 2025•192

STARFlow : Mise à l'échelle des flux normalisants latents pour la synthèse d'images haute résolution
STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis

Jiatao Gu, Tianrong Chen, David Berthelot, Huangjie Zheng, Yuyang Wang, Ruixiang Zhang, Laurent Dinh, Miguel Angel Bautista, Josh Susskind, Shuangfei Zhai•Jun 6, 2025•182

Modèles de langage à grande échelle sensibles à l'audio comme évaluateurs des styles d'expression orale
Audio-Aware Large Language Models as Judges for Speaking Styles

Cheng-Han Chiang, Xiaofei Wang, Chung-Ching Lin, Kevin Lin, Linjie Li, Radu Kopetz, Yao Qian, Zhendong Wang, Zhengyuan Yang, Hung-yi Lee, Lijuan Wang•Jun 6, 2025•144

Modèle du Monde Médical : Simulation Générative de l'Évolution Tumorale pour la Planification Thérapeutique
Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning

Yijun Yang, Zhao-Yang Wang, Qiuping Liu, Shuwen Sun, Kang Wang, Rama Chellappa, Zongwei Zhou, Alan Yuille, Lei Zhu, Yu-Dong Zhang, Jieneng Chen•Jun 2, 2025•132

CodeContests+ : Génération de cas de test de haute qualité pour la programmation compétitive
CodeContests+: High-Quality Test Case Generation for Competitive Programming

Zihan Wang, Siyao Liu, Yang Sun, Hongyan Li, Kai Shen•Jun 6, 2025•82

Précision Classée par les Pairs : Création d'un Ensemble de Données Fondamental pour le Réglage Fin de Modèles de Vision à partir des Images Annotées de DataSeeds
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery

Sajjad Abdoli, Freeman Lewin, Gediminas Vasiliauskas, Fabian Schonholz•Jun 6, 2025•82

Projection de Scènes Physiques : Réalité à Simulation de Bout en Bout à partir de Données Robotiques Imparfaites
Splatting Physical Scenes: End-to-End Real-to-Sim from Imperfect Robot Data

Ben Moran, Mauro Comi, Steven Bohez, Tom Erez, Zhibin Li, Leonard Hasenclever•Jun 4, 2025•72

Relier les perspectives : Une étude sur l'intelligence collaborative inter-vues avec la vision égocentrique et exocentrique
Bridging Perspectives: A Survey on Cross-view Collaborative Intelligence with Egocentric-Exocentric Vision

Yuping He, Yifei Huang, Guo Chen, Lidong Lu, Baoqi Pei, Jilan Xu, Tong Lu, Yoichi Sato•Jun 6, 2025•62

3DFlowAction : Apprentissage de la manipulation inter-embodiment à partir d'un modèle de monde de flux 3D
3DFlowAction: Learning Cross-Embodiment Manipulation from 3D Flow World Model

Hongyan Zhi, Peihao Chen, Siyuan Zhou, Yubo Dong, Quanxi Wu, Lei Han, Mingkui Tan•Jun 6, 2025•52

MIRIAD : Amélioration des LLM grâce à des millions de paires requête-réponse médicales
MIRIAD: Augmenting LLMs with millions of medical query-response pairs

Qinyue Zheng, Salman Abdullah, Sam Rawal, Cyril Zakka, Sophie Ostmeier, Maximilian Purk, Eduardo Reis, Eric J. Topol, Jure Leskovec, Michael Moor•Jun 6, 2025•52

HASHIRU : Système d'Agents Hiérarchique pour l'Utilisation Hybride Intelligente des Ressources
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization

Kunal Pai, Parth Shah, Harshil Patel•Jun 1, 2025•52

Prefix Grouper : Entraînement efficace de GRPO via le partage de préfixes en propagation avant
Prefix Grouper: Efficient GRPO Training through Shared-Prefix Forward

Zikang Liu, Tongtian Yue, Yepeng Tang, Longteng Guo, Junxian Cai, Qingbin Liu, Xi Chen, Jing Liu•Jun 5, 2025•42

Quand les modèles en savent plus qu'ils ne peuvent expliquer : Quantifier le transfert de connaissances dans la collaboration humain-IA
When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

Quan Shi, Carlos E. Jimenez, Shunyu Yao, Nick Haber, Diyi Yang, Karthik Narasimhan•Jun 5, 2025•32

Quand la sémantique égare la vision : Atténuer les hallucinations des grands modèles multimodaux dans la détection et la compréhension du texte scénique
When Semantics Mislead Vision: Mitigating Large Multimodal Models Hallucinations in Scene Text Spotting and Understanding

Yan Shu, Hangui Lin, Yexin Liu, Yan Zhang, Gangyan Zeng, Yan Li, Yu Zhou, Ser-Nam Lim, Harry Yang, Nicu Sebe•Jun 5, 2025•32

GuideX : Génération guidée de données synthétiques pour l'extraction d'information en contexte zero-shot
GuideX: Guided Synthetic Data Generation for Zero-Shot Information Extraction

Neil De La Fuente, Oscar Sainz, Iker García-Ferrero, Eneko Agirre•May 31, 2025•32

AssetOpsBench : Évaluation comparative des agents d'IA pour l'automatisation des tâches dans les opérations et la maintenance des actifs industriels
AssetOpsBench: Benchmarking AI Agents for Task Automation in Industrial Asset Operations and Maintenance

Dhaval Patel, Shuxin Lin, James Rayfield, Nianjun Zhou, Roman Vaculin, Natalia Martinez, Fearghal O'donncha, Jayant Kalagnanam•Jun 4, 2025•12

Les modèles d'état espace éparsifiés sont des réseaux autoroutiers efficaces.
Sparsified State-Space Models are Efficient Highway Networks

Woomin Song, Jihoon Tack, Sangwoo Mo, Seunghyuk Oh, Jinwoo Shin•May 27, 2025•12