ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
March 13th, 2025
RewardSDS : Alignement de la distillation de scores par échantillonnage pondéré par récompense
RewardSDS: Aligning Score Distillation via Reward-Weighted Sampling
Itay Chachy, Guy Yariv, Sagie Benaim
•
Mar 12, 2025
•
15
2
GTR : Renforcement Guidé de la Pensée pour Prévenir l'Effondrement de la Pensée dans l'Entraînement d'Agents VLM Basés sur l'Apprentissage par Renforcement
GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training
Tong Wei, Yijun Yang, Junliang Xing, Yuanchun Shi, Zongqing Lu, Deheng Ye
•
Mar 11, 2025
•
17
2
Quantification des grands modèles de langage pour la génération de code : une réplication différenciée
Quantizing Large Language Models for Code Generation: A Differentiated Replication
Alessandro Giagnorio, Antonio Mastropaolo, Saima Afrin, Massimiliano Di Penta, Gabriele Bavota
•
Mar 10, 2025
•
8
2
MoC : Mélanges de classificateurs de segments textuels pour un système de génération augmentée par récupération
MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System
Jihao Zhao, Zhiyuan Ji, Zhaoxin Fan, Hanyu Wang, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li
•
Mar 12, 2025
•
4
3
PhysicsGen : Les modèles génératifs peuvent-ils apprendre à partir d'images pour prédire des relations physiques complexes ?
PhysicsGen: Can Generative Models Learn from Images to Predict Complex Physical Relations?
Martin Spitznagel, Jan Vaillant, Janis Keuper
•
Mar 7, 2025
•
8
2
Plus de documents, même longueur : Isoler le défi des documents multiples dans RAG
More Documents, Same Length: Isolating the Challenge of Multiple Documents in RAG
Shahar Levy, Nir Mazor, Lihi Shalmon, Michael Hassid, Gabriel Stanovsky
•
Mar 6, 2025
•
16
3
Motion Anything : Génération de mouvement à partir de n'importe quoi
Motion Anything: Any to Motion Generation
Zeyu Zhang, Yiran Wang, Wei Mao, Danning Li, Rui Zhao, Biao Wu, Zirui Song, Bohan Zhuang, Ian Reid, Richard Hartley
•
Mar 10, 2025
•
32
6
VLog : Modèles vidéo-langage par récupération générative de narration Vocabulaire
VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary
Kevin Qinghong Lin, Mike Zheng Shou
•
Mar 12, 2025
•
7
2
Attention Groupée par Requêtes à Coût Optimal pour les LLM à Contexte Long
Cost-Optimal Grouped-Query Attention for Long-Context LLMs
Yingfa Chen, Yutong Wu, Xu Han, Zhiyuan Liu, Maosong Sun
•
Mar 12, 2025
•
5
2
Monte Carlo Diffusion pour un RANSAC basé sur l'apprentissage généralisable
Monte Carlo Diffusion for Generalizable Learning-Based RANSAC
Jiale Wang, Chen Zhao, Wei Ke, Tong Zhang
•
Mar 12, 2025
•
1
2
Block Diffusion : Interpolation entre modèles de langage autorégressifs et de diffusion
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models
Marianne Arriola, Aaron Gokaslan, Justin T Chiu, Zhihan Yang, Zhixuan Qi, Jiaqi Han, Subham Sekhar Sahoo, Volodymyr Kuleshov
•
Mar 12, 2025
•
71
3
WildIFEval : Suivi d'instructions en contexte réel
WildIFEval: Instruction Following in the Wild
Gili Lior, Asaf Yehudai, Ariel Gera, Liat Ein-Dor
•
Mar 9, 2025
•
13
4
BIMBA : Compression par balayage sélectif pour la réponse à des questions sur des vidéos à longue portée
BIMBA: Selective-Scan Compression for Long-Range Video Question Answering
Md Mohaiminul Islam, Tushar Nagarajan, Huiyu Wang, Gedas Bertasius, Lorenzo Torresani
•
Mar 12, 2025
•
3
2
Comprendre et atténuer les décalages de distribution pour l'apprentissage automatique Champs de force
Understanding and Mitigating Distribution Shifts For Machine Learning Force Fields
Tobias Kreiman, Aditi S. Krishnapriyan
•
Mar 11, 2025
•
0
3
Assistant Médical Basé sur des Agents Multiples pour Dispositifs de Bord
Multi Agent based Medical Assistant for Edge Devices
Sakharam Gawade, Shivam Akhouri, Chinmay Kulkarni, Jagdish Samant, Pragya Sahu, Aastik, Jai Pahal, Saswat Meher
•
Mar 7, 2025
•
7
2
Modèles de Diffusion Latente Sans Alias : Amélioration de l'Équivariance par Décalage Fractionnel dans l'Espace Latent de Diffusion
Alias-Free Latent Diffusion Models:Improving Fractional Shift Equivariance of Diffusion Latent Space
Yifan Zhou, Zeqi Xiao, Shuai Yang, Xingang Pan
•
Mar 12, 2025
•
6
2
Search-R1 : Entraînement des LLM à raisonner et à exploiter les moteurs de recherche grâce à l'apprentissage par renforcement
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning
Bowen Jin, Hansi Zeng, Zhenrui Yue, Dong Wang, Hamed Zamani, Jiawei Han
•
Mar 12, 2025
•
28
2
Quand un grand modèle vision-langage rencontre de vastes images de télédétection : Élagage de tokens guidé par texte, du grossier au fin
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning
Junwei Luo, Yingying Zhang, Xue Yang, Kang Wu, Qi Zhu, Lei Liang, Jingdong Chen, Yansheng Li
•
Mar 10, 2025
•
7
3
Modélisation Linguistique Multimodale pour l'Analyse et la Génération de Transcriptomique à Cellule Unique de Haute Précision
Multimodal Language Modeling for High-Accuracy Single Cell Transcriptomics Analysis and Generation
Yaorui Shi, Jiaqi Yang, Sihang Li, Junfeng Fang, Xiang Wang, Zhiyuan Liu, Yang Zhang
•
Mar 12, 2025
•
4
2
Auto-apprentissage et auto-correction pour les petits modèles de langage
Self-Taught Self-Correction for Small Language Models
Viktor Moskvoretskii, Chris Biemann, Irina Nikishina
•
Mar 11, 2025
•
15
2
TPDiff : Modèle de diffusion vidéo à pyramide temporelle
TPDiff: Temporal Pyramid Video Diffusion Model
Lingmin Ran, Mike Zheng Shou
•
Mar 12, 2025
•
45
3
Reangle-A-Video : Génération de vidéos 4D comme traduction vidéo-à-vidéo
Reangle-A-Video: 4D Video Generation as Video-to-Video Translation
Hyeonho Jeong, Suhyeon Lee, Jong Chul Ye
•
Mar 12, 2025
•
32
2