ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
October 3rd, 2024
La mise en alignement des préférences est-elle toujours la meilleure option pour améliorer la traduction basée sur les LLM ? Une analyse empirique
Is Preference Alignment Always the Best Option to Enhance LLM-Based Translation? An Empirical Analysis
Hippolyte Gisserot-Boukhlef, Ricardo Rei, Emmanuel Malherbe, Céline Hudelot, Pierre Colombo, Nuno M. Guerreiro
•
Sep 30, 2024
•
16
2
HarmoniCa : Harmonisation de l'entraînement et de l'inférence pour une meilleure mise en cache des caractéristiques dans l'accélération du transformateur de diffusion
HarmoniCa: Harmonizing Training and Inference for Better Feature Cache in Diffusion Transformer Acceleration
Yushi Huang, Zining Wang, Ruihao Gong, Jing Liu, Xinjie Zhang, Jinyang Guo, Xianglong Liu, Jun Zhang
•
Oct 2, 2024
•
5
2
FactAlign : Alignement de la factualité à longue portée des grands modèles de langage
FactAlign: Long-form Factuality Alignment of Large Language Models
Chao-Wei Huang, Yun-Nung Chen
•
Oct 2, 2024
•
9
2
Quantification de la complexité de généralisation pour les grands modèles de langage
Quantifying Generalization Complexity for Large Language Models
Zhenting Qi, Hongyin Luo, Xuliang Huang, Zhuokai Zhao, Yibo Jiang, Xiangjun Fan, Himabindu Lakkaraju, James Glass
•
Oct 2, 2024
•
14
2
Agrégation sélective pour l'adaptation à faible rang dans l'apprentissage fédéré
Selective Aggregation for Low-Rank Adaptation in Federated Learning
Pengxin Guo, Shuang Zeng, Yanran Wang, Huijie Fan, Feifei Wang, Liangqiong Qu
•
Oct 2, 2024
•
19
3
Modélisation générale des préférences avec des représentations de préférences pour l'alignement des modèles de langage
General Preference Modeling with Preference Representations for Aligning Language Models
Yifan Zhang, Ge Zhang, Yue Wu, Kangping Xu, Quanquan Gu
•
Oct 3, 2024
•
9
4
RATIONALYST : Processus de pré-entraînement supervisé pour améliorer le raisonnement
RATIONALYST: Pre-training Process-Supervision for Improving Reasoning
Dongwei Jiang, Guoxuan Wang, Yining Lu, Andrew Wang, Jingyu Zhang, Chuyu Liu, Benjamin Van Durme, Daniel Khashabi
•
Oct 1, 2024
•
37
3
Planification robotique à long terme en boucle fermée via modélisation de séquences d'équilibre.
Closed-loop Long-horizon Robotic Planning via Equilibrium Sequence Modeling
Jinghan Li, Zhicheng Sun, Fei Li, Cao Sheng, Jiazhong Yu, Yadong Mu
•
Oct 2, 2024
•
4
2
LEOPARD : Un modèle de langage vision pour les tâches multi-images riches en texte
LEOPARD : A Vision Language Model For Text-Rich Multi-Image Tasks
Mengzhao Jia, Wenhao Yu, Kaixin Ma, Tianqing Fang, Zhihan Zhang, Siru Ouyang, Hongming Zhang, Meng Jiang, Dong Yu
•
Oct 2, 2024
•
26
5
HelpSteer2-Preference : Compléter les évaluations avec les préférences
HelpSteer2-Preference: Complementing Ratings with Preferences
Zhilin Wang, Alexander Bukharin, Olivier Delalleau, Daniel Egert, Gerald Shen, Jiaqi Zeng, Oleksii Kuchaiev, Yi Dong
•
Oct 2, 2024
•
24
5
Banc E.T. : Vers une compréhension ouverte des événements au niveau vidéo-langage
E.T. Bench: Towards Open-Ended Event-Level Video-Language Understanding
Ye Liu, Zongyang Ma, Zhongang Qi, Yang Wu, Ying Shan, Chang Wen Chen
•
Sep 26, 2024
•
7
2
MOSEL : 950 000 heures de données vocales pour la formation de modèles de base de la parole en source ouverte sur les langues de l'UE
MOSEL: 950,000 Hours of Speech Data for Open-Source Speech Foundation Model Training on EU Languages
Marco Gaido, Sara Papi, Luisa Bentivogli, Alessio Brutti, Mauro Cettolo, Roberto Gretter, Marco Matassoni, Mohamed Nabih, Matteo Negri
•
Oct 1, 2024
•
15
2
SonicSim : Une plateforme de simulation personnalisable pour le traitement de la parole dans des scénarios de sources sonores en mouvement
SonicSim: A customizable simulation platform for speech processing in moving sound source scenarios
Kai Li, Wendi Sang, Chang Zeng, Runxuan Yang, Guo Chen, Xiaolin Hu
•
Oct 2, 2024
•
3
2
De la programmation à la correction : Fermer le dernier kilomètre de la génération de code avec le débogage hiérarchique
From Code to Correctness: Closing the Last Mile of Code Generation with Hierarchical Debugging
Yuling Shi, Songsong Wang, Chengcheng Wan, Xiaodong Gu
•
Oct 2, 2024
•
33
8
InfiniPot : Traitement de Contexte Infini sur des LLMs à Mémoire Limitée
InfiniPot: Infinite Context Processing on Memory-Constrained LLMs
Minsoo Kim, Kyuhong Shim, Jungwook Choi, Simyung Chang
•
Oct 2, 2024
•
3
2
EmoKnob : Améliorer le clonage vocal avec un contrôle émotionnel finement ajusté
EmoKnob: Enhance Voice Cloning with Fine-Grained Emotion Control
Haozhe Chen, Run Chen, Julia Hirschberg
•
Oct 1, 2024
•
7
2
Tous les raisonneurs LLM ne sont pas créés égaux.
Not All LLM Reasoners Are Created Equal
Arian Hosseini, Alessandro Sordoni, Daniel Toyama, Aaron Courville, Rishabh Agarwal
•
Oct 2, 2024
•
29
2
VLMGuard : Protéger les VLM contre les invites malveillantes via des données non étiquetées
VLMGuard: Defending VLMs against Malicious Prompts via Unlabeled Data
Xuefeng Du, Reshmi Ghosh, Robert Sim, Ahmed Salem, Vitor Carvalho, Emily Lawton, Yixuan Li, Jack W. Stokes
•
Oct 1, 2024
•
5
2
Ancien Optimiseur, Nouvelle Norme : Une Anthologie
Old Optimizer, New Norm: An Anthology
Jeremy Bernstein, Laker Newhouse
•
Sep 30, 2024
•
4
2
PHI-S : Équilibrage de la distribution pour la distillation multi-enseignant sans étiquette
PHI-S: Distribution Balancing for Label-Free Multi-Teacher Distillation
Mike Ranzinger, Jon Barker, Greg Heinrich, Pavlo Molchanov, Bryan Catanzaro, Andrew Tao
•
Oct 2, 2024
•
36
4
3DGS-DET : Renforcez la projection gaussienne 3D avec un guidage des frontières et un échantillonnage axé sur les boîtes pour la détection d'objets 3D.
3DGS-DET: Empower 3D Gaussian Splatting with Boundary Guidance and Box-Focused Sampling for 3D Object Detection
Yang Cao, Yuanliang Jv, Dan Xu
•
Oct 2, 2024
•
31
2
ComfyGen : Workflows adaptatifs aux requêtes pour la génération de texte en image
ComfyGen: Prompt-Adaptive Workflows for Text-to-Image Generation
Rinon Gal, Adi Haviv, Yuval Alaluf, Amit H. Bermano, Daniel Cohen-Or, Gal Chechik
•
Oct 2, 2024
•
17
2
BordIRlines : un ensemble de données pour évaluer la génération améliorée par la recherche interlingue
BordIRlines: A Dataset for Evaluating Cross-lingual Retrieval-Augmented Generation
Bryan Li, Samar Haider, Fiona Luo, Adwait Agashe, Chris Callison-Burch
•
Oct 2, 2024
•
6
4
EVER : Rendu Ellipsoïdal Volumétrique Exact pour la Synthèse de Vue en Temps Réel
EVER: Exact Volumetric Ellipsoid Rendering for Real-time View Synthesis
Alexander Mai, Peter Hedman, George Kopanas, Dor Verbin, David Futschik, Qiangeng Xu, Falko Kuester, Jon Barron, Yinda Zhang
•
Oct 2, 2024
•
7
2