ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
May 14th, 2024
Quels sont les éléments essentiels lors de la construction de modèles vision-langage ?
What matters when building vision-language models?
Hugo Laurençon, Léo Tronchon, Matthieu Cord, Victor Sanh
•
May 3, 2024
•
104
3
Flux de travail RLHF : De la modélisation de la récompense au RLHF en ligne
RLHF Workflow: From Reward Modeling to Online RLHF
Hanze Dong, Wei Xiong, Bo Pang, Haoxiang Wang, Han Zhao, Yingbo Zhou, Nan Jiang, Doyen Sahoo, Caiming Xiong, Tong Zhang
•
May 13, 2024
•
71
5
SUTRA : Architecture de modèle de langage multilingue évolutive
SUTRA: Scalable Multilingual Language Model Architecture
Abhijit Bendale, Michael Sapienza, Steven Ripplinger, Simon Gibbs, Jaewon Lee, Pranav Mistry
•
May 7, 2024
•
40
2
SambaNova SN40L : Surmonter le mur de la mémoire en IA grâce au flux de données et à la composition d'experts
SambaNova SN40L: Scaling the AI Memory Wall with Dataflow and Composition of Experts
Raghu Prabhakar, Ram Sivaramakrishnan, Darshan Gandhi, Yun Du, Mingran Wang, Xiangyu Song, Kejie Zhang, Tianren Gao, Angela Wang, Karen Li, Yongning Sheng, Joshua Brot, Denis Sokolov, Apurv Vivek, Calvin Leung, Arjun Sabnis, Jiayu Bai, Tuowen Zhao, Mark Gottscho, David Jackson, Mark Luttrell, Manish K. Shah, Edison Chen, Kaizhao Liang, Swayambhoo Jain, Urmish Thakker, Dawei Huang, Sumti Jairath, Kevin J. Brown, Kunle Olukotun
•
May 13, 2024
•
28
0
MS MARCO Web Search : un vaste ensemble de données web riche en informations avec des millions de labels de clics réels
MS MARCO Web Search: a Large-scale Information-rich Web Dataset with Millions of Real Click Labels
Qi Chen, Xiubo Geng, Corby Rosset, Carolyn Buractaon, Jingwen Lu, Tao Shen, Kun Zhou, Chenyan Xiong, Yeyun Gong, Paul Bennett, Nick Craswell, Xing Xie, Fan Yang, Bryan Tower, Nikhil Rao, Anlei Dong, Wenqi Jiang, Zheng Liu, Mingqin Li, Chuanjie Liu, Zengzhong Li, Rangan Majumder, Jennifer Neville, Andy Oakley, Knut Magne Risvik, Harsha Vardhan Simhadri, Manik Varma, Yujing Wang, Linjun Yang, Mao Yang, Ce Zhang
•
May 13, 2024
•
22
1
Plot2Code : Un Benchmark Complet pour l'Évaluation des Modèles de Langage Multimodaux de Grande Taille dans la Génération de Code à partir de Graphiques Scientifiques
Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots
Chengyue Wu, Yixiao Ge, Qiushan Guo, Jiahao Wang, Zhixuan Liang, Zeyu Lu, Ying Shan, Ping Luo
•
May 13, 2024
•
21
4
Piccolo2 : Encodage de texte généralisé par entraînement avec fonction de perte hybride multi-tâches
Piccolo2: General Text Embedding with Multi-task Hybrid Loss Training
Junqin Huang, Zhongjie Hu, Zihao Jing, Mengya Gao, Yichao Wu
•
May 11, 2024
•
21
1
LogoMotion : Génération de code visuellement ancré pour des animations adaptées au contenu
LogoMotion: Visually Grounded Code Generation for Content-Aware Animation
Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
•
May 11, 2024
•
19
2
Les grands modèles de langage en tant que générateurs de domaines de planification
Large Language Models as Planning Domain Generators
James Oswald, Kavitha Srinivas, Harsha Kokel, Junkyu Lee, Michael Katz, Shirin Sohrabi
•
Apr 2, 2024
•
14
2