ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
February 13th, 2024
Modèle Aya : Un modèle de langage multilingue en accès libre affiné par instruction
Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model
Ahmet Üstün, Viraat Aryabumi, Zheng-Xin Yong, Wei-Yin Ko, Daniel D'souza, Gbemileke Onilude, Neel Bhandari, Shivalika Singh, Hui-Lee Ooi, Amr Kayid, Freddie Vargus, Phil Blunsom, Shayne Longpre, Niklas Muennighoff, Marzieh Fadaee, Julia Kreutzer, Sara Hooker
•
Feb 12, 2024
•
49
2
OS-Copilot : Vers des agents informatiques généralistes dotés d’auto-amélioration
OS-Copilot: Towards Generalist Computer Agents with Self-Improvement
Zhiyong Wu, Chengcheng Han, Zichen Ding, Zhenmin Weng, Zhoumianze Liu, Shunyu Yao, Tao Yu, Lingpeng Kong
•
Feb 12, 2024
•
46
4
ChemLLM : Un modèle de langage de grande envergure pour la chimie
ChemLLM: A Chemical Large Language Model
Di Zhang, Wei Liu, Qian Tan, Jingdan Chen, Hang Yan, Yuliang Yan, Jiatong Li, Weiran Huang, Xiangyu Yue, Dongzhan Zhou, Shufei Zhang, Mao Su, Hansen Zhong, Yuqiang Li, Wanli Ouyang
•
Feb 10, 2024
•
31
7
Fiddler : Orchestration CPU-GPU pour l'inférence rapide des modèles de mélange d'experts
Fiddler: CPU-GPU Orchestration for Fast Inference of Mixture-of-Experts Models
Keisuke Kamahori, Yile Gu, Kan Zhu, Baris Kasikci
•
Feb 10, 2024
•
17
1
PIVOT : L'incitation visuelle itérative suscite des connaissances exploitables pour les modèles de langage visuel.
PIVOT: Iterative Visual Prompting Elicits Actionable Knowledge for VLMs
Soroush Nasiriany, Fei Xia, Wenhao Yu, Ted Xiao, Jacky Liang, Ishita Dasgupta, Annie Xie, Danny Driess, Ayzaan Wahid, Zhuo Xu, Quan Vuong, Tingnan Zhang, Tsang-Wei Edward Lee, Kuang-Huei Lee, Peng Xu, Sean Kirmani, Yuke Zhu, Andy Zeng, Karol Hausman, Nicolas Heess, Chelsea Finn, Sergey Levine, Brian Ichter
•
Feb 12, 2024
•
16
2
Rendre la synthèse vocale à partir de texte en zero-shot basée sur le Flow-Matching capable de rire comme vous le souhaitez
Making Flow-Matching-Based Zero-Shot Text-to-Speech Laugh as You Like
Naoyuki Kanda, Xiaofei Wang, Sefik Emre Eskimez, Manthan Thakker, Hemin Yang, Zirun Zhu, Min Tang, Canrun Li, Steven Tsai, Zhen Xiao, Yufei Xia, Jinzhu Li, Yanqing Liu, Sheng Zhao, Michael Zeng
•
Feb 12, 2024
•
16
1
Prismatic VLMs : Exploration de l'espace de conception des modèles de langage conditionnés visuellement
Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models
Siddharth Karamcheti, Suraj Nair, Ashwin Balakrishna, Percy Liang, Thomas Kollar, Dorsa Sadigh
•
Feb 12, 2024
•
15
2
AutoMathText : Sélection autonome de données avec des modèles de langage pour les textes mathématiques
AutoMathText: Autonomous Data Selection with Language Models for Mathematical Texts
Yifan Zhang, Yifan Luo, Yang Yuan, Andrew Chi-Chih Yao
•
Feb 12, 2024
•
15
2
Une histoire de queues : L'effondrement des modèles comme changement des lois d'échelle
A Tale of Tails: Model Collapse as a Change of Scaling Laws
Elvis Dohmatob, Yunzhen Feng, Pu Yang, Francois Charton, Julia Kempe
•
Feb 10, 2024
•
15
1
Lois d'échelle pour les mélanges d'experts à granularité fine
Scaling Laws for Fine-Grained Mixture of Experts
Jakub Krajewski, Jan Ludziejewski, Kamil Adamczewski, Maciej Pióro, Michał Krutul, Szymon Antoniak, Kamil Ciebiera, Krystian Król, Tomasz Odrzygóźdź, Piotr Sankowski, Marek Cygan, Sebastian Jaszczur
•
Feb 12, 2024
•
14
1
ODIN : La récompense désentrelacée atténue le piratage dans l'apprentissage par renforcement avec feedback humain
ODIN: Disentangled Reward Mitigates Hacking in RLHF
Lichang Chen, Chen Zhu, Davit Soselia, Jiuhai Chen, Tianyi Zhou, Tom Goldstein, Heng Huang, Mohammad Shoeybi, Bryan Catanzaro
•
Feb 11, 2024
•
14
1
LiRank : Modèles de classement à grande échelle industriels chez LinkedIn
LiRank: Industrial Large Scale Ranking Models at LinkedIn
Fedor Borisyuk, Mingzhou Zhou, Qingquan Song, Siyu Zhu, Birjodh Tiwana, Ganesh Parameswaran, Siddharth Dangi, Lars Hertel, Qiang Xiao, Xiaochen Hou, Yunbo Ouyang, Aman Gupta, Sheallika Singh, Dan Liu, Hailing Cheng, Lei Le, Jonathan Hung, Sathiya Keerthi, Ruoyan Wang, Fengyu Zhang, Mohit Kothari, Chen Zhu, Daqi Sun, Yun Dai, Xun Luan, Sirou Zhu, Zhiwei Wang, Neil Daftary, Qianqi Shen, Chengming Jiang, Haichao Wei, Maneesh Varshney, Amol Ghoting, Souvik Ghosh
•
Feb 10, 2024
•
13
1
GALA3D : Vers la génération de scènes complexes 3D à partir de texte via un éclatement gaussien génératif guidé par la disposition
GALA3D: Towards Text-to-3D Complex Scene Generation via Layout-guided Generative Gaussian Splatting
Xiaoyu Zhou, Xingjian Ran, Yajiao Xiong, Jinlin He, Zhiwei Lin, Yongtao Wang, Deqing Sun, Ming-Hsuan Yang
•
Feb 11, 2024
•
11
1
Réglage Pas-à-Pas : Mise à l'échelle de l'auto-alignement des LLM par amorçage
Step-On-Feet Tuning: Scaling Self-Alignment of LLMs via Bootstrapping
Haoyu Wang, Guozheng Ma, Ziqiao Meng, Zeyu Qin, Li Shen, Zhong Zhang, Bingzhe Wu, Liu Liu, Yatao Bian, Tingyang Xu, Xueqian Wang, Peilin Zhao
•
Feb 12, 2024
•
10
1
Amélioration des politiques grâce aux modèles de feedback linguistique
Policy Improvement using Language Feedback Models
Victor Zhong, Dipendra Misra, Xingdi Yuan, Marc-Alexandre Côté
•
Feb 12, 2024
•
9
1