ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
February 16th, 2024
Raisonnement en Chaîne de Pensée Sans Incitation
Chain-of-Thought Reasoning Without Prompting
Xuezhi Wang, Denny Zhou
•
Feb 15, 2024
•
109
5
Réglage Instructionnel de Représentation Générative
Generative Representational Instruction Tuning
Niklas Muennighoff, Hongjin Su, Liang Wang, Nan Yang, Furu Wei, Tao Yu, Amanpreet Singh, Douwe Kiela
•
Feb 15, 2024
•
55
5
Comment entraîner des LLM efficaces en termes de données
How to Train Data-Efficient LLMs
Noveen Sachdeva, Benjamin Coleman, Wang-Cheng Kang, Jianmo Ni, Lichan Hong, Ed H. Chi, James Caverlee, Julian McAuley, Derek Zhiyuan Cheng
•
Feb 15, 2024
•
43
4
Un agent de lecture inspiré de l'humain doté d'une mémoire de l'essentiel pour des contextes très longs
A Human-Inspired Reading Agent with Gist Memory of Very Long Contexts
Kuang-Huei Lee, Xinyun Chen, Hiroki Furuta, John Canny, Ian Fischer
•
Feb 15, 2024
•
39
3
OpenMathInstruct-1 : Un ensemble de données de 1,8 million d'instructions pour le réglage en mathématiques
OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset
Shubham Toshniwal, Ivan Moshkov, Sean Narenthiran, Daria Gitman, Fei Jia, Igor Gitman
•
Feb 15, 2024
•
38
4
Affinage par auto-apprentissage des modèles de diffusion pour la génération d'images à partir de texte.
Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation
Huizhuo Yuan, Zixiang Chen, Kaixuan Ji, Quanquan Gu
•
Feb 15, 2024
•
36
4
Ingénierie des données pour la mise à l'échelle des modèles de langage à un contexte de 128K
Data Engineering for Scaling Language Models to 128K Context
Yao Fu, Rameswar Panda, Xinyao Niu, Xiang Yue, Hannaneh Hajishirzi, Yoon Kim, Hao Peng
•
Feb 15, 2024
•
26
7
BitDelta : Votre réglage fin ne vaut peut-être qu'un seul bit
BitDelta: Your Fine-Tune May Only Be Worth One Bit
James Liu, Guangxuan Xiao, Kai Li, Jason D. Lee, Song Han, Tri Dao, Tianle Cai
•
Feb 15, 2024
•
23
5
Édition audio sans supervision et basée sur texte en Zero-Shot utilisant l'inversion de DDPM
Zero-Shot Unsupervised and Text-Based Audio Editing Using DDPM Inversion
Hila Manor, Tomer Michaeli
•
Feb 15, 2024
•
23
2
GES : Splatting Exponentiel Généralisé pour le Rendement Efficace de Champs de Radiance
GES: Generalized Exponential Splatting for Efficient Radiance Field Rendering
Abdullah Hamdi, Luke Melas-Kyriazi, Guocheng Qian, Jinjie Mai, Ruoshi Liu, Carl Vondrick, Bernard Ghanem, Andrea Vedaldi
•
Feb 15, 2024
•
18
1
DreamMatcher : Appariement d'apparence par auto-attention pour une personnalisation texte-image sémantiquement cohérente
DreamMatcher: Appearance Matching Self-Attention for Semantically-Consistent Text-to-Image Personalization
Jisu Nam, Heesu Kim, DongJae Lee, Siyoon Jin, Seungryong Kim, Seunggyu Chang
•
Feb 15, 2024
•
16
1
Modèles à espace d'états hiérarchiques pour la modélisation continue de séquence à séquence
Hierarchical State Space Models for Continuous Sequence-to-Sequence Modeling
Raunaq Bhirangi, Chenyu Wang, Venkatesh Pattabiraman, Carmel Majidi, Abhinav Gupta, Tess Hellebrekers, Lerrel Pinto
•
Feb 15, 2024
•
14
1
Modèles de diffusion par roulement
Rolling Diffusion Models
David Ruhe, Jonathan Heek, Tim Salimans, Emiel Hoogeboom
•
Feb 12, 2024
•
14
1