ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
April 8th, 2024
Optimisation Directe de Nash : Enseigner aux Modèles de Langage à s'Améliorer par eux-mêmes avec des Préférences Générales
Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences
Corby Rosset, Ching-An Cheng, Arindam Mitra, Michael Santacroce, Ahmed Awadallah, Tengyang Xie
•
Apr 4, 2024
•
62
1
Stream of Search (SoS) : Apprendre à rechercher dans le langage
Stream of Search (SoS): Learning to Search in Language
Kanishk Gandhi, Denise Lee, Gabriel Grand, Muxin Liu, Winson Cheng, Archit Sharma, Noah D. Goodman
•
Apr 1, 2024
•
32
1
Pas de "Zero-Shot" sans données exponentielles : La fréquence des concepts en prétraining détermine la performance des modèles multimodaux
No "Zero-Shot" Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance
Vishaal Udandarao, Ameya Prabhu, Adhiraj Ghosh, Yash Sharma, Philip H. S. Torr, Adel Bibi, Samuel Albanie, Matthias Bethge
•
Apr 4, 2024
•
30
1
AutoWebGLM : Amorçage et renforcement d'un agent de navigation web basé sur un grand modèle de langage
AutoWebGLM: Bootstrap And Reinforce A Large Language Model-based Web Navigating Agent
Hanyu Lai, Xiao Liu, Iat Long Iong, Shuntian Yao, Yuxuan Chen, Pengbo Shen, Hao Yu, Hanchen Zhang, Xiaohan Zhang, Yuxiao Dong, Jie Tang
•
Apr 4, 2024
•
29
3
CantTalkAboutThis : Aligner les modèles de langage pour rester sur le sujet dans les dialogues
CantTalkAboutThis: Aligning Language Models to Stay on Topic in Dialogues
Makesh Narsimhan Sreedhar, Traian Rebedea, Shaona Ghosh, Christopher Parisien
•
Apr 4, 2024
•
27
5
Formation aux compétences sociales avec des modèles de langage de grande taille
Social Skill Training with Large Language Models
Diyi Yang, Caleb Ziems, William Held, Omar Shaikh, Michael S. Bernstein, John Mitchell
•
Apr 5, 2024
•
16
0
RL pour les modèles de cohérence : Génération d'images à partir de texte guidée par récompense plus rapide
RL for Consistency Models: Faster Reward Guided Text-to-Image Generation
Owen Oertell, Jonathan D. Chang, Yiyi Zhang, Kianté Brantley, Wen Sun
•
Mar 25, 2024
•
16
3
Chinese Tiny LLM : Prétraitement d'un modèle de langage massif centré sur le chinois
Chinese Tiny LLM: Pretraining a Chinese-Centric Large Language Model
Xinrun Du, Zhouliang Yu, Songyang Gao, Ding Pan, Yuyang Cheng, Ziyang Ma, Ruibin Yuan, Xingwei Qu, Jiaheng Liu, Tianyu Zheng, Xinchen Luo, Guorui Zhou, Binhang Yuan, Wenhu Chen, Jie Fu, Ge Zhang
•
Apr 5, 2024
•
14
2
Gaussienne robuste par éclaboussure
Robust Gaussian Splatting
François Darmon, Lorenzo Porzi, Samuel Rota-Bulò, Peter Kontschieder
•
Apr 5, 2024
•
10
0
Sigma : Réseau Mamba Siamese pour la Segmentation Sémantique Multi-Modale
Sigma: Siamese Mamba Network for Multi-Modal Semantic Segmentation
Zifu Wan, Yuhao Wang, Silong Yong, Pingping Zhang, Simon Stepputtis, Katia Sycara, Yaqi Xie
•
Apr 5, 2024
•
7
1