ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
April 16th, 2024
Apprenez Votre Modèle de Référence pour un Alignement Réellement Efficace
Learn Your Reference Model for Real Good Alignment
Alexey Gorbatovski, Boris Shaposhnikov, Alexey Malakhov, Nikita Surnachev, Yaroslav Aksenov, Ian Maksimov, Nikita Balagansky, Daniil Gavrilov
•
Apr 15, 2024
•
87
0
Megalodon : Prétraitement et inférence efficaces pour les grands modèles de langage avec une longueur de contexte illimitée
Megalodon: Efficient LLM Pretraining and Inference with Unlimited Context Length
Xuezhe Ma, Xiaomeng Yang, Wenhan Xiong, Beidi Chen, Lili Yu, Hao Zhang, Jonathan May, Luke Zettlemoyer, Omer Levy, Chunting Zhou
•
Apr 12, 2024
•
68
2
TransformerFAM : L'attention par rétroaction comme mémoire de travail
TransformerFAM: Feedback attention is working memory
Dongseong Hwang, Weiran Wang, Zhuoyuan Huo, Khe Chai Sim, Pedro Moreno Mengibar
•
Apr 14, 2024
•
44
0
Video2Game : Environnement en temps réel, interactif, réaliste et compatible navigateur à partir d'une seule vidéo
Video2Game: Real-time, Interactive, Realistic and Browser-Compatible Environment from a Single Video
Hongchi Xia, Zhi-Hao Lin, Wei-Chiu Ma, Shenlong Wang
•
Apr 15, 2024
•
31
2
La compression représente l'intelligence de manière linéaire.
Compression Represents Intelligence Linearly
Yuzhen Huang, Jinghan Zhang, Zifei Shan, Junxian He
•
Apr 15, 2024
•
28
1
Ctrl-Adapter : Un cadre efficace et polyvalent pour l'adaptation de divers contrôles à tout modèle de diffusion
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model
Han Lin, Jaemin Cho, Abhay Zala, Mohit Bansal
•
Apr 15, 2024
•
22
0
HQ-Edit : Un ensemble de données de haute qualité pour l'édition d'images basée sur des instructions
HQ-Edit: A High-Quality Dataset for Instruction-based Image Editing
Mude Hui, Siwei Yang, Bingchen Zhao, Yichun Shi, Heng Wang, Peng Wang, Yuyin Zhou, Cihang Xie
•
Apr 15, 2024
•
13
0
Sur le décodage spéculatif pour les modèles de langage multimodaux de grande échelle
On Speculative Decoding for Multimodal Large Language Models
Mukul Gagrani, Raghavv Goel, Wonseok Jeon, Junyoung Park, Mingu Lee, Christopher Lott
•
Apr 13, 2024
•
13
2
Tango 2 : Alignement des générations texte-audio basées sur la diffusion par optimisation directe des préférences
Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization
Navonil Majumder, Chia-Yu Hung, Deepanway Ghosal, Wei-Ning Hsu, Rada Mihalcea, Soujanya Poria
•
Apr 15, 2024
•
12
0
TextHawk : Exploration de la perception fine et efficace des modèles de langage multimodaux à grande échelle
TextHawk: Exploring Efficient Fine-Grained Perception of Multimodal Large Language Models
Ya-Qi Yu, Minghui Liao, Jihao Wu, Yongxin Liao, Xiaoyu Zheng, Wei Zeng
•
Apr 14, 2024
•
11
0
Domestication du Modèle de Diffusion Latente pour le Complètement de Champs de Radiance Neuronaux
Taming Latent Diffusion Model for Neural Radiance Field Inpainting
Chieh Hubert Lin, Changil Kim, Jia-Bin Huang, Qinbo Li, Chih-Yao Ma, Johannes Kopf, Ming-Hsuan Yang, Hung-Yu Tseng
•
Apr 15, 2024
•
7
0
CompGS : Représentation efficace de scènes 3D via le splatting de Gaussiennes compressé
CompGS: Efficient 3D Scene Representation via Compressed Gaussian Splatting
Xiangrui Liu, Xinju Wu, Pingping Zhang, Shiqi Wang, Zhu Li, Sam Kwong
•
Apr 15, 2024
•
7
0