ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
October 2nd, 2024
Embodied-RAG : Mémoire corporelle générale non paramétrique pour la recherche et la génération
Embodied-RAG: General non-parametric Embodied Memory for Retrieval and Generation
Quanting Xie, So Yeon Min, Tianyi Zhang, Aarav Bajaj, Ruslan Salakhutdinov, Matthew Johnson-Roberson, Yonatan Bisk
•
Sep 26, 2024
•
3
2
Un jeton pour les gouverner tous : segmentation raisonnée par instruction de langage dans les vidéos
One Token to Seg Them All: Language Instructed Reasoning Segmentation in Videos
Zechen Bai, Tong He, Haiyang Mei, Pichao Wang, Ziteng Gao, Joya Chen, Lei Liu, Zheng Zhang, Mike Zheng Shou
•
Sep 29, 2024
•
19
3
Flex3D : Génération 3D à propagation avant avec modèle de reconstruction flexible et curation de vue d'entrée
Flex3D: Feed-Forward 3D Generation With Flexible Reconstruction Model And Input View Curation
Junlin Han, Jianyuan Wang, Andrea Vedaldi, Philip Torr, Filippos Kokkinos
•
Oct 1, 2024
•
20
5
TPI-LLM : Servir efficacement des LLM à l'échelle de 70 milliards sur des appareils Edge à ressources limitées
TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices
Zonghang Li, Wenjiao Feng, Mohsen Guizani, Hongfang Yu
•
Oct 1, 2024
•
33
8
ACE : Créateur et Éditeur Tout-En-Un Suivant les Instructions via Diffusion Transformer
ACE: All-round Creator and Editor Following Instructions via Diffusion Transformer
Zhen Han, Zeyinzi Jiang, Yulin Pan, Jingfeng Zhang, Chaojie Mao, Chenwei Xie, Yu Liu, Jingren Zhou
•
Sep 30, 2024
•
12
2
SyntheOcc : Synthèse d'images de Street View contrôlées géométriquement à travers des MPIs sémantiques en 3D
SyntheOcc: Synthesize Geometric-Controlled Street View Images through 3D Semantic MPIs
Leheng Li, Weichao Qiu, Yingjie Cai, Xu Yan, Qing Lian, Bingbing Liu, Ying-Cong Chen
•
Oct 1, 2024
•
11
2
DressRecon : Reconstruction libre en 4D de l'humain à partir de vidéos monoculaires
DressRecon: Freeform 4D Human Reconstruction from Monocular Video
Jeff Tan, Donglai Xiang, Shubham Tulsiani, Deva Ramanan, Gengshan Yang
•
Sep 30, 2024
•
9
2
Quel est le préjudice ? Quantification de l'impact tangible du biais de genre dans la traduction automatique grâce à une étude centrée sur l'humain
What the Harm? Quantifying the Tangible Impact of Gender Bias in Machine Translation with a Human-centered Study
Beatrice Savoldi, Sara Papi, Matteo Negri, Ana Guerberof, Luisa Bentivogli
•
Oct 1, 2024
•
5
2
Loi du maillon le plus faible : Capacités croisées des grands modèles de langage
Law of the Weakest Link: Cross Capabilities of Large Language Models
Ming Zhong, Aston Zhang, Xuewei Wang, Rui Hou, Wenhan Xiong, Chenguang Zhu, Zhengxing Chen, Liang Tan, Chloe Bi, Mike Lewis, Sravya Popuri, Sharan Narang, Melanie Kambadur, Dhruv Mahajan, Sergey Edunov, Jiawei Han, Laurens van der Maaten
•
Sep 30, 2024
•
55
2
Atlas-Chat : Adaptation des grands modèles de langage pour le dialecte arabe marocain à ressources limitées
Atlas-Chat: Adapting Large Language Models for Low-Resource Moroccan Arabic Dialect
Guokan Shang, Hadi Abdine, Yousef Khoubrane, Amr Mohamed, Yassine Abbahaddou, Sofiane Ennadir, Imane Momayiz, Xuguang Ren, Eric Moulines, Preslav Nakov, Michalis Vazirgiannis, Eric Xing
•
Sep 26, 2024
•
29
2
Extension de la fenêtre contextuelle visuelle : une nouvelle perspective pour la compréhension des longues vidéos
Visual Context Window Extension: A New Perspective for Long Video Understanding
Hongchen Wei, Zhenzhong Chen
•
Sep 30, 2024
•
11
2
Flux redressé de la moyenne postérieure : vers une restauration d'images photoréalistes avec erreur quadratique moyenne minimale
Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration
Guy Ohayon, Tomer Michaeli, Michael Elad
•
Oct 1, 2024
•
10
3
Illustrious : un Modèle d'Illustration Avancé Ouvert
Illustrious: an Open Advanced Illustration Model
Sang Hyun Park, Jun Young Koh, Junha Lee, Joy Song, Dongha Kim, Hoyeon Moon, Hyunju Lee, Min Song
•
Sep 30, 2024
•
16
3
ChienBot Utile : Récupération d'Objets en Monde Ouvert en Utilisant des Robots Quadrupèdes et des Modèles Vision-Langage
Helpful DoggyBot: Open-World Object Fetching using Legged Robots and Vision-Language Models
Qi Wu, Zipeng Fu, Xuxin Cheng, Xiaolong Wang, Chelsea Finn
•
Sep 30, 2024
•
8
2