ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
July 18th, 2024
Spectra : Une étude approfondie des modèles de langage ternaires, quantifiés et FP16
Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models
Ayush Kaushal, Tejas Pandey, Tejas Vaidhya, Aaryan Bhagat, Irina Rish
•
Jul 17, 2024
•
80
3
GoldFinch : Hybride RWKV/Transformer Haute Performance avec Pré-Remplissage Linéaire et Compression Extrême du Cache KV
GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression
Daniel Goldstein, Fares Obeid, Eric Alcaide, Guangyu Song, Eugene Cheah
•
Jul 16, 2024
•
57
8
AgentPoison : Test de résistance des agents LLM par empoisonnement de la mémoire ou des bases de connaissances
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases
Zhaorun Chen, Zhen Xiang, Chaowei Xiao, Dawn Song, Bo Li
•
Jul 17, 2024
•
52
3
E5-V : Embeddings universels avec des modèles de langage multimodaux à grande échelle
E5-V: Universal Embeddings with Multimodal Large Language Models
Ting Jiang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang, Deqing Wang, Fuzhen Zhuang
•
Jul 17, 2024
•
41
3
LMMs-Eval : Vérification de la réalité sur l'évaluation des grands modèles multimodaux
LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models
Kaichen Zhang, Bo Li, Peiyuan Zhang, Fanyi Pu, Joshua Adrian Cahyono, Kairui Hu, Shuai Liu, Yuanhan Zhang, Jingkang Yang, Chunyuan Li, Ziwei Liu
•
Jul 17, 2024
•
36
4
Entraînement au Niveau des Patchs pour les Modèles de Langue à Grande Échelle
Patch-Level Training for Large Language Models
Chenze Shao, Fandong Meng, Jie Zhou
•
Jul 17, 2024
•
17
3
VD3D : Maîtriser les grands transformateurs de diffusion vidéo pour le contrôle de caméra 3D
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control
Sherwin Bahmani, Ivan Skorokhodov, Aliaksandr Siarohin, Willi Menapace, Guocheng Qian, Michael Vasilkovsky, Hsin-Ying Lee, Chaoyang Wang, Jiaxu Zou, Andrea Tagliasacchi, David B. Lindell, Sergey Tulyakov
•
Jul 17, 2024
•
13
3
IMAGDressing-v1 : Habillage virtuel personnalisable
IMAGDressing-v1: Customizable Virtual Dressing
Fei Shen, Xin Jiang, Xin He, Hu Ye, Cong Wang, Xiaoyu Du, Zechao Li, Jinghui Tang
•
Jul 17, 2024
•
13
2
Goldfish : Compréhension vision-langage de vidéos de longueur arbitraire
Goldfish: Vision-Language Understanding of Arbitrarily Long Videos
Kirolos Ataallah, Xiaoqian Shen, Eslam Abdelrahman, Essam Sleiman, Mingchen Zhuge, Jian Ding, Deyao Zhu, Jürgen Schmidhuber, Mohamed Elhoseiny
•
Jul 17, 2024
•
8
2
Case2Code : Apprentissage du raisonnement inductif avec des données synthétiques
Case2Code: Learning Inductive Reasoning with Synthetic Data
Yunfan Shao, Linyang Li, Yichuan Ma, Peiji Li, Demin Song, Qinyuan Cheng, Shimin Li, Xiaonan Li, Pengyu Wang, Qipeng Guo, Hang Yan, Xipeng Qiu, Xuanjing Huang, Dahua Lin
•
Jul 17, 2024
•
8
7
Conditionnement audio pour la génération musicale via des caractéristiques de goulot d'étranglement discrètes
Audio Conditioning for Music Generation via Discrete Bottleneck Features
Simon Rouard, Yossi Adi, Jade Copet, Axel Roebel, Alexandre Défossez
•
Jul 17, 2024
•
7
2
Splatfacto-W : Une implémentation Nerfstudio du lissage gaussien pour des collections de photos non contraintes
Splatfacto-W: A Nerfstudio Implementation of Gaussian Splatting for Unconstrained Photo Collections
Congrong Xu, Justin Kerr, Angjoo Kanazawa
•
Jul 17, 2024
•
6
2
ThinkGrasp : Un système vision-langage pour la préhension stratégique de pièces dans un environnement encombré
ThinkGrasp: A Vision-Language System for Strategic Part Grasping in Clutter
Yaoyao Qian, Xupeng Zhu, Ondrej Biza, Shuo Jiang, Linfeng Zhao, Haojie Huang, Yu Qi, Robert Platt
•
Jul 16, 2024
•
5
2
AUITestAgent : Test fonctionnel automatisé des interfaces graphiques orienté par les exigences
AUITestAgent: Automatic Requirements Oriented GUI Function Testing
Yongxiang Hu, Xuan Wang, Yingchuan Wang, Yu Zhang, Shiyu Guo, Chaoyi Chen, Xin Wang, Yangfan Zhou
•
Jul 12, 2024
•
5
2
NavGPT-2 : Libérer les capacités de raisonnement navigationnel pour les grands modèles vision-langage
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models
Gengze Zhou, Yicong Hong, Zun Wang, Xin Eric Wang, Qi Wu
•
Jul 17, 2024
•
4
2
Désapprentissage pratique pour les modèles de langage à grande échelle
Practical Unlearning for Large Language Models
Chongyang Gao, Lixu Wang, Chenkai Weng, Xiao Wang, Qi Zhu
•
Jul 14, 2024
•
4
2
L'art de dire non : Non-conformité contextuelle dans les modèles de langage
The Art of Saying No: Contextual Noncompliance in Language Models
Faeze Brahman, Sachin Kumar, Vidhisha Balachandran, Pradeep Dasigi, Valentina Pyatkin, Abhilasha Ravichander, Sarah Wiegreffe, Nouha Dziri, Khyathi Chandu, Jack Hessel, Yulia Tsvetkov, Noah A. Smith, Yejin Choi, Hannaneh Hajishirzi
•
Jul 2, 2024
•
4
2
Transfert cross-lingual zero-shot pour la génération de données synthétiques dans la détection d'erreurs grammaticales
Zero-shot Cross-Lingual Transfer for Synthetic Data Generation in Grammatical Error Detection
Gaetan Lopez Latouche, Marc-André Carbonneau, Ben Swanson
•
Jul 16, 2024
•
2
4
Vers une compréhension de la génération de vidéos non sécurisées
Towards Understanding Unsafe Video Generation
Yan Pang, Aiping Xiong, Yang Zhang, Tianhao Wang
•
Jul 17, 2024
•
0
2