ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
July 4th, 2024
InternLM-XComposer-2.5 : Un modèle de langage visuel polyvalent à grande échelle prenant en charge les entrées et sorties à contexte long
InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output
Pan Zhang, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Rui Qian, Lin Chen, Qipeng Guo, Haodong Duan, Bin Wang, Linke Ouyang, Songyang Zhang, Wenwei Zhang, Yining Li, Yang Gao, Peng Sun, Xinyue Zhang, Wei Li, Jingwen Li, Wenhai Wang, Hang Yan, Conghui He, Xingcheng Zhang, Kai Chen, Jifeng Dai, Yu Qiao, Dahua Lin, Jiaqi Wang
•
Jul 3, 2024
•
96
5
TabReD : Un benchmark pour l'apprentissage automatique tabulaire en conditions réelles
TabReD: A Benchmark of Tabular Machine Learning in-the-Wild
Ivan Rubachev, Nikolay Kartashev, Yury Gorishniy, Artem Babenko
•
Jun 27, 2024
•
51
6
Pas de formation, pas de problème : Repenser le guidage sans classifieur pour les modèles de diffusion
No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models
Seyedmorteza Sadat, Manuel Kansy, Otmar Hilliges, Romann M. Weber
•
Jul 2, 2024
•
26
1
TokenPacker : Projecteur visuel efficace pour les modèles de langage multimodaux
TokenPacker: Efficient Visual Projector for Multimodal LLM
Wentong Li, Yuqian Yuan, Jian Liu, Dongqi Tang, Song Wang, Jianke Zhu, Lei Zhang
•
Jul 2, 2024
•
24
4
PicoAudio : Permettant un contrôle précis des timestamps et de la fréquence des événements audio dans la génération de texte vers audio
PicoAudio: Enabling Precise Timestamp and Frequency Controllability of Audio Events in Text-to-audio Generation
Zeyu Xie, Xuenan Xu, Zhizheng Wu, Mengyue Wu
•
Jul 3, 2024
•
21
5
DisCo-Diff : Amélioration des modèles de diffusion continue par l'intégration de latents discrets
DisCo-Diff: Enhancing Continuous Diffusion Models with Discrete Latents
Yilun Xu, Gabriele Corso, Tommi Jaakkola, Arash Vahdat, Karsten Kreis
•
Jul 3, 2024
•
14
1
Étude des modèles de langage massifs à décodeur unique pour la traduction parole-texte
Investigating Decoder-only Large Language Models for Speech-to-text Translation
Chao-Wei Huang, Hui Lu, Hongyu Gong, Hirofumi Inaguma, Ilia Kulikov, Ruslan Mavlyutov, Sravya Popuri
•
Jul 3, 2024
•
11
1
Un faux sentiment de sécurité : Fuites d'informations non sécurisées dans les réponses d'IA "sûres"
A False Sense of Safety: Unsafe Information Leakage in 'Safe' AI Responses
David Glukhov, Ziwen Han, Ilia Shumailov, Vardan Papyan, Nicolas Papernot
•
Jul 2, 2024
•
9
1
Élimination du biais positionnel des modèles de langage : une approche mécaniste
Eliminating Position Bias of Language Models: A Mechanistic Approach
Ziqi Wang, Hanlin Zhang, Xiner Li, Kuan-Hao Huang, Chi Han, Shuiwang Ji, Sham M. Kakade, Hao Peng, Heng Ji
•
Jul 1, 2024
•
8
1