ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
June 21st, 2024
nabla^2DFT : Un ensemble de données universel de chimie quantique pour des molécules de type médicament et un benchmark pour les potentiels de réseaux neuronaux
nabla^2DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials
Kuzma Khrabrov, Anton Ber, Artem Tsypin, Konstantin Ushenin, Egor Rumiantsev, Alexander Telepov, Dmitry Protasov, Ilya Shenbin, Anton Alekseev, Mikhail Shirokikh, Sergey Nikolenko, Elena Tutubalina, Artur Kadurin
•
Jun 20, 2024
•
102
4
Pré-entraînement par instruction : Les modèles de langage sont des apprenants multitâches supervisés
Instruction Pre-Training: Language Models are Supervised Multitask Learners
Daixuan Cheng, Yuxian Gu, Shaohan Huang, Junyu Bi, Minlie Huang, Furu Wei
•
Jun 20, 2024
•
94
25
Le diable est dans les détails : StyleFeatureEditor pour l'inversion de StyleGAN riche en détails et l'édition d'images de haute qualité
The Devil is in the Details: StyleFeatureEditor for Detail-Rich StyleGAN Inversion and High Quality Image Editing
Denis Bobkov, Vadim Titov, Aibek Alanov, Dmitry Vetrov
•
Jun 15, 2024
•
70
2
HARE : HumAn pRiors, une clé pour l'efficacité des petits modèles de langage
HARE: HumAn pRiors, a key to small language model Efficiency
Lingyun Zhang, Bin jin, Gaojian Ge, Lunhui Liu, Xuewen Shen, Mingyong Wu, Houqian Zhang, Yongneng Jiang, Shiqi Chen, Shi Pu
•
Jun 17, 2024
•
40
1
Prism : Un Cadre pour le Découplage et l'Évaluation des Capacités des Modèles de Langage Visuel
Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs
Yuxuan Qiao, Haodong Duan, Xinyu Fang, Junming Yang, Lin Chen, Songyang Zhang, Jiaqi Wang, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
36
2
MMBench-Video : Un benchmark multi-séquences de longue durée pour une compréhension holistique des vidéos
MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding
Xinyu Fang, Kangrui Mao, Haodong Duan, Xiangyu Zhao, Yining Li, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
34
1
Fusion de modèles et alignement de sécurité : Un mauvais modèle gâche l'ensemble
Model Merging and Safety Alignment: One Bad Model Spoils the Bunch
Hasan Abed Al Kader Hammoud, Umberto Michieli, Fabio Pizzati, Philip Torr, Adel Bibi, Bernard Ghanem, Mete Ozay
•
Jun 20, 2024
•
31
1
Tableau de Réflexion : Penser Étape par Étape à Travers les Modalités
Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities
Sachit Menon, Richard Zemel, Carl Vondrick
•
Jun 20, 2024
•
29
1
Distillation de cohérence inversible pour l'édition d'images guidée par texte en environ 7 étapes
Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps
Nikita Starodubcev, Mikhail Khoroshikh, Artem Babenko, Dmitry Baranchuk
•
Jun 20, 2024
•
28
1
GLiNER multi-tâche : Modèle Léger Généraliste pour Diverses Tâches d'Extraction d'Informations
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks
Ihor Stepanov, Mykhailo Shtopko
•
Jun 14, 2024
•
26
3
PIN : Un jeu de données riche en connaissances pour des documents multimodaux appariés et entrelacés
PIN: A Knowledge-Intensive Dataset for Paired and Interleaved Multimodal Documents
Junjie Wang, Yin Zhang, Yatai Ji, Yuxiang Zhang, Chunyang Jiang, Yubo Wang, Kang Zhu, Zekun Wang, Tiezhen Wang, Wenhao Huang, Jie Fu, Bei Chen, Qunshu Lin, Minghao Liu, Ge Zhang, Wenhu Chen
•
Jun 20, 2024
•
23
1
DigiRL : Entraînement d'agents de contrôle d'appareils en conditions réelles grâce à l'apprentissage par renforcement autonome
DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning
Hao Bai, Yifei Zhou, Mert Cemri, Jiayi Pan, Alane Suhr, Sergey Levine, Aviral Kumar
•
Jun 14, 2024
•
20
1
Auto-apprentissage avec retour d'exécution : Amélioration des capacités de suivi d'instructions des grands modèles de langage
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models
Guanting Dong, Keming Lu, Chengpeng Li, Tingyu Xia, Bowen Yu, Chang Zhou, Jingren Zhou
•
Jun 19, 2024
•
16
2
LiveMind : Modèles de langage à grande échelle à faible latence avec inférence simultanée
LiveMind: Low-latency Large Language Models with Simultaneous Inference
Chuangtao Chen, Grace Li Zhang, Xunzhao Yin, Cheng Zhuo, Ulf Schlichtmann, Bing Li
•
Jun 20, 2024
•
14
4
Amélioration du bon sens visuel dans les modèles de langage via la génération multiple d'images
Improving Visual Commonsense in Language Models via Multiple Image Generation
Guy Yariv, Idan Schwartz, Yossi Adi, Sagie Benaim
•
Jun 19, 2024
•
13
2
Optimisation Directe des Préférences avec Régularisation Itérative de la Longueur : Une Étude de Cas sur l'Amélioration des Modèles de Langage 7B au Niveau de GPT-4
Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level
Jie Liu, Zhanhui Zhou, Jiaheng Liu, Xingyuan Bu, Chao Yang, Han-Sen Zhong, Wanli Ouyang
•
Jun 17, 2024
•
13
1
REPOEXEC : Évaluer la génération de code avec un benchmark exécutable au niveau du dépôt
REPOEXEC: Evaluate Code Generation with a Repository-Level Executable Benchmark
Nam Le Hai, Dung Manh Nguyen, Nghi D. Q. Bui
•
Jun 17, 2024
•
11
1
ExVideo : Extension des modèles de diffusion vidéo via un post-réglage paramétrique efficace
ExVideo: Extending Video Diffusion Models via Parameter-Efficient Post-Tuning
Zhongjie Duan, Wenmeng Zhou, Cen Chen, Yaliang Li, Weining Qian
•
Jun 20, 2024
•
10
3
τ-bench : Un benchmark pour l'interaction outil-agent-utilisateur dans des domaines du monde réel
τ-bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains
Shunyu Yao, Noah Shinn, Pedram Razavi, Karthik Narasimhan
•
Jun 17, 2024
•
8
3
Attribution des réponses basée sur les internes du modèle pour une génération augmentée par récupération fiable
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation
Jirui Qi, Gabriele Sarti, Raquel Fernández, Arianna Bisazza
•
Jun 19, 2024
•
7
1
StableSemantics : Un ensemble de données synthétiques langage-vision pour les représentations sémantiques dans des images naturalistes
StableSemantics: A Synthetic Language-Vision Dataset of Semantic Representations in Naturalistic Images
Rushikesh Zawar, Shaurya Dewan, Andrew F. Luo, Margaret M. Henderson, Michael J. Tarr, Leila Wehbe
•
Jun 19, 2024
•
5
1
Des insights aux actions : L'impact de l'interprétabilité et de l'analyse Recherche en traitement automatique du langage naturel (TALN)
From Insights to Actions: The Impact of Interpretability and Analysis Research on NLP
Marius Mosbach, Vagrant Gautam, Tomás Vergara-Browne, Dietrich Klakow, Mor Geva
•
Jun 18, 2024
•
5
1
Une étude systématique de la synthèse de texte : des méthodes statistiques aux grands modèles de langage
A Systematic Survey of Text Summarization: From Statistical Methods to Large Language Models
Haopeng Zhang, Philip S. Yu, Jiawei Zhang
•
Jun 17, 2024
•
5
2
Échantillonnage de scènes 3D gaussiennes en quelques secondes avec des modèles de diffusion latente
Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models
Paul Henderson, Melonie de Almeida, Daniela Ivanova, Titas Anciukevičius
•
Jun 18, 2024
•
4
1