ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
October 8th, 2024
SwiftKV : Inference rapide optimisée par préremplissage avec transformation de modèle préservant les connaissances
SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation
Aurick Qiao, Zhewei Yao, Samyam Rajbhandari, Yuxiong He
•
Oct 4, 2024
•
2
2
SÉLECTIONNER : Une Étude à Grande Échelle des Stratégies de Curatelle de Données pour la Classification d'Images
SELECT: A Large-Scale Benchmark of Data Curation Strategies for Image Classification
Benjamin Feuer, Jiawei Xu, Niv Cohen, Patrick Yubeaton, Govind Mittal, Chinmay Hegde
•
Oct 7, 2024
•
7
2
Naviguer dans le monde numérique comme le font les humains : Ancrage visuel universel pour les agents d'interface utilisateur graphique
Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents
Boyu Gou, Ruohan Wang, Boyuan Zheng, Yanan Xie, Cheng Chang, Yiheng Shu, Huan Sun, Yu Su
•
Oct 7, 2024
•
19
2
MathHay : Un banc d'essai automatisé pour le raisonnement mathématique à long contexte dans les LLM
MathHay: An Automated Benchmark for Long-Context Mathematical Reasoning in LLMs
Lei Wang, Shan Dong, Yuhui Xu, Hanze Dong, Yalu Wang, Amrita Saha, Ee-Peng Lim, Caiming Xiong, Doyen Sahoo
•
Oct 7, 2024
•
13
3
Presto ! Distillation des étapes et des couches pour accélérer la génération de musique
Presto! Distilling Steps and Layers for Accelerating Music Generation
Zachary Novack, Ge Zhu, Jonah Casebeer, Julian McAuley, Taylor Berg-Kirkpatrick, Nicholas J. Bryan
•
Oct 7, 2024
•
18
4
LLaMA-Berry : Optimisation par paires pour un raisonnement mathématique de niveau olympique similaire à O1
LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning
Di Zhang, Jianbo Wu, Jingdi Lei, Tong Che, Jiatong Li, Tong Xie, Xiaoshui Huang, Shufei Zhang, Marco Pavone, Yuqiang Li, Wanli Ouyang, Dongzhan Zhou
•
Oct 3, 2024
•
55
4
Banc d'essai de reconnaissance d'entités cliniques nommées
Named Clinical Entity Recognition Benchmark
Wadood M Abdul, Marco AF Pimentel, Muhammad Umar Salman, Tathagata Raha, Clément Christophe, Praveen K Kanithi, Nasir Hayat, Ronnie Rajan, Shadab Khan
•
Oct 7, 2024
•
17
3
UniMuMo : Génération unifiée de texte, musique et mouvement
UniMuMo: Unified Text, Music and Motion Generation
Han Yang, Kun Su, Yutong Zhang, Jiaben Chen, Kaizhi Qian, Gaowen Liu, Chuang Gan
•
Oct 6, 2024
•
19
2
Synthèse autonome de l'interaction entre les personnages et les scènes à partir d'instructions textuelles.
Autonomous Character-Scene Interaction Synthesis from Text Instruction
Nan Jiang, Zimo He, Zi Wang, Hongjie Li, Yixin Chen, Siyuan Huang, Yixin Zhu
•
Oct 4, 2024
•
7
2
GSM-Symbolic : Comprendre les Limitations du Raisonnement Mathématique dans les Grands Modèles de Langage
GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models
Iman Mirzadeh, Keivan Alizadeh, Hooman Shahrokhi, Oncel Tuzel, Samy Bengio, Mehrdad Farajtabar
•
Oct 7, 2024
•
22
6
ScienceAgentBench : Vers une évaluation rigoureuse des agents linguistiques pour la découverte scientifique basée sur les données
ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery
Ziru Chen, Shijie Chen, Yuting Ning, Qianheng Zhang, Boshi Wang, Botao Yu, Yifei Li, Zeyi Liao, Chen Wei, Zitong Lu, Vishal Dey, Mingyi Xue, Frazier N. Baker, Benjamin Burns, Daniel Adu-Ampratwum, Xuhui Huang, Xia Ning, Song Gao, Yu Su, Huan Sun
•
Oct 7, 2024
•
21
2
En résumé : Modèle de récompense du détective au niveau du jeton pour les grands modèles de vision par ordinateur et de langage.
TLDR: Token-Level Detective Reward Model for Large Vision Language Models
Deqing Fu, Tong Xiao, Rui Wang, Wang Zhu, Pengchuan Zhang, Guan Pang, Robin Jia, Lawrence Chen
•
Oct 7, 2024
•
17
2
Transformateur Différentiel
Differential Transformer
Tianzhu Ye, Li Dong, Yuqing Xia, Yutao Sun, Yi Zhu, Gao Huang, Furu Wei
•
Oct 7, 2024
•
178
35
Redéfinition de la modélisation temporelle dans la diffusion vidéo : l'approche par pas de temps vectorisé
Redefining Temporal Modeling in Video Diffusion: The Vectorized Timestep Approach
Yaofang Liu, Yumeng Ren, Xiaodong Cun, Aitor Artola, Yang Liu, Tieyong Zeng, Raymond H. Chan, Jean-michel Morel
•
Oct 4, 2024
•
5
2
Ancrer le langage dans la communication référentielle multi-perspective
Grounding Language in Multi-Perspective Referential Communication
Zineng Tang, Lingjun Mao, Alane Suhr
•
Oct 4, 2024
•
4
2
Qu'est-ce qui compte pour la fusion de modèles à grande échelle ?
What Matters for Model Merging at Scale?
Prateek Yadav, Tu Vu, Jonathan Lai, Alexandra Chronopoulou, Manaal Faruqui, Mohit Bansal, Tsendsuren Munkhdalai
•
Oct 4, 2024
•
8
2
OmniBooth : Apprentissage du contrôle latent pour la synthèse d'images avec des instructions multi-modales
OmniBooth: Learning Latent Control for Image Synthesis with Multi-modal Instruction
Leheng Li, Weichao Qiu, Xu Yan, Jing He, Kaiqiang Zhou, Yingjie Cai, Qing Lian, Bingbing Liu, Ying-Cong Chen
•
Oct 7, 2024
•
9
2
Les LLM en savent plus qu'ils ne montrent : Sur la représentation intrinsèque des hallucinations des LLM
LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations
Hadas Orgad, Michael Toker, Zorik Gekhman, Roi Reichart, Idan Szpektor, Hadas Kotek, Yonatan Belinkov
•
Oct 3, 2024
•
49
5
RDF : Réseaux d'Analyse de Fourier
FAN: Fourier Analysis Networks
Yihong Dong, Ge Li, Yongding Tao, Xue Jiang, Kechi Zhang, Jia Li, Jing Su, Jun Zhang, Jingjing Xu
•
Oct 3, 2024
•
27
6
MonST3R : Une approche simple pour estimer la géométrie en présence de mouvement
MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion
Junyi Zhang, Charles Herrmann, Junhwa Hur, Varun Jampani, Trevor Darrell, Forrester Cole, Deqing Sun, Ming-Hsuan Yang
•
Oct 4, 2024
•
19
3
VidéoGuide : Amélioration des Modèles de Diffusion Vidéo sans Entraînement à travers un Guide de l'Enseignant
VideoGuide: Improving Video Diffusion Models without Training Through a Teacher's Guide
Dohun Lee, Bryan S Kim, Geon Yeong Park, Jong Chul Ye
•
Oct 6, 2024
•
30
3
TurtleBench : Évaluation des meilleurs modèles de langage via des énigmes oui/non du monde réel
TurtleBench: Evaluating Top Language Models via Real-World Yes/No Puzzles
Qingchen Yu, Shichao Song, Ke Fang, Yunfeng Shi, Zifan Zheng, Hanyu Wang, Simin Niu, Zhiyu Li
•
Oct 7, 2024
•
10
2
SePPO : Optimisation semi-politique des préférences pour l'alignement de la diffusion
SePPO: Semi-Policy Preference Optimization for Diffusion Alignment
Daoan Zhang, Guangchen Lan, Dong-Jun Han, Wenlin Yao, Xiaoman Pan, Hongming Zhang, Mingxiao Li, Pengcheng Chen, Yu Dong, Christopher Brinton, Jiebo Luo
•
Oct 7, 2024
•
5
2