ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
arXiv
HuggingFace
Tarifs
Compte
Espace de travail
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
October 14th, 2024
Rapport technique Baichuan-Omni
Baichuan-Omni Technical Report
Yadong Li, Haoze Sun, Mingan Lin, Tianpeng Li, Guosheng Dong, Tao Zhang, Bowen Ding, Wei Song, Zhenglin Cheng, Yuqi Huo, Song Chen, Xu Li, Da Pan, Shusen Zhang, Xin Wu, Zheng Liang, Jun Liu, Tao Zhang, Keer Lu, Yaqi Zhao, Yanjun Shen, Fan Yang, Kaicheng Yu, Tao Lin, Jianhua Xu, Zenan Zhou, Weipeng Chen
•
Oct 11, 2024
•
88
8
Meissonic : Revitalisation des Transformateurs Génératifs Masqués pour une Synthèse Texte-Image Haute Résolution Efficace
Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis
Jinbin Bai, Tian Ye, Wei Chow, Enxin Song, Qing-Guo Chen, Xiangtai Li, Zhen Dong, Lei Zhu, Shuicheng Yan
•
Oct 10, 2024
•
52
2
StructRAG : Amélioration du raisonnement intensif en connaissances des LLMs via la structuration hybride de l'information à l'inférence.
StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization
Zhuoqun Li, Xuanang Chen, Haiyang Yu, Hongyu Lin, Yaojie Lu, Qiaoyu Tang, Fei Huang, Xianpei Han, Le Sun, Yongbin Li
•
Oct 11, 2024
•
50
2
De Généraliste à Spécialiste : Adapter les Modèles de Langage Visuel via l'Ajustement d'Instructions Visuelles Spécifiques à la Tâche
From Generalist to Specialist: Adapting Vision Language Models via Task-Specific Visual Instruction Tuning
Yang Bai, Yang Zhou, Jun Zhou, Rick Siow Mong Goh, Daniel Shu Wei Ting, Yong Liu
•
Oct 9, 2024
•
38
2
Sélection collaborative de données multi-agents pour un pré-entraînement LLM efficace
Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining
Tianyi Bai, Ling Yang, Zhen Hao Wong, Jiahui Peng, Xinlin Zhuang, Chi Zhang, Lijun Wu, Qiu Jiantao, Wentao Zhang, Binhang Yuan, Conghui He
•
Oct 10, 2024
•
20
2
Permutabilité Mécaniste : Faire Correspondre les Caractéristiques à Travers les Couches
Mechanistic Permutability: Match Features Across Layers
Nikita Balagansky, Ian Maksimov, Daniil Gavrilov
•
Oct 10, 2024
•
19
2
EvolveDirector : Approche avancée de la génération de texte en image avec de grands modèles de vision-langage
EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models
Rui Zhao, Hangjie Yuan, Yujie Wei, Shiwei Zhang, Yuchao Gu, Lingmin Ran, Xiang Wang, Zhangjie Wu, Junhao Zhang, Yingya Zhang, Mike Zheng Shou
•
Oct 9, 2024
•
19
2
SuperCorrect : Superviser et Corriger les Modèles de Langage avec des Informations Basées sur les Erreurs
SuperCorrect: Supervising and Correcting Language Models with Error-Driven Insights
Ling Yang, Zhaochen Yu, Tianjun Zhang, Minkai Xu, Joseph E. Gonzalez, Bin Cui, Shuicheng Yan
•
Oct 11, 2024
•
17
3
PositionID : Les LLM peuvent contrôler les longueurs, copier et coller avec une conscience positionnelle explicite.
PositionID: LLMs can Control Lengths, Copy and Paste with Explicit Positional Awareness
Zekun Wang, Feiyu Duan, Yibo Zhang, Wangchunshu Zhou, Ke Xu, Wenhao Huang, Jie Fu
•
Oct 9, 2024
•
17
2
Échantillonnage de distillation de score sémantique pour la génération textuelle compositionnelle en 3D
Semantic Score Distillation Sampling for Compositional Text-to-3D Generation
Ling Yang, Zixiang Zhang, Junlin Han, Bohan Zeng, Runjia Li, Philip Torr, Wentao Zhang
•
Oct 11, 2024
•
14
2
Prédiction KV pour une amélioration du temps jusqu'au premier jeton
KV Prediction for Improved Time to First Token
Maxwell Horton, Qingqing Cao, Chenfan Sun, Yanzi Jin, Sachin Mehta, Mohammad Rastegari, Moin Nabi
•
Oct 10, 2024
•
12
2
Réfléchissez pendant que vous générez : Diffusion discrète avec débruitage planifié
Think While You Generate: Discrete Diffusion with Planned Denoising
Sulin Liu, Juno Nam, Andrew Campbell, Hannes Stärk, Yilun Xu, Tommi Jaakkola, Rafael Gómez-Bombarelli
•
Oct 8, 2024
•
11
3
ZeroComp : Composition d'objet sans étape intermédiaire à partir des intrinsèques de l'image via la diffusion
ZeroComp: Zero-shot Object Compositing from Image Intrinsics via Diffusion
Zitian Zhang, Frédéric Fortier-Chouinard, Mathieu Garon, Anand Bhattad, Jean-François Lalonde
•
Oct 10, 2024
•
9
3
I-Max : Maximiser le potentiel de résolution des Transformers à écoulement redressé pré-entraînés avec l'écoulement projeté
I-Max: Maximize the Resolution Potential of Pre-trained Rectified Flow Transformers with Projected Flow
Ruoyi Du, Dongyang Liu, Le Zhuo, Qin Qi, Hongsheng Li, Zhanyu Ma, Peng Gao
•
Oct 10, 2024
•
5
2
DA-Code : Benchmark de génération de code de science des données d'agent pour les grands modèles de langage
DA-Code: Agent Data Science Code Generation Benchmark for Large Language Models
Yiming Huang, Jianwen Luo, Yan Yu, Yitong Zhang, Fangyu Lei, Yifan Wei, Shizhu He, Lifu Huang, Xiao Liu, Jun Zhao, Kang Liu
•
Oct 9, 2024
•
5
3
MiRAGeNews : Détection de l'information générée par l'IA réaliste multimodale
MiRAGeNews: Multimodal Realistic AI-Generated News Detection
Runsheng Huang, Liam Dugan, Yue Yang, Chris Callison-Burch
•
Oct 11, 2024
•
4
2
SimpleStrat : Diversification de la génération de modèles de langage avec stratification
SimpleStrat: Diversifying Language Model Generation with Stratification
Justin Wong, Yury Orlovskiy, Michael Luo, Sanjit A. Seshia, Joseph E. Gonzalez
•
Oct 11, 2024
•
4
2
Mentor-KD : Améliorer les petits modèles de langage en tant que raisonneurs multi-étapes
Mentor-KD: Making Small Language Models Better Multi-step Reasoners
Hojae Lee, Junho Kim, SangKeun Lee
•
Oct 11, 2024
•
4
2
GenARM : Génération guidée par récompense avec modèle de récompense autorégressif pour l'alignement au moment du test
GenARM: Reward Guided Generation with Autoregressive Reward Model for Test-time Alignment
Yuancheng Xu, Udari Madhushani Sehwag, Alec Koppel, Sicheng Zhu, Bang An, Furong Huang, Sumitra Ganesh
•
Oct 10, 2024
•
4
2
Synth-SONAR : Synthèse d'images sonar avec une diversité et un réalisme améliorés via des modèles de diffusion doubles et des incitations GPT
Synth-SONAR: Sonar Image Synthesis with Enhanced Diversity and Realism via Dual Diffusion Models and GPT Prompting
Purushothaman Natarajan, Kamal Basha, Athira Nambiar
•
Oct 11, 2024
•
1
2