ChatPaper.aiChatPaper.ai
Accueil

arXiv

HuggingFace

TarifsCompteEspace de travail

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Articles de Recherche en IA Quotidiens

Articles de recherche en IA sélectionnés quotidiennement avec traductions

Toutes les caractéristiques des modèles de langage ne sont pas linéaires.
Not All Language Model Features Are Linear

Joshua Engels, Isaac Liao, Eric J. Michaud, Wes Gurnee, Max Tegmark•May 23, 2024•423

DeepSeek-Prover : Faire progresser la démonstration de théorèmes dans les LLM grâce à des données synthétiques à grande échelle
DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data

Huajian Xin, Daya Guo, Zhihong Shao, Zhizhou Ren, Qihao Zhu, Bo Liu, Chong Ruan, Wenda Li, Xiaodan Liang•May 23, 2024•416

ReVideo : Recréer une vidéo avec contrôle du mouvement et du contenu
ReVideo: Remake a Video with Motion and Content Control

Chong Mou, Mingdeng Cao, Xintao Wang, Zhaoyang Zhang, Ying Shan, Jian Zhang•May 22, 2024•265

Connecteur Dense pour MLLMs
Dense Connector for MLLMs

Huanjin Yao, Wenhao Wu, Taojiannan Yang, YuXin Song, Mengxi Zhang, Haocheng Feng, Yifan Sun, Zhiheng Li, Wanli Ouyang, Jingdong Wang•May 22, 2024•254

LiteVAE : Autoencodeurs variationnels légers et efficaces pour les modèles de diffusion latente
LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models

Seyedmorteza Sadat, Jakob Buhmann, Derek Bradley, Otmar Hilliges, Romann M. Weber•May 23, 2024•2011

Inférence spéculative distribuée des grands modèles de langage
Distributed Speculative Inference of Large Language Models

Nadav Timor, Jonathan Mamou, Daniel Korat, Moshe Berchansky, Oren Pereg, Moshe Wasserblat, Tomer Galanti, Michal Gordon, David Harel•May 23, 2024•190

DiM : Diffusion Mamba pour la synthèse efficace d'images haute résolution
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis

Yao Teng, Yue Wu, Han Shi, Xuefei Ning, Guohao Dai, Yu Wang, Zhenguo Li, Xihui Liu•May 23, 2024•170

Descente de gradient naturel thermodynamique
Thermodynamic Natural Gradient Descent

Kaelan Donatella, Samuel Duffield, Maxwell Aifer, Denis Melanson, Gavin Crooks, Patrick J. Coles•May 22, 2024•171

Distillation Améliorée de l'Appariement de Distribution pour la Synthèse Rapide d'Images
Improved Distribution Matching Distillation for Fast Image Synthesis

Tianwei Yin, Michaël Gharbi, Taesung Park, Richard Zhang, Eli Shechtman, Fredo Durand, William T. Freeman•May 23, 2024•160

Échos Visuels : Un Transformeur Unifié Simple pour la Génération Audio-Visuelle
Visual Echoes: A Simple Unified Transformer for Audio-Visual Generation

Shiqi Yang, Zhi Zhong, Mengjie Zhao, Shusuke Takahashi, Masato Ishii, Takashi Shibuya, Yuki Mitsufuji•May 23, 2024•141

AlignGPT : Modèles de langage multi-modaux à grande échelle avec capacité d'alignement adaptatif
AlignGPT: Multi-modal Large Language Models with Adaptive Alignment Capability

Fei Zhao, Taotian Pang, Chunhui Li, Zhen Wu, Junjie Guo, Shangyu Xing, Xinyu Dai•May 23, 2024•140

RectifID : Personnalisation des flux rectifiés avec guidage par classifieur ancré
RectifID: Personalizing Rectified Flow with Anchored Classifier Guidance

Zhicheng Sun, Zhenhao Yang, Yang Jin, Haozhe Chi, Kun Xu, Kun Xu, Liwei Chen, Hao Jiang, Di Zhang, Yang Song, Kun Gai, Yadong Mu•May 23, 2024•120

CamViG : Génération d'images vers vidéo consciente de la caméra avec des transformateurs multimodaux
CamViG: Camera Aware Image-to-Video Generation with Multimodal Transformers

Andrew Marmon, Grant Schindler, José Lezama, Dan Kondratyuk, Bryan Seybold, Irfan Essa•May 21, 2024•121

Semantica : Un modèle de diffusion conditionné par l'image et adaptable
Semantica: An Adaptable Image-Conditioned Diffusion Model

Manoj Kumar, Neil Houlsby, Emiel Hoogeboom•May 23, 2024•110

NeRF-Casting : Amélioration de l'apparence dépendante de la vue avec des réflexions cohérentes
NeRF-Casting: Improved View-Dependent Appearance with Consistent Reflections

Dor Verbin, Pratul P. Srinivasan, Peter Hedman, Ben Mildenhall, Benjamin Attal, Richard Szeliski, Jonathan T. Barron•May 23, 2024•100

Encodage directionnel neuronal pour une modélisation efficace et précise de l'apparence dépendante de la vue
Neural Directional Encoding for Efficient and Accurate View-Dependent Appearance Modeling

Liwen Wu, Sai Bi, Zexiang Xu, Fujun Luan, Kai Zhang, Iliyan Georgiev, Kalyan Sunkavalli, Ravi Ramamoorthi•May 23, 2024•100

Tele-Aloha : Un système de téléprésence à faible coût et haute authenticité utilisant des caméras RGB éparses
Tele-Aloha: A Low-budget and High-authenticity Telepresence System Using Sparse RGB Cameras

Hanzhang Tu, Ruizhi Shao, Xue Dong, Shunyuan Zheng, Hao Zhang, Lili Chen, Meili Wang, Wenyu Li, Siyan Ma, Shengping Zhang, Boyao Zhou, Yebin Liu•May 23, 2024•90