ChatPaper.aiChatPaper.ai
Accueil

arXiv

HuggingFace

TarifsCompteEspace de travail

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Articles de Recherche en IA Quotidiens

Articles de recherche en IA sélectionnés quotidiennement avec traductions

MathVerse : Votre modèle de langage multimodal perçoit-il vraiment les diagrammes dans les problèmes de mathématiques visuels ?
MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems?

Renrui Zhang, Dongzhi Jiang, Yichi Zhang, Haokun Lin, Ziyu Guo, Pengshuo Qiu, Aojun Zhou, Pan Lu, Kai-Wei Chang, Peng Gao, Hongsheng Li•Mar 21, 2024•533

DreamReward : Génération de texte en 3D avec préférences humaines
DreamReward: Text-to-3D Generation with Human Preference

Junliang Ye, Fangfu Liu, Qixiu Li, Zhengyi Wang, Yikai Wang, Xinzhou Wang, Yueqi Duan, Jun Zhu•Mar 21, 2024•382

Cobra : Extension de Mamba vers un modèle de langage multimodal à grande échelle pour une inférence efficace
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference

Han Zhao, Min Zhang, Wei Zhao, Pengxiang Ding, Siteng Huang, Donglin Wang•Mar 21, 2024•362

AnyV2V : Un cadre plug-and-play pour toute tâche d'édition vidéo-à-vidéo
AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks

Max Ku, Cong Wei, Weiming Ren, Huan Yang, Wenhu Chen•Mar 21, 2024•271

ReNoise : Inversion d'images réelles par bruitage itératif
ReNoise: Real Image Inversion Through Iterative Noising

Daniel Garibi, Or Patashnik, Andrey Voynov, Hadar Averbuch-Elor, Daniel Cohen-Or•Mar 21, 2024•221

Modèles de diffusion vidéo efficaces via la décomposition mouvement-latent des trames de contenu
Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition

Sihyun Yu, Weili Nie, De-An Huang, Boyi Li, Jinwoo Shin, Anima Anandkumar•Mar 21, 2024•221

MyVLM : Personnalisation des VLMs pour les requêtes spécifiques à l'utilisateur
MyVLM: Personalizing VLMs for User-Specific Queries

Yuval Alaluf, Elad Richardson, Sergey Tulyakov, Kfir Aberman, Daniel Cohen-Or•Mar 21, 2024•172

GRM : Grand Modèle de Reconstruction Gaussienne pour une Reconstruction et Génération 3D Efficace
GRM: Large Gaussian Reconstruction Model for Efficient 3D Reconstruction and Generation

Yinghao Xu, Zifan Shi, Wang Yifan, Hansheng Chen, Ceyuan Yang, Sida Peng, Yujun Shen, Gordon Wetzstein•Mar 21, 2024•162

Gaussian Frosting : Champs de radiance complexes modifiables avec rendu en temps réel
Gaussian Frosting: Editable Complex Radiance Fields with Real-Time Rendering

Antoine Guédon, Vincent Lepetit•Mar 21, 2024•141

Interpolation explorative du temps et de l'espace
Explorative Inbetweening of Time and Space

Haiwen Feng, Zheng Ding, Zhihao Xia, Simon Niklaus, Victoria Abrevaya, Michael J. Black, Xuaner Zhang•Mar 21, 2024•131

StyleCineGAN : Génération de cinémagraphies paysagères à l'aide d'un StyleGAN pré-entraîné
StyleCineGAN: Landscape Cinemagraph Generation using a Pre-trained StyleGAN

Jongwoo Choi, Kwanggyoon Seo, Amirsaman Ashtari, Junyong Noh•Mar 21, 2024•101

Recours à la réclamation : Dialoguer avec des modèles de langage génératifs
Recourse for reclamation: Chatting with generative language models

Jennifer Chien, Kevin R. McKee, Jackie Kay, William Isaac•Mar 21, 2024•81