ChatPaper.aiChatPaper.ai
Главная

arXiv

HuggingFace

ЦеныАккаунтРабочее пространство

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Ежедневные Исследовательские Статьи по ИИ

Ежедневно отобранные исследовательские статьи по ИИ с переводами

MathVerse: Ваш многофункциональный LLM действительно видит диаграммы в визуальных математических задачах?
MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems?

Renrui Zhang, Dongzhi Jiang, Yichi Zhang, Haokun Lin, Ziyu Guo, Pengshuo Qiu, Aojun Zhou, Pan Lu, Kai-Wei Chang, Peng Gao, Hongsheng Li•Mar 21, 2024•533

DreamReward: Генерация 3D из текста с учетом предпочтений человека
DreamReward: Text-to-3D Generation with Human Preference

Junliang Ye, Fangfu Liu, Qixiu Li, Zhengyi Wang, Yikai Wang, Xinzhou Wang, Yueqi Duan, Jun Zhu•Mar 21, 2024•382

Кобра: Расширение Мамбы до мультимодальной крупномасштабной языковой модели для эффективного вывода
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference

Han Zhao, Min Zhang, Wei Zhao, Pengxiang Ding, Siteng Huang, Donglin Wang•Mar 21, 2024•362

AnyV2V: Готовый к использованию фреймворк для любых задач по редактированию видео в видео.
AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks

Max Ku, Cong Wei, Weiming Ren, Huan Yang, Wenhu Chen•Mar 21, 2024•271

ReNoise: Реальное инвертирование изображения через итеративное добавление шума.
ReNoise: Real Image Inversion Through Iterative Noising

Daniel Garibi, Or Patashnik, Andrey Voynov, Hadar Averbuch-Elor, Daniel Cohen-Or•Mar 21, 2024•221

Эффективные модели диффузии видео через декомпозицию контент-кадровых движений-латентных.
Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition

Sihyun Yu, Weili Nie, De-An Huang, Boyi Li, Jinwoo Shin, Anima Anandkumar•Mar 21, 2024•221

МойVLM: Персонализация VLM для пользовательских запросов.
MyVLM: Personalizing VLMs for User-Specific Queries

Yuval Alaluf, Elad Richardson, Sergey Tulyakov, Kfir Aberman, Daniel Cohen-Or•Mar 21, 2024•172

GRM: Большая гауссовская модель восстановления для эффективной трехмерной реконструкции и генерации
GRM: Large Gaussian Reconstruction Model for Efficient 3D Reconstruction and Generation

Yinghao Xu, Zifan Shi, Wang Yifan, Hansheng Chen, Ceyuan Yang, Sida Peng, Yujun Shen, Gordon Wetzstein•Mar 21, 2024•162

Гауссовское оформление: редактируемые комплексные поля излучения с моментальной визуализацией.
Gaussian Frosting: Editable Complex Radiance Fields with Real-Time Rendering

Antoine Guédon, Vincent Lepetit•Mar 21, 2024•141

Исследование промежуточных значений времени и пространства
Explorative Inbetweening of Time and Space

Haiwen Feng, Zheng Ding, Zhihao Xia, Simon Niklaus, Victoria Abrevaya, Michael J. Black, Xuaner Zhang•Mar 21, 2024•131

StyleCineGAN: Генерация пейзажных синемаграфов с использованием предварительно обученного StyleGAN
StyleCineGAN: Landscape Cinemagraph Generation using a Pre-trained StyleGAN

Jongwoo Choi, Kwanggyoon Seo, Amirsaman Ashtari, Junyong Noh•Mar 21, 2024•101

Возможность обращения за восстановлением: Общение с генеративными языковыми моделями
Recourse for reclamation: Chatting with generative language models

Jennifer Chien, Kevin R. McKee, Jackie Kay, William Isaac•Mar 21, 2024•81