ChatPaper.aiChatPaper.ai
Главная

arXiv

HuggingFace

ЦеныАккаунтРабочее пространство

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Ежедневные Исследовательские Статьи по ИИ

Ежедневно отобранные исследовательские статьи по ИИ с переводами

Не все признаки языковой модели являются линейными.
Not All Language Model Features Are Linear

Joshua Engels, Isaac Liao, Eric J. Michaud, Wes Gurnee, Max Tegmark•May 23, 2024•423

DeepSeek-Prover: Продвижение теоремного доказательства в LLMs через синтетические данные большого масштаба
DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data

Huajian Xin, Daya Guo, Zhihong Shao, Zhizhou Ren, Qihao Zhu, Bo Liu, Chong Ruan, Wenda Li, Xiaodan Liang•May 23, 2024•416

ReVideo: Пересоздание видео с управлением движением и контентом
ReVideo: Remake a Video with Motion and Content Control

Chong Mou, Mingdeng Cao, Xintao Wang, Zhaoyang Zhang, Ying Shan, Jian Zhang•May 22, 2024•265

Плотный коннектор для многоязычных языковых моделей.
Dense Connector for MLLMs

Huanjin Yao, Wenhao Wu, Taojiannan Yang, YuXin Song, Mengxi Zhang, Haocheng Feng, Yifan Sun, Zhiheng Li, Wanli Ouyang, Jingdong Wang•May 22, 2024•254

LiteVAE: Легковесные и эффективные вариационные автоэнкодеры для моделей латентной диффузии
LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models

Seyedmorteza Sadat, Jakob Buhmann, Derek Bradley, Otmar Hilliges, Romann M. Weber•May 23, 2024•2011

Распределенное спекулятивное вывода больших языковых моделей
Distributed Speculative Inference of Large Language Models

Nadav Timor, Jonathan Mamou, Daniel Korat, Moshe Berchansky, Oren Pereg, Moshe Wasserblat, Tomer Galanti, Michal Gordon, David Harel•May 23, 2024•190

DiM: Диффузионная мамба для эффективного синтеза изображений высокого разрешения
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis

Yao Teng, Yue Wu, Han Shi, Xuefei Ning, Guohao Dai, Yu Wang, Zhenguo Li, Xihui Liu•May 23, 2024•170

Градиентный спуск на основе термодинамического естественного градиента
Thermodynamic Natural Gradient Descent

Kaelan Donatella, Samuel Duffield, Maxwell Aifer, Denis Melanson, Gavin Crooks, Patrick J. Coles•May 22, 2024•171

Улучшенное сопоставление распределений для быстрой синтеза изображений
Improved Distribution Matching Distillation for Fast Image Synthesis

Tianwei Yin, Michaël Gharbi, Taesung Park, Richard Zhang, Eli Shechtman, Fredo Durand, William T. Freeman•May 23, 2024•160

Визуальные Эхо: Простой Объединенный Трансформер для Аудио-визуальной Генерации
Visual Echoes: A Simple Unified Transformer for Audio-Visual Generation

Shiqi Yang, Zhi Zhong, Mengjie Zhao, Shusuke Takahashi, Masato Ishii, Takashi Shibuya, Yuki Mitsufuji•May 23, 2024•141

AlignGPT: Много몿ельные большие языковые модели с адаптивной способностью выравнивания
AlignGPT: Multi-modal Large Language Models with Adaptive Alignment Capability

Fei Zhao, Taotian Pang, Chunhui Li, Zhen Wu, Junjie Guo, Shangyu Xing, Xinyu Dai•May 23, 2024•140

Идентификация: Персонализация выправленного потока с руководством якорным классификатором
RectifID: Personalizing Rectified Flow with Anchored Classifier Guidance

Zhicheng Sun, Zhenhao Yang, Yang Jin, Haozhe Chi, Kun Xu, Kun Xu, Liwei Chen, Hao Jiang, Di Zhang, Yang Song, Kun Gai, Yadong Mu•May 23, 2024•120

CamViG: Генерация изображения в видео с учетом камеры с помощью мультимодальных трансформеров
CamViG: Camera Aware Image-to-Video Generation with Multimodal Transformers

Andrew Marmon, Grant Schindler, José Lezama, Dan Kondratyuk, Bryan Seybold, Irfan Essa•May 21, 2024•121

Семантика: Модель диффузии, зависящая от изображения
Semantica: An Adaptable Image-Conditioned Diffusion Model

Manoj Kumar, Neil Houlsby, Emiel Hoogeboom•May 23, 2024•110

Излучение NeRF: Улучшенный вид, зависящий от обзора, с согласованными отражениями
NeRF-Casting: Improved View-Dependent Appearance with Consistent Reflections

Dor Verbin, Pratul P. Srinivasan, Peter Hedman, Ben Mildenhall, Benjamin Attal, Richard Szeliski, Jonathan T. Barron•May 23, 2024•100

Нейронное направленное кодирование для эффективного и точного моделирования зависимого от вида внешнего вида.
Neural Directional Encoding for Efficient and Accurate View-Dependent Appearance Modeling

Liwen Wu, Sai Bi, Zexiang Xu, Fujun Luan, Kai Zhang, Iliyan Georgiev, Kalyan Sunkavalli, Ravi Ramamoorthi•May 23, 2024•100

Теле-Алоха: недорогая и высокоаутентичная система телеприсутствия с использованием разреженных RGB-камер
Tele-Aloha: A Low-budget and High-authenticity Telepresence System Using Sparse RGB Cameras

Hanzhang Tu, Ruizhi Shao, Xue Dong, Shunyuan Zheng, Hao Zhang, Lili Chen, Meili Wang, Wenyu Li, Siyan Ma, Shengping Zhang, Boyao Zhou, Yebin Liu•May 23, 2024•90