ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
May 29th, 2024
Модель фазовой согласованности
Phased Consistency Model
Fu-Yun Wang, Zhaoyang Huang, Alexander William Bergman, Dazhong Shen, Peng Gao, Michael Lingelbach, Keqiang Sun, Weikang Bian, Guanglu Song, Yu Liu, Hongsheng Li, Xiaogang Wang
•
May 28, 2024
•
49
11
2BP: Двухэтапное обратное распространение
2BP: 2-Stage Backpropagation
Christopher Rae, Joseph K. L. Lee, James Richings
•
May 28, 2024
•
27
6
Instruct-MusicGen: Разблокирование редактирования текста в музыку для моделей языка музыки через настройку инструкций
Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning
Yixiao Zhang, Yukara Ikemiya, Woosung Choi, Naoki Murata, Marco A. Martínez-Ramírez, Liwei Lin, Gus Xia, Wei-Hsiang Liao, Yuki Mitsufuji, Simon Dixon
•
May 28, 2024
•
23
3
Yuan 2.0-M32: Смесь экспертов с маршрутизатором внимания
Yuan 2.0-M32: Mixture of Experts with Attention Router
Shaohua Wu, Jiangang Luo, Xi Chen, Lingjun Li, Xudong Zhao, Tong Yu, Chao Wang, Yue Wang, Fei Wang, Weixu Qiao, Houbo He, Zeru Zhang, Zeyu Sun, Junxiong Mao, Chong Shen
•
May 28, 2024
•
22
2
LLaMA-NAS: Эффективный поиск архитектуры нейронных сетей для больших языковых моделей
LLaMA-NAS: Efficient Neural Architecture Search for Large Language Models
Anthony Sarah, Sharath Nittur Sridhar, Maciej Szankin, Sairam Sundaresan
•
May 28, 2024
•
21
3
GFlow: Восстановление 4D мира из монокулярного видео
GFlow: Recovering 4D World from Monocular Video
Shizun Wang, Xingyi Yang, Qiuhong Shen, Zhenxiang Jiang, Xinchao Wang
•
May 28, 2024
•
18
3
VeLoRA: Обучение с памятью эффективное использование проекций подтокенов ранга 1
VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections
Roy Miles, Pradyumna Reddy, Ismail Elezi, Jiankang Deng
•
May 28, 2024
•
14
4
3DitScene: Редактирование любой сцены с помощью языком управляемой дезентанглированной гауссовой проекции.
3DitScene: Editing Any Scene via Language-guided Disentangled Gaussian Splatting
Qihang Zhang, Yinghao Xu, Chaoyang Wang, Hsin-Ying Lee, Gordon Wetzstein, Bolei Zhou, Ceyuan Yang
•
May 28, 2024
•
9
0