ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
May 29th, 2024
Phasen-Konsistenzmodell
Phased Consistency Model
Fu-Yun Wang, Zhaoyang Huang, Alexander William Bergman, Dazhong Shen, Peng Gao, Michael Lingelbach, Keqiang Sun, Weikang Bian, Guanglu Song, Yu Liu, Hongsheng Li, Xiaogang Wang
•
May 28, 2024
•
49
11
2BP: 2-stufige Rückwärtspropagation
2BP: 2-Stage Backpropagation
Christopher Rae, Joseph K. L. Lee, James Richings
•
May 28, 2024
•
27
6
Instruct-MusicGen: Erschließung von Text-zu-Musik-Bearbeitung für Musiksprachmodelle durch Instruktionstuning
Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning
Yixiao Zhang, Yukara Ikemiya, Woosung Choi, Naoki Murata, Marco A. Martínez-Ramírez, Liwei Lin, Gus Xia, Wei-Hsiang Liao, Yuki Mitsufuji, Simon Dixon
•
May 28, 2024
•
23
3
Yuan 2.0-M32: Mischung von Experten mit Aufmerksamkeitsrouter
Yuan 2.0-M32: Mixture of Experts with Attention Router
Shaohua Wu, Jiangang Luo, Xi Chen, Lingjun Li, Xudong Zhao, Tong Yu, Chao Wang, Yue Wang, Fei Wang, Weixu Qiao, Houbo He, Zeru Zhang, Zeyu Sun, Junxiong Mao, Chong Shen
•
May 28, 2024
•
22
2
LLaMA-NAS: Effiziente Suche nach neuronalen Architekturen für große Sprachmodelle
LLaMA-NAS: Efficient Neural Architecture Search for Large Language Models
Anthony Sarah, Sharath Nittur Sridhar, Maciej Szankin, Sairam Sundaresan
•
May 28, 2024
•
21
3
GFlow: Wiederherstellung einer 4D-Welt aus monokularem Video
GFlow: Recovering 4D World from Monocular Video
Shizun Wang, Xingyi Yang, Qiuhong Shen, Zhenxiang Jiang, Xinchao Wang
•
May 28, 2024
•
18
3
VeLoRA: Speichereffizientes Training unter Verwendung von Rang-1 Untertoken-Projektionen
VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections
Roy Miles, Pradyumna Reddy, Ismail Elezi, Jiankang Deng
•
May 28, 2024
•
14
4
3DitScene: Bearbeitung beliebiger Szenen mittels sprachgesteuerter entwirrter Gaußscher Splatting
3DitScene: Editing Any Scene via Language-guided Disentangled Gaussian Splatting
Qihang Zhang, Yinghao Xu, Chaoyang Wang, Hsin-Ying Lee, Gordon Wetzstein, Bolei Zhou, Ceyuan Yang
•
May 28, 2024
•
9
0