ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
May 24th, 2024
Nicht alle Merkmale von Sprachmodellen sind linear.
Not All Language Model Features Are Linear
Joshua Engels, Isaac Liao, Eric J. Michaud, Wes Gurnee, Max Tegmark
•
May 23, 2024
•
42
3
DeepSeek-Prover: Fortschritte beim Theorembeweis in LLMs durch groß angelegte synthetische Daten
DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data
Huajian Xin, Daya Guo, Zhihong Shao, Zhizhou Ren, Qihao Zhu, Bo Liu, Chong Ruan, Wenda Li, Xiaodan Liang
•
May 23, 2024
•
41
6
ReVideo: Erstellen Sie ein Video neu mit Bewegungs- und Inhaltssteuerung.
ReVideo: Remake a Video with Motion and Content Control
Chong Mou, Mingdeng Cao, Xintao Wang, Zhaoyang Zhang, Ying Shan, Jian Zhang
•
May 22, 2024
•
26
5
Dichter Verbinder für mehrsprachige Sprachmodelle mit lernender Tiefe
Dense Connector for MLLMs
Huanjin Yao, Wenhao Wu, Taojiannan Yang, YuXin Song, Mengxi Zhang, Haocheng Feng, Yifan Sun, Zhiheng Li, Wanli Ouyang, Jingdong Wang
•
May 22, 2024
•
25
4
LiteVAE: Leichte und effiziente Variational Autoencoder für latente Diffusionsmodelle
LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models
Seyedmorteza Sadat, Jakob Buhmann, Derek Bradley, Otmar Hilliges, Romann M. Weber
•
May 23, 2024
•
20
11
Verteilte spekulative Inferenz großer Sprachmodelle
Distributed Speculative Inference of Large Language Models
Nadav Timor, Jonathan Mamou, Daniel Korat, Moshe Berchansky, Oren Pereg, Moshe Wasserblat, Tomer Galanti, Michal Gordon, David Harel
•
May 23, 2024
•
19
0
DiM: Diffusion Mamba für effiziente Hochauflösungs-Bildsynthese
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis
Yao Teng, Yue Wu, Han Shi, Xuefei Ning, Guohao Dai, Yu Wang, Zhenguo Li, Xihui Liu
•
May 23, 2024
•
17
0
Thermodynamischer natürlicher Gradientenabstieg
Thermodynamic Natural Gradient Descent
Kaelan Donatella, Samuel Duffield, Maxwell Aifer, Denis Melanson, Gavin Crooks, Patrick J. Coles
•
May 22, 2024
•
17
1
Verbesserte Verteilungsanpassungsdarstellung für schnelle Bildsynthese
Improved Distribution Matching Distillation for Fast Image Synthesis
Tianwei Yin, Michaël Gharbi, Taesung Park, Richard Zhang, Eli Shechtman, Fredo Durand, William T. Freeman
•
May 23, 2024
•
16
0
Visuelle Echos: Ein einfacher vereinheitlichter Transformer für die Audio-Visuelle Generierung
Visual Echoes: A Simple Unified Transformer for Audio-Visual Generation
Shiqi Yang, Zhi Zhong, Mengjie Zhao, Shusuke Takahashi, Masato Ishii, Takashi Shibuya, Yuki Mitsufuji
•
May 23, 2024
•
14
1
AlignGPT: Multimodale große Sprachmodelle mit adaptiver Ausrichtungsfähigkeit
AlignGPT: Multi-modal Large Language Models with Adaptive Alignment Capability
Fei Zhao, Taotian Pang, Chunhui Li, Zhen Wu, Junjie Guo, Shangyu Xing, Xinyu Dai
•
May 23, 2024
•
14
0
RectifID: Personalisierung des rectified Flows mit verankerter Klassifiziererführung
RectifID: Personalizing Rectified Flow with Anchored Classifier Guidance
Zhicheng Sun, Zhenhao Yang, Yang Jin, Haozhe Chi, Kun Xu, Kun Xu, Liwei Chen, Hao Jiang, Di Zhang, Yang Song, Kun Gai, Yadong Mu
•
May 23, 2024
•
12
0
CamViG: Kamera-bewusste Bild-zu-Video-Erzeugung mit multimodalen Transformatoren
CamViG: Camera Aware Image-to-Video Generation with Multimodal Transformers
Andrew Marmon, Grant Schindler, José Lezama, Dan Kondratyuk, Bryan Seybold, Irfan Essa
•
May 21, 2024
•
12
1
Semantica: Ein anpassbares Bild-konditioniertes Diffusionsmodell
Semantica: An Adaptable Image-Conditioned Diffusion Model
Manoj Kumar, Neil Houlsby, Emiel Hoogeboom
•
May 23, 2024
•
11
0
NeRF-Casting: Verbesserte ansichtsabhängige Erscheinung mit konsistenten Reflexionen
NeRF-Casting: Improved View-Dependent Appearance with Consistent Reflections
Dor Verbin, Pratul P. Srinivasan, Peter Hedman, Ben Mildenhall, Benjamin Attal, Richard Szeliski, Jonathan T. Barron
•
May 23, 2024
•
10
0
Neuronale Richtungskodierung für effiziente und präzise ansichtsabhängige Erscheinungsmodellierung
Neural Directional Encoding for Efficient and Accurate View-Dependent Appearance Modeling
Liwen Wu, Sai Bi, Zexiang Xu, Fujun Luan, Kai Zhang, Iliyan Georgiev, Kalyan Sunkavalli, Ravi Ramamoorthi
•
May 23, 2024
•
10
0
Tele-Aloha: Ein kostengünstiges und authentisches Telepräsenzsystem unter Verwendung von spärlichen RGB-Kameras.
Tele-Aloha: A Low-budget and High-authenticity Telepresence System Using Sparse RGB Cameras
Hanzhang Tu, Ruizhi Shao, Xue Dong, Shunyuan Zheng, Hao Zhang, Lili Chen, Meili Wang, Wenyu Li, Siyan Ma, Shengping Zhang, Boyao Zhou, Yebin Liu
•
May 23, 2024
•
9
0