ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
March 22nd, 2024
MathVerse: Sieht Ihr Multi-modal LLM wirklich die Diagramme in visuellen Mathematikaufgaben?
MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems?
Renrui Zhang, Dongzhi Jiang, Yichi Zhang, Haokun Lin, Ziyu Guo, Pengshuo Qiu, Aojun Zhou, Pan Lu, Kai-Wei Chang, Peng Gao, Hongsheng Li
•
Mar 21, 2024
•
53
3
TraumBelohnung: Text-zu-3D-Generierung mit menschlichen Präferenzen
DreamReward: Text-to-3D Generation with Human Preference
Junliang Ye, Fangfu Liu, Qixiu Li, Zhengyi Wang, Yikai Wang, Xinzhou Wang, Yueqi Duan, Jun Zhu
•
Mar 21, 2024
•
38
2
Cobra: Erweiterung von Mamba zu einem Multi-Modalen Großen Sprachmodell für Effiziente Inferenz
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference
Han Zhao, Min Zhang, Wei Zhao, Pengxiang Ding, Siteng Huang, Donglin Wang
•
Mar 21, 2024
•
36
2
AnyV2V: Ein Plug-and-Play-Framework für beliebige Video-zu-Video-Bearbeitungsaufgaben
AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks
Max Ku, Cong Wei, Weiming Ren, Huan Yang, Wenhu Chen
•
Mar 21, 2024
•
27
1
ReNoise: Echte Bildumkehr durch iterative Rauscherzeugung
ReNoise: Real Image Inversion Through Iterative Noising
Daniel Garibi, Or Patashnik, Andrey Voynov, Hadar Averbuch-Elor, Daniel Cohen-Or
•
Mar 21, 2024
•
22
1
Effiziente Videodiffusionsmodelle durch Inhaltsbild-Bewegungs-Latenz-Zerlegung
Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition
Sihyun Yu, Weili Nie, De-An Huang, Boyi Li, Jinwoo Shin, Anima Anandkumar
•
Mar 21, 2024
•
22
1
MeinVLM: Personalisierung von VLMs für benutzerspezifische Anfragen
MyVLM: Personalizing VLMs for User-Specific Queries
Yuval Alaluf, Elad Richardson, Sergey Tulyakov, Kfir Aberman, Daniel Cohen-Or
•
Mar 21, 2024
•
17
2
GRM: Großes Gauss'sches Rekonstruktionsmodell für effiziente 3D-Rekonstruktion und Generierung
GRM: Large Gaussian Reconstruction Model for Efficient 3D Reconstruction and Generation
Yinghao Xu, Zifan Shi, Wang Yifan, Hansheng Chen, Ceyuan Yang, Sida Peng, Yujun Shen, Gordon Wetzstein
•
Mar 21, 2024
•
16
2
Gaußscher Raureif: Bearbeitbare komplexe Strahlungsfelder mit Echtzeit-Rendering
Gaussian Frosting: Editable Complex Radiance Fields with Real-Time Rendering
Antoine Guédon, Vincent Lepetit
•
Mar 21, 2024
•
14
1
Explorative Zwischenzeichnung von Zeit und Raum
Explorative Inbetweening of Time and Space
Haiwen Feng, Zheng Ding, Zhihao Xia, Simon Niklaus, Victoria Abrevaya, Michael J. Black, Xuaner Zhang
•
Mar 21, 2024
•
13
1
StyleCineGAN: Landschafts-Cinemagraph-Erzeugung unter Verwendung eines vorab trainierten StyleGAN
StyleCineGAN: Landscape Cinemagraph Generation using a Pre-trained StyleGAN
Jongwoo Choi, Kwanggyoon Seo, Amirsaman Ashtari, Junyong Noh
•
Mar 21, 2024
•
10
1
Möglichkeiten zur Rückverfolgung: Unterhaltung mit generativen Sprachmodellen
Recourse for reclamation: Chatting with generative language models
Jennifer Chien, Kevin R. McKee, Jackie Kay, William Isaac
•
Mar 21, 2024
•
8
1