ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
April 9th, 2024
Ferret-UI: Fundiertes Verständnis von mobiler Benutzeroberfläche mit multimodalen LLMs
Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs
Keen You, Haotian Zhang, Eldon Schoop, Floris Weers, Amanda Swearngin, Jeffrey Nichols, Yinfei Yang, Zhe Gan
•
Apr 8, 2024
•
83
3
MagicTime: Zeitraffervideo-Generierungsmodelle als metamorphe Simulatoren
MagicTime: Time-lapse Video Generation Models as Metamorphic Simulators
Shenghai Yuan, Jinfa Huang, Yujun Shi, Yongqi Xu, Ruijie Zhu, Bin Lin, Xinhua Cheng, Li Yuan, Jiebo Luo
•
Apr 7, 2024
•
35
2
SwapAnything: Ermöglichen des beliebigen Austauschs von Objekten in der personalisierten visuellen Bearbeitung
SwapAnything: Enabling Arbitrary Object Swapping in Personalized Visual Editing
Jing Gu, Yilin Wang, Nanxuan Zhao, Wei Xiong, Qing Liu, Zhifei Zhang, He Zhang, Jianming Zhang, HyunJoon Jung, Xin Eric Wang
•
Apr 8, 2024
•
27
0
ByteEdit: Steigern, Erfüllen und Beschleunigen der Generativen Bildbearbeitung
ByteEdit: Boost, Comply and Accelerate Generative Image Editing
Yuxi Ren, Jie Wu, Yanzuo Lu, Huafeng Kuang, Xin Xia, Xionghui Wang, Qianqian Wang, Yixing Zhu, Pan Xie, Shiyin Wang, Xuefeng Xiao, Yitong Wang, Min Zheng, Lean Fu
•
Apr 7, 2024
•
27
1
UniFL: Verbesserung der stabilen Diffusion durch vereinheitlichtes Feedback-Lernen
UniFL: Improve Stable Diffusion via Unified Feedback Learning
Jiacheng Zhang, Jie Wu, Yuxi Ren, Xin Xia, Huafeng Kuang, Pan Xie, Jiashi Li, Xuefeng Xiao, Weilin Huang, Min Zheng, Lean Fu, Guanbin Li
•
Apr 8, 2024
•
26
1
SpatialTracker: Verfolgung beliebiger 2D-Pixel im 3D-Raum
SpatialTracker: Tracking Any 2D Pixels in 3D Space
Yuxi Xiao, Qianqian Wang, Shangzhan Zhang, Nan Xue, Sida Peng, Yujun Shen, Xiaowei Zhou
•
Apr 5, 2024
•
26
1
BeyondScene: Generierung von Szenen mit höherer Auflösung und Fokus auf Menschen mithilfe vortrainierter Diffusion
BeyondScene: Higher-Resolution Human-Centric Scene Generation With Pretrained Diffusion
Gwanghyun Kim, Hayeon Kim, Hoigi Seo, Dong Un Kang, Se Young Chun
•
Apr 6, 2024
•
24
0
MA-LMM: Memory-augmentiertes großes multimodales Modell für langfristiges Video-Verständnis
MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding
Bo He, Hengduo Li, Young Kyun Jang, Menglin Jia, Xuefei Cao, Ashish Shah, Abhinav Shrivastava, Ser-Nam Lim
•
Apr 8, 2024
•
23
0
PhysAvatar: Das Erlernen der Physik von bekleideten 3D-Avataren aus visuellen Beobachtungen
PhysAvatar: Learning the Physics of Dressed 3D Avatars from Visual Observations
Yang Zheng, Qingqing Zhao, Guandao Yang, Wang Yifan, Donglai Xiang, Florian Dubost, Dmitry Lagun, Thabo Beeler, Federico Tombari, Leonidas Guibas, Gordon Wetzstein
•
Apr 5, 2024
•
18
0
YaART: Noch eine andere ART-Rendering-Technologie
YaART: Yet Another ART Rendering Technology
Sergey Kastryulin, Artem Konev, Alexander Shishenya, Eugene Lyapustin, Artem Khurshudov, Alexander Tselousov, Nikita Vinokurov, Denis Kuznedelev, Alexander Markovich, Grigoriy Livshits, Alexey Kirillov, Anastasiia Tabisheva, Liubov Chubarova, Marina Kaminskaia, Alexander Ustyuzhanin, Artemii Shvetsov, Daniil Shlenskii, Valerii Startsev, Dmitrii Kornilov, Mikhail Romanov, Artem Babenko, Sergei Ovcharenko, Valentin Khrulkov
•
Apr 8, 2024
•
17
0
MoMA: Multimodaler LLM-Adapter für schnelle personalisierte Bildgenerierung
MoMA: Multimodal LLM Adapter for Fast Personalized Image Generation
Kunpeng Song, Yizhe Zhu, Bingchen Liu, Qing Yan, Ahmed Elgammal, Xiao Yang
•
Apr 8, 2024
•
15
2
Ausrichtung von Diffusionsmodellen durch Optimierung der menschlichen Nützlichkeit
Aligning Diffusion Models by Optimizing Human Utility
Shufan Li, Konstantinos Kallidromitis, Akash Gokul, Yusuke Kato, Kazuki Kozuka
•
Apr 6, 2024
•
15
1
Diffusion-RWKV: Skalierung von RWKV-ähnlichen Architekturen für Diffusionsmodelle
Diffusion-RWKV: Scaling RWKV-Like Architectures for Diffusion Models
Zhengcong Fei, Mingyuan Fan, Changqian Yu, Debang Li, Junshi Huang
•
Apr 6, 2024
•
13
0
DATENeRF: Tiefenbewusste Textbasierte Bearbeitung von NeRFs
DATENeRF: Depth-Aware Text-based Editing of NeRFs
Sara Rojas, Julien Philip, Kai Zhang, Sai Bi, Fujun Luan, Bernard Ghanem, Kalyan Sunkavall
•
Apr 6, 2024
•
11
0
Koala: Schlüsselbild-bedingtes Langvideo-LLM
Koala: Key frame-conditioned long video-LLM
Reuben Tan, Ximeng Sun, Ping Hu, Jui-hsien Wang, Hanieh Deilamsalehy, Bryan A. Plummer, Bryan Russell, Kate Saenko
•
Apr 5, 2024
•
7
2