ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
March 28th, 2024
ViTAR: Vision-Transformer mit beliebiger Auflösung
ViTAR: Vision Transformer with Any Resolution
Qihang Fan, Quanzeng You, Xiaotian Han, Yongfei Liu, Yunzhe Tao, Huaibo Huang, Ran He, Hongxia Yang
•
Mar 27, 2024
•
56
2
Mini-Gemini: Erschließung des Potenzials von Multimodalitäts-Vision-Sprache-Modellen
Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models
Yanwei Li, Yuechen Zhang, Chengyao Wang, Zhisheng Zhong, Yixin Chen, Ruihang Chu, Shaoteng Liu, Jiaya Jia
•
Mar 27, 2024
•
48
4
ObjectDrop: Bootstrapping von Gegenfaktoren für fotorealistische Objektentfernung und -einfügung
ObjectDrop: Bootstrapping Counterfactuals for Photorealistic Object Removal and Insertion
Daniel Winter, Matan Cohen, Shlomi Fruchter, Yael Pritch, Alex Rav-Acha, Yedid Hoshen
•
Mar 27, 2024
•
28
4
Langform-Faktizität in großen Sprachmodellen
Long-form factuality in large language models
Jerry Wei, Chengrun Yang, Xinying Song, Yifeng Lu, Nathan Hu, Dustin Tran, Daiyi Peng, Ruibo Liu, Da Huang, Cosmo Du, Quoc V. Le
•
Mar 27, 2024
•
26
2
Kleidungsstück3DGen: 3D Kleidungsstück-Stilisierung und Texturerzeugung
Garment3DGen: 3D Garment Stylization and Texture Generation
Nikolaos Sarafianos, Tuur Stuyck, Xiaoyu Xiang, Yilei Li, Jovan Popovic, Rakesh Ranjan
•
Mar 27, 2024
•
24
3
BioMedLM: Ein 2,7 Milliarden Parameter umfassendes Sprachmodell, das auf biomedizinischem Text trainiert wurde.
BioMedLM: A 2.7B Parameter Language Model Trained On Biomedical Text
Elliot Bolton, Abhinav Venigalla, Michihiro Yasunaga, David Hall, Betty Xiong, Tony Lee, Roxana Daneshjou, Jonathan Frankle, Percy Liang, Michael Carbin, Christopher D. Manning
•
Mar 27, 2024
•
24
3
Kombinieren Sie Gaussian Splatting mit Mamba für die 3D-Rekonstruktion aus einer einzigen Ansicht: Gamba
Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstruction
Qiuhong Shen, Xuanyu Yi, Zike Wu, Pan Zhou, Hanwang Zhang, Shuicheng Yan, Xinchao Wang
•
Mar 27, 2024
•
21
2
EgoLifter: Open-World 3D-Segmentierung für egozentrische Wahrnehmung
EgoLifter: Open-world 3D Segmentation for Egocentric Perception
Qiao Gu, Zhaoyang Lv, Duncan Frost, Simon Green, Julian Straub, Chris Sweeney
•
Mar 26, 2024
•
12
1
FlexEdit: Flexible und kontrollierbare Diffusions-basierte objektorientierte Bildbearbeitung
FlexEdit: Flexible and Controllable Diffusion-based Object-centric Image Editing
Trong-Tung Nguyen, Duc-Anh Nguyen, Anh Tran, Cuong Pham
•
Mar 27, 2024
•
11
1
Auf dem Weg zu einem Welt-Englisch Sprachmodell für virtuelle Assistenten auf Geräten
Towards a World-English Language Model for On-Device Virtual Assistants
Rricha Jalota, Lyan Verwimp, Markus Nussbaum-Thom, Amr Mousa, Arturo Argueta, Youssef Oualil
•
Mar 27, 2024
•
6
1