ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
March 25th, 2024
Können große Sprachmodelle im Kontext erkunden?
Can large language models explore in-context?
Akshay Krishnamurthy, Keegan Harris, Dylan J. Foster, Cyril Zhang, Aleksandrs Slivkins
•
Mar 22, 2024
•
34
2
LLM2LLM: Verbesserung von LLMs durch neuartige iterative Datenverbesserung
LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement
Nicholas Lee, Thanakul Wattanawong, Sehoon Kim, Karttikeya Mangalam, Sheng Shen, Gopala Anumanchipali, Michael W. Mahoney, Kurt Keutzer, Amir Gholami
•
Mar 22, 2024
•
28
2
InternVideo2: Skalierung von Video-Grundlagenmodellen für multimodales Videoverständnis
InternVideo2: Scaling Video Foundation Models for Multimodal Video Understanding
Yi Wang, Kunchang Li, Xinhao Li, Jiashuo Yu, Yinan He, Guo Chen, Baoqi Pei, Rongkun Zheng, Jilan Xu, Zun Wang, Yansong Shi, Tianxiang Jiang, Songze Li, Hongjie Zhang, Yifei Huang, Yu Qiao, Yali Wang, Limin Wang
•
Mar 22, 2024
•
26
4
Titel: Steuerbare und konsistente Animation menschlicher Bilder mit 3D parametrischer Führung
Champ: Controllable and Consistent Human Image Animation with 3D Parametric Guidance
Shenhao Zhu, Junming Leo Chen, Zuozhuo Dai, Yinghui Xu, Xun Cao, Yao Yao, Hao Zhu, Siyu Zhu
•
Mar 21, 2024
•
16
2
ThemaStation: Generierung von themenbewussten 3D-Assets aus wenigen Beispielen
ThemeStation: Generating Theme-Aware 3D Assets from Few Exemplars
Zhenwei Wang, Tengfei Wang, Gerhard Hancke, Ziwei Liu, Rynson W. H. Lau
•
Mar 22, 2024
•
15
1
VidLA: Video-Sprachabstimmung im großen Maßstab
VidLA: Video-Language Alignment at Scale
Mamshad Nayeem Rizve, Fan Fei, Jayakrishnan Unnikrishnan, Son Tran, Benjamin Z. Yao, Belinda Zeng, Mubarak Shah, Trishul Chilimbi
•
Mar 21, 2024
•
14
1
SiMBA: Vereinfachte Mamba-basierte Architektur für Vision und multivariate Zeitreihen
SiMBA: Simplified Mamba-Based Architecture for Vision and Multivariate Time series
Badri N. Patro, Vijay S. Agneeswaran
•
Mar 22, 2024
•
13
1
DragAPart: Erlernen einer Bewegungspriorität auf Teilebene für artikulierte Objekte
DragAPart: Learning a Part-Level Motion Prior for Articulated Objects
Ruining Li, Chuanxia Zheng, Christian Rupprecht, Andrea Vedaldi
•
Mar 22, 2024
•
11
1
FollowIR: Evaluierung und Lehre von Information Retrieval Modellen, um Anweisungen zu befolgen
FollowIR: Evaluating and Teaching Information Retrieval Models to Follow Instructions
Orion Weller, Benjamin Chang, Sean MacAvaney, Kyle Lo, Arman Cohan, Benjamin Van Durme, Dawn Lawrie, Luca Soldaini
•
Mar 22, 2024
•
11
1
AllHands: Frag mich alles über groß angelegtes wortwörtliches Feedback mittels großer Sprachmodelle
AllHands: Ask Me Anything on Large-scale Verbatim Feedback via Large Language Models
Chaoyun Zhang, Zicheng Ma, Yuhao Wu, Shilin He, Si Qin, Minghua Ma, Xiaoting Qin, Yu Kang, Yuyi Liang, Xiaoyu Gou, Yajie Xue, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Qi Zhang
•
Mar 22, 2024
•
10
2
LATTE3D: Groß angelegte amortisierte Text-zu-Verbessert3D-Synthese
LATTE3D: Large-scale Amortized Text-To-Enhanced3D Synthesis
Kevin Xie, Jonathan Lorraine, Tianshi Cao, Jun Gao, James Lucas, Antonio Torralba, Sanja Fidler, Xiaohui Zeng
•
Mar 22, 2024
•
8
1
Rückmeldung vom Compiler für große Sprachmodelle
Compiler generated feedback for Large Language Models
Dejan Grubisic, Chris Cummins, Volker Seeker, Hugh Leather
•
Mar 18, 2024
•
6
1