ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
February 29th, 2024
Die Ära der 1-Bit-LLMs: Alle großen Sprachmodelle sind in 1,58 Bits.
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
Shuming Ma, Hongyu Wang, Lingxiao Ma, Lei Wang, Wenhui Wang, Shaohan Huang, Li Dong, Ruiping Wang, Jilong Xue, Furu Wei
•
Feb 27, 2024
•
618
143
EMO: Emotive Porträt zum Leben erweckt – Erzeugung ausdrucksstarker Porträtvideos mit einem Audio-zu-Video-Diffusionsmodell unter schwachen Bedingungen
EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions
Linrui Tian, Qi Wang, Bang Zhang, Liefeng Bo
•
Feb 27, 2024
•
196
20
Sora: Ein Überblick über Hintergrund, Technologie, Grenzen und Chancen großer Vision-Modelle
Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models
Yixin Liu, Kai Zhang, Yuan Li, Zhiling Yan, Chujie Gao, Ruoxi Chen, Zhengqing Yuan, Yue Huang, Hanchi Sun, Jianfeng Gao, Lifang He, Lichao Sun
•
Feb 27, 2024
•
89
5
OmniACT: Ein Datensatz und Benchmark zur Ermöglichung multimodaler Generalist-Autonomer Agenten für Desktop und Web
OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web
Raghav Kapoor, Yash Parag Butala, Melisa Russak, Jing Yu Koh, Kiran Kamble, Waseem Alshikh, Ruslan Salakhutdinov
•
Feb 27, 2024
•
26
6
Wenn Skalierung auf LLM-Finetuning trifft: Der Einfluss von Daten, Modell und Finetuning-Methode
When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method
Biao Zhang, Zhongtao Liu, Colin Cherry, Orhan Firat
•
Feb 27, 2024
•
26
3
Trainingsfreie Skalierung von Large Language Models für lange Kontexte
Training-Free Long-Context Scaling of Large Language Models
Chenxin An, Fei Huang, Jun Zhang, Shansan Gong, Xipeng Qiu, Chang Zhou, Lingpeng Kong
•
Feb 27, 2024
•
25
4
DiffuseKronA: Eine parameter-effiziente Feinabstimmungsmethode für personalisierte Diffusionsmodelle
DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Model
Shyam Marjit, Harshit Singh, Nityanand Mathur, Sayak Paul, Chia-Mu Yu, Pin-Yu Chen
•
Feb 27, 2024
•
25
1
Video als neue Sprache für Entscheidungsfindung in der realen Welt
Video as the New Language for Real-World Decision Making
Sherry Yang, Jacob Walker, Jack Parker-Holder, Yilun Du, Jake Bruce, Andre Barreto, Pieter Abbeel, Dale Schuurmans
•
Feb 27, 2024
•
22
1
Bewertung des sehr langfristigen konversationellen Gedächtnisses von LLM-Agenten
Evaluating Very Long-Term Conversational Memory of LLM Agents
Adyasha Maharana, Dong-Ho Lee, Sergey Tulyakov, Mohit Bansal, Francesco Barbieri, Yuwei Fang
•
Feb 27, 2024
•
20
3
Auf dem Weg zum optimalen Lernen von Sprachmodellen
Towards Optimal Learning of Language Models
Yuxian Gu, Li Dong, Yaru Hao, Qingxiu Dong, Minlie Huang, Furu Wei
•
Feb 27, 2024
•
18
1
Sora erzeugt Videos mit beeindruckender geometrischer Konsistenz.
Sora Generates Videos with Stunning Geometrical Consistency
Xuanyi Li, Daquan Zhou, Chenxu Zhang, Shaodong Wei, Qibin Hou, Ming-Ming Cheng
•
Feb 27, 2024
•
18
1
Sehen und Hören: Open-domain Visual-Audio-Generierung mit Diffusions-Latent-Alignern
Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners
Yazhou Xing, Yingqing He, Zeyue Tian, Xintao Wang, Qifeng Chen
•
Feb 27, 2024
•
16
1
Playground v2.5: Drei Erkenntnisse zur Verbesserung der ästhetischen Qualität in der Text-zu-Bild-Generierung
Playground v2.5: Three Insights towards Enhancing Aesthetic Quality in Text-to-Image Generation
Daiqing Li, Aleks Kamko, Ehsan Akhgari, Ali Sabet, Linmiao Xu, Suhail Doshi
•
Feb 27, 2024
•
12
1
Entwirrte 3D-Szenengenerierung mit Layout-Lernen
Disentangled 3D Scene Generation with Layout Learning
Dave Epstein, Ben Poole, Ben Mildenhall, Alexei A. Efros, Aleksander Holynski
•
Feb 26, 2024
•
12
1
VastGaussian: Umfangreiche 3D-Gaußsche Verteilungen für die Rekonstruktion großer Szenen
VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction
Jiaqi Lin, Zhihao Li, Xiao Tang, Jianzhuang Liu, Shiyong Liu, Jiayue Liu, Yangdi Lu, Xiaofei Wu, Songcen Xu, Youliang Yan, Wenming Yang
•
Feb 27, 2024
•
11
45