ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
May 14th, 2024
Was ist wichtig beim Aufbau von Modellen für die Verbindung von Bildern und Sprache?
What matters when building vision-language models?
Hugo Laurençon, Léo Tronchon, Matthieu Cord, Victor Sanh
•
May 3, 2024
•
104
3
RLHF-Ablauf: Von der Belohnungsmodellierung bis zum Online-RLHF
RLHF Workflow: From Reward Modeling to Online RLHF
Hanze Dong, Wei Xiong, Bo Pang, Haoxiang Wang, Han Zhao, Yingbo Zhou, Nan Jiang, Doyen Sahoo, Caiming Xiong, Tong Zhang
•
May 13, 2024
•
71
5
SUTRA: Skalierbare mehrsprachige Sprachmodellarchitektur
SUTRA: Scalable Multilingual Language Model Architecture
Abhijit Bendale, Michael Sapienza, Steven Ripplinger, Simon Gibbs, Jaewon Lee, Pranav Mistry
•
May 7, 2024
•
40
2
SambaNova SN40L: Überwindung der KI-Speichermauer mit Datenfluss und Zusammensetzung von Experten
SambaNova SN40L: Scaling the AI Memory Wall with Dataflow and Composition of Experts
Raghu Prabhakar, Ram Sivaramakrishnan, Darshan Gandhi, Yun Du, Mingran Wang, Xiangyu Song, Kejie Zhang, Tianren Gao, Angela Wang, Karen Li, Yongning Sheng, Joshua Brot, Denis Sokolov, Apurv Vivek, Calvin Leung, Arjun Sabnis, Jiayu Bai, Tuowen Zhao, Mark Gottscho, David Jackson, Mark Luttrell, Manish K. Shah, Edison Chen, Kaizhao Liang, Swayambhoo Jain, Urmish Thakker, Dawei Huang, Sumti Jairath, Kevin J. Brown, Kunle Olukotun
•
May 13, 2024
•
28
0
MS MARCO Web Search: Ein umfangreicher, informationsreicher Web-Datensatz mit Millionen echter Klick-Labels
MS MARCO Web Search: a Large-scale Information-rich Web Dataset with Millions of Real Click Labels
Qi Chen, Xiubo Geng, Corby Rosset, Carolyn Buractaon, Jingwen Lu, Tao Shen, Kun Zhou, Chenyan Xiong, Yeyun Gong, Paul Bennett, Nick Craswell, Xing Xie, Fan Yang, Bryan Tower, Nikhil Rao, Anlei Dong, Wenqi Jiang, Zheng Liu, Mingqin Li, Chuanjie Liu, Zengzhong Li, Rangan Majumder, Jennifer Neville, Andy Oakley, Knut Magne Risvik, Harsha Vardhan Simhadri, Manik Varma, Yujing Wang, Linjun Yang, Mao Yang, Ce Zhang
•
May 13, 2024
•
22
1
Plot2Code: Ein umfassender Maßstab zur Bewertung von multimodalen großen Sprachmodellen bei der Codegenerierung aus wissenschaftlichen Diagrammen.
Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots
Chengyue Wu, Yixiao Ge, Qiushan Guo, Jiahao Wang, Zhixuan Liang, Zeyu Lu, Ying Shan, Ping Luo
•
May 13, 2024
•
21
4
Piccolo2: Allgemeine Texteinbettung mit Training von Multi-Task-Hybridverlusten.
Piccolo2: General Text Embedding with Multi-task Hybrid Loss Training
Junqin Huang, Zhongjie Hu, Zihao Jing, Mengya Gao, Yichao Wu
•
May 11, 2024
•
21
1
LogoMotion: Visuell verankerte Code-Generierung für inhaltsbewusste Animationen
LogoMotion: Visually Grounded Code Generation for Content-Aware Animation
Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
•
May 11, 2024
•
19
2
Große Sprachmodelle als Planungsbereichsgeneratoren
Large Language Models as Planning Domain Generators
James Oswald, Kavitha Srinivas, Harsha Kokel, Junkyu Lee, Michael Katz, Shirin Sohrabi
•
Apr 2, 2024
•
14
2