ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
August 27th, 2024
LLaVaOLMoBitnet1B: Ternäres LLM wird multimodal!
LLaVaOLMoBitnet1B: Ternary LLM goes Multimodal!
Jainaveen Sundaram, Ravishankar Iyer
•
Aug 23, 2024
•
18
2
SwiftBrush v2: Machen Sie Ihr Ein-Schritt-Diffusionsmodell besser als seinen Lehrer
SwiftBrush v2: Make Your One-step Diffusion Model Better Than Its Teacher
Trung Dao, Thuan Hoang Nguyen, Thanh Le, Duc Vu, Khoi Nguyen, Cuong Pham, Anh Tran
•
Aug 26, 2024
•
63
6
K-Sort Arena: Effizientes und zuverlässiges Benchmarking für generative Modelle über K-weise menschliche Präferenzen
K-Sort Arena: Efficient and Reliable Benchmarking for Generative Models via K-wise Human Preferences
Zhikai Li, Xuewen Liu, Dongrong Fu, Jianquan Li, Qingyi Gu, Kurt Keutzer, Zhen Dong
•
Aug 26, 2024
•
37
3
Grundmodelle für Musik: Eine Übersicht
Foundation Models for Music: A Survey
Yinghao Ma, Anders Øland, Anton Ragni, Bleiz MacSen Del Sette, Charalampos Saitis, Chris Donahue, Chenghua Lin, Christos Plachouras, Emmanouil Benetos, Elio Quinton, Elona Shatri, Fabio Morreale, Ge Zhang, György Fazekas, Gus Xia, Huan Zhang, Ilaria Manco, Jiawen Huang, Julien Guinot, Liwei Lin, Luca Marinelli, Max W. Y. Lam, Megha Sharma, Qiuqiang Kong, Roger B. Dannenberg, Ruibin Yuan, Shangda Wu, Shih-Lun Wu, Shuqi Dai, Shun Lei, Shiyin Kang, Simon Dixon, Wenhu Chen, Wehhao Huang, Xingjian Du, Xingwei Qu, Xu Tan, Yizhi Li, Zeyue Tian, Zhiyong Wu, Zhizheng Wu, Ziyang Ma, Ziyu Wang
•
Aug 26, 2024
•
45
2
LlamaDuo: LLMOps-Pipeline für nahtlose Migration von Service-LLMs zu kleinskaligen lokalen LLMs
LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs
Chansung Park, Juyong Jiang, Fan Wang, Sayak Paul, Jing Tang, Sunghun Kim
•
Aug 24, 2024
•
26
3
NanoFlow: Auf dem Weg zu optimaler Durchsatzleistung bei der Bereitstellung großer Sprachmodelle
NanoFlow: Towards Optimal Large Language Model Serving Throughput
Kan Zhu, Yilong Zhao, Liangyu Zhao, Gefei Zuo, Yile Gu, Dedong Xie, Yufei Gao, Qinyu Xu, Tian Tang, Zihao Ye, Keisuke Kamahori, Chien-Yu Lin, Stephanie Wang, Arvind Krishnamurthy, Baris Kasikci
•
Aug 22, 2024
•
18
2
Lernen, sich wie professionelle Counter-Strike-Spieler zu bewegen.
Learning to Move Like Professional Counter-Strike Players
David Durst, Feng Xie, Vishnu Sarukkai, Brennan Shacklett, Iuri Frosio, Chen Tessler, Joohwan Kim, Carly Taylor, Gilbert Bernstein, Sanjiban Choudhury, Pat Hanrahan, Kayvon Fatahalian
•
Aug 25, 2024
•
24
3
Leistungsplaner: Ein Lernratenplaner unabhängig von Stapelgröße und Tokenanzahl
Power Scheduler: A Batch Size and Token Number Agnostic Learning Rate Scheduler
Yikang Shen, Matthew Stallone, Mayank Mishra, Gaoyuan Zhang, Shawn Tan, Aditya Prasad, Adriana Meza Soria, David D. Cox, Rameswar Panda
•
Aug 23, 2024
•
25
4
Effiziente Erkennung von giftigen Eingaben in großen Sprachmodellen
Efficient Detection of Toxic Prompts in Large Language Models
Yi Liu, Junzhe Yu, Huijia Sun, Ling Shi, Gelei Deng, Yuqi Chen, Yang Liu
•
Aug 21, 2024
•
13
4
TVG: Eine trainingsfreie Methode zur Generierung von Übergangsvideos mit Diffusionsmodellen
TVG: A Training-free Transition Video Generation Method with Diffusion Models
Rui Zhang, Yaosen Chen, Yuegen Liu, Wei Wang, Xuming Wen, Hongxia Wang
•
Aug 24, 2024
•
14
2
SWE-Bench-Java: Ein GitHub-Problembehandlungs-Benchmark für Java
SWE-bench-java: A GitHub Issue Resolving Benchmark for Java
Daoguang Zan, Zhirong Huang, Ailun Yu, Shaoxin Lin, Yifan Shi, Wei Liu, Dong Chen, Zongshuai Qi, Hao Yu, Lei Yu, Dezhi Ran, Muhan Zeng, Bo Shen, Pan Bian, Guangtai Liang, Bei Guan, Pengjie Huang, Tao Xie, Yongji Wang, Qianxiang Wang
•
Aug 26, 2024
•
42
2
MagicMan: Generative Novelansichtssynthese von Menschen mit 3D-bewusster Diffusion und iterativer Verfeinerung
MagicMan: Generative Novel View Synthesis of Humans with 3D-Aware Diffusion and Iterative Refinement
Xu He, Xiaoyu Li, Di Kang, Jiangnan Ye, Chaopeng Zhang, Liyang Chen, Xiangjun Gao, Han Zhang, Zhiyong Wu, Haolin Zhuang
•
Aug 26, 2024
•
11
2
Training-freie Langvideo-Generierung mit der Diffusionsmodellkette Experten
Training-free Long Video Generation with Chain of Diffusion Model Experts
Wenhao Li, Yichao Cao, Xie Su, Xi Lin, Shan You, Mingkai Zheng, Yi Chen, Chang Xu
•
Aug 24, 2024
•
24
2
MobileQuant: Mobile-freundliche Quantisierung für On-Device Sprachmodelle
MobileQuant: Mobile-friendly Quantization for On-device Language Models
Fuwen Tan, Royson Lee, Łukasz Dudziak, Shell Xu Hu, Sourav Bhattacharya, Timothy Hospedales, Georgios Tzimiropoulos, Brais Martinez
•
Aug 25, 2024
•
15
2