ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
March 6th, 2024
Natürliche Sprache 3: Zero-Shot Sprachsynthese mit faktorisiertem Codec und Diffusionsmodellen
NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models
Zeqian Ju, Yuancheng Wang, Kai Shen, Xu Tan, Detai Xin, Dongchao Yang, Yanqing Liu, Yichong Leng, Kaitao Song, Siliang Tang, Zhizheng Wu, Tao Qin, Xiang-Yang Li, Wei Ye, Shikun Zhang, Jiang Bian, Lei He, Jinyu Li, Sheng Zhao
•
Mar 5, 2024
•
38
3
Feinabgestimmte multimodale Sprachmodelle sind hochwertige Bild-Text-Datenfilter.
Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters
Weizhi Wang, Khalil Mrini, Linjie Yang, Sateesh Kumar, Yu Tian, Xifeng Yan, Heng Wang
•
Mar 5, 2024
•
18
1
MathScale: Skalierung der Anpassung von Anweisungen für mathematisches Denken
MathScale: Scaling Instruction Tuning for Mathematical Reasoning
Zhengyang Tang, Xingxing Zhang, Benyou Wan, Furu Wei
•
Mar 5, 2024
•
17
2
Wukong: Auf dem Weg zu einem Skalierungsgesetz für Empfehlungssysteme im großen Maßstab
Wukong: Towards a Scaling Law for Large-Scale Recommendation
Buyun Zhang, Liang Luo, Yuxin Chen, Jade Nie, Xi Liu, Daifeng Guo, Yanli Zhao, Shen Li, Yuchen Hao, Yantao Yao, Guna Lakshminarayanan, Ellie Dingqiao Wen, Jongsoo Park, Maxim Naumov, Wenlin Chen
•
Mar 4, 2024
•
17
1
MAGID: Eine automatisierte Pipeline zur Erzeugung synthetischer multimodaler Datensätze
MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets
Hossein Aboutalebi, Hwanjun Song, Yusheng Xie, Arshit Gupta, Justin Sun, Hang Su, Igor Shalyminov, Nikolaos Pappas, Siffi Singh, Saab Mansour
•
Mar 5, 2024
•
15
1
EasyQuant: Ein effizienter datenfreier Quantisierungsalgorithmus für LLMs
EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs
Hanlin Tang, Yifu Sun, Decheng Wu, Kai Liu, Jianchen Zhu, Zhanhui Kang
•
Mar 5, 2024
•
13
3
Erfreuen Sie sich: Mischungs-aufgelöste Anpassung für multimodale große Sprachmodelle
Feast Your Eyes: Mixture-of-Resolution Adaptation for Multimodal Large Language Models
Gen Luo, Yiyi Zhou, Yuxin Zhang, Xiawu Zheng, Xiaoshuai Sun, Rongrong Ji
•
Mar 5, 2024
•
11
1
Modellierungskollaborator: Ermöglichen der subjektiven Bildklassifizierung mit minimalem menschlichem Aufwand über die Verwendung des LLM-Tools
Modeling Collaborator: Enabling Subjective Vision Classification With Minimal Human Effort via LLM Tool-Use
Imad Eddine Toubal, Aditya Avinash, Neil Gordon Alldrin, Jan Dlabal, Wenlei Zhou, Enming Luo, Otilia Stretcu, Hao Xiong, Chun-Ta Lu, Howard Zhou, Ranjay Krishna, Ariel Fuxman, Tom Duerig
•
Mar 5, 2024
•
11
1
RT-Sketch: Zielkonditioniertes Imitationslernen von handgezeichneten Skizzen
RT-Sketch: Goal-Conditioned Imitation Learning from Hand-Drawn Sketches
Priya Sundaresan, Quan Vuong, Jiayuan Gu, Peng Xu, Ted Xiao, Sean Kirmani, Tianhe Yu, Michael Stark, Ajinkya Jain, Karol Hausman, Dorsa Sadigh, Jeannette Bohg, Stefan Schaal
•
Mar 5, 2024
•
9
1
MagicClay: Modellieren von Meshes mit generativen neuronalen Feldern
MagicClay: Sculpting Meshes With Generative Neural Fields
Amir Barda, Vladimir G. Kim, Noam Aigerman, Amit H. Bermano, Thibault Groueix
•
Mar 4, 2024
•
8
1