ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
December 30th, 2024
Von Elementen zum Design: Ein geschichteter Ansatz für automatisches Grafikdesign Komposition
From Elements to Design: A Layered Approach for Automatic Graphic Design Composition
Jiawei Lin, Shizhao Sun, Danqing Huang, Ting Liu, Ji Li, Jiang Bian
•
Dec 27, 2024
•
15
2
VideoMaker: Nullschuss-Angepasste Videogenerierung mit der innewohnenden Kraft von Videodiffusionsmodellen
VideoMaker: Zero-shot Customized Video Generation with the Inherent Force of Video Diffusion Models
Tao Wu, Yong Zhang, Xiaodong Cun, Zhongang Qi, Junfu Pu, Huanzhang Dou, Guangcong Zheng, Ying Shan, Xi Li
•
Dec 27, 2024
•
13
2
SBS-Figure: Vor-Training Abbildungs-Frage-Antwort von Etappe-zu-Etappe synthetisierten Bildern
SBS Figures: Pre-training Figure QA from Stage-by-Stage Synthesized Images
Risa Shinoda, Kuniaki Saito, Shohei Tanaka, Tosho Hirasawa, Yoshitaka Ushiku
•
Dec 23, 2024
•
5
2
Orient Anything: Robuste Objektorientierungsschätzung aus dem Lernen von gerenderten 3D-Modellen
Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models
Zehan Wang, Ziang Zhang, Tianyu Pang, Chao Du, Hengshuang Zhao, Zhou Zhao
•
Dec 24, 2024
•
21
4
CypherBench: Auf dem Weg zur präzisen Abfrage über vollständige moderne Wissensgraphen im LLM-Zeitalter
CypherBench: Towards Precise Retrieval over Full-scale Modern Knowledge Graphs in the LLM Era
Yanlin Feng, Simone Papicchio, Sajjadur Rahman
•
Dec 24, 2024
•
7
2
HuatuoGPT-o1, Auf dem Weg zu medizinischem komplexem Schlussfolgern mit LLMs
HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs
Junying Chen, Zhenyang Cai, Ke Ji, Xidong Wang, Wanlong Liu, Rongsheng Wang, Jianye Hou, Benyou Wang
•
Dec 25, 2024
•
102
6
Die Überlagerung von Diffusionsmodellen unter Verwendung des Itô-Dichteschätzers.
The Superposition of Diffusion Models Using the Itô Density Estimator
Marta Skreta, Lazar Atanackovic, Avishek Joey Bose, Alexander Tong, Kirill Neklyudov
•
Dec 23, 2024
•
13
2
1,58-Bit FLUX
1.58-bit FLUX
Chenglin Yang, Celong Liu, Xueqing Deng, Dongwon Kim, Xing Mei, Xiaohui Shen, Liang-Chieh Chen
•
Dec 24, 2024
•
84
6
Aufgabenpräferenzoptimierung: Verbesserung von multimodalen großen Sprachmodellen mit Vision Task Alignment
Task Preference Optimization: Improving Multimodal Large Language Models with Vision Task Alignment
Ziang Yan, Zhilin Li, Yinan He, Chenting Wang, Kunchang Li, Xinhao Li, Xiangyu Zeng, Zilei Wang, Yali Wang, Yu Qiao, Limin Wang, Yi Wang
•
Dec 26, 2024
•
18
2
Schützen Sie feinabgestimmte LLMs durch das Zusammenführen von Modellen vor und nach dem Feintuning.
Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging
Hua Farn, Hsuan Su, Shachi H Kumar, Saurav Sahay, Shang-Tse Chen, Hung-yi Lee
•
Dec 27, 2024
•
8
2
Vorhersage des nächsten Tokens hin zu multimodaler Intelligenz: Eine umfassende Übersicht
Next Token Prediction Towards Multimodal Intelligence: A Comprehensive Survey
Liang Chen, Zekun Wang, Shuhuai Ren, Lei Li, Haozhe Zhao, Yunshui Li, Zefan Cai, Hongcheng Guo, Lei Zhang, Yizhe Xiong, Yichi Zhang, Ruoyu Wu, Qingxiu Dong, Ge Zhang, Jian Yang, Lingwei Meng, Shujie Hu, Yulong Chen, Junyang Lin, Shuai Bai, Andreas Vlachos, Xu Tan, Minjia Zhang, Wen Xiao, Aaron Yee, Tianyu Liu, Baobao Chang
•
Dec 16, 2024
•
58
2