ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
July 4th, 2024
InternLM-XComposer-2.5: Ein vielseitiges großes Sprachmodell für Visionen, das lange kontextuelle Eingaben und Ausgaben unterstützt.
InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output
Pan Zhang, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Rui Qian, Lin Chen, Qipeng Guo, Haodong Duan, Bin Wang, Linke Ouyang, Songyang Zhang, Wenwei Zhang, Yining Li, Yang Gao, Peng Sun, Xinyue Zhang, Wei Li, Jingwen Li, Wenhai Wang, Hang Yan, Conghui He, Xingcheng Zhang, Kai Chen, Jifeng Dai, Yu Qiao, Dahua Lin, Jiaqi Wang
•
Jul 3, 2024
•
96
5
TabReD: Ein Benchmark für tabellenbasiertes maschinelles Lernen in freier Wildbahn
TabReD: A Benchmark of Tabular Machine Learning in-the-Wild
Ivan Rubachev, Nikolay Kartashev, Yury Gorishniy, Artem Babenko
•
Jun 27, 2024
•
51
6
Kein Training, kein Problem: Überdenken der Leitung ohne Klassifizierer für Diffusionsmodelle
No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models
Seyedmorteza Sadat, Manuel Kansy, Otmar Hilliges, Romann M. Weber
•
Jul 2, 2024
•
26
1
TokenPacker: Effizienter visueller Projektor für multimodale LLM
TokenPacker: Efficient Visual Projector for Multimodal LLM
Wentong Li, Yuqian Yuan, Jian Liu, Dongqi Tang, Song Wang, Jianke Zhu, Lei Zhang
•
Jul 2, 2024
•
24
4
PicoAudio: Ermöglichen präzise Zeitstempel- und Frequenzsteuerbarkeit von Audioereignissen in der Text-zu-Audio-Erzeugung
PicoAudio: Enabling Precise Timestamp and Frequency Controllability of Audio Events in Text-to-audio Generation
Zeyu Xie, Xuenan Xu, Zhizheng Wu, Mengyue Wu
•
Jul 3, 2024
•
21
5
DisCo-Diff: Verbesserung von kontinuierlichen Diffusionsmodellen mit diskreten Latenten
DisCo-Diff: Enhancing Continuous Diffusion Models with Discrete Latents
Yilun Xu, Gabriele Corso, Tommi Jaakkola, Arash Vahdat, Karsten Kreis
•
Jul 3, 2024
•
14
1
Untersuchung von Decoder-only Großen Sprachmodellen für die Sprache-zu-Text Übersetzung
Investigating Decoder-only Large Language Models for Speech-to-text Translation
Chao-Wei Huang, Hui Lu, Hongyu Gong, Hirofumi Inaguma, Ilia Kulikov, Ruslan Mavlyutov, Sravya Popuri
•
Jul 3, 2024
•
11
1
Eine falsche Sicherheit: Unsicheres Informationsleck in "sicherer" KI-Antworten
A False Sense of Safety: Unsafe Information Leakage in 'Safe' AI Responses
David Glukhov, Ziwen Han, Ilia Shumailov, Vardan Papyan, Nicolas Papernot
•
Jul 2, 2024
•
9
1
Beseitigung der Positionsverzerrung von Sprachmodellen: Ein mechanistischer Ansatz
Eliminating Position Bias of Language Models: A Mechanistic Approach
Ziqi Wang, Hanlin Zhang, Xiner Li, Kuan-Hao Huang, Chi Han, Shuiwang Ji, Sham M. Kakade, Hao Peng, Heng Ji
•
Jul 1, 2024
•
8
1