ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
October 1st, 2024
Können Modelle Fähigkeiten aus Beispielen erlernen?
Can Models Learn Skill Composition from Examples?
Haoyu Zhao, Simran Kaur, Dingli Yu, Anirudh Goyal, Sanjeev Arora
•
Sep 29, 2024
•
10
2
Bildkopieerkennung für Diffusionsmodelle
Image Copy Detection for Diffusion Models
Wenhao Wang, Yifan Sun, Zhentao Tan, Yi Yang
•
Sep 30, 2024
•
14
3
Skalierung des Propriozeptiv-Visuellen Lernens mit heterogenen vortrainierten Transformatoren
Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers
Lirui Wang, Xinlei Chen, Jialiang Zhao, Kaiming He
•
Sep 30, 2024
•
14
2
UniAff: Eine einheitliche Darstellung von Handlungsmöglichkeiten für die Nutzung von Werkzeugen und Artikulation mit Vision-Sprach-Modellen
UniAff: A Unified Representation of Affordances for Tool Usage and Articulation with Vision-Language Models
Qiaojun Yu, Siyuan Huang, Xibin Yuan, Zhengkai Jiang, Ce Hao, Xin Li, Haonan Chang, Junbo Wang, Liu Liu, Hongsheng Li, Peng Gao, Cewu Lu
•
Sep 30, 2024
•
15
4
Hyper-Verbindungen
Hyper-Connections
Defa Zhu, Hongzhi Huang, Zihao Huang, Yutao Zeng, Yunyao Mao, Banggu Wu, Qiyang Min, Xun Zhou
•
Sep 29, 2024
•
23
4
DiaSynth -- Framework zur synthetischen Dialoggenerierung
DiaSynth -- Synthetic Dialogue Generation Framework
Sathya Krishnan Suresh, Wu Mengjun, Tushar Pranav, Eng Siong Chng
•
Sep 25, 2024
•
21
3
IDEAW: Robustes neuronales Audio-Wasserzeichen mit invertierbarer Dual-Einbettung
IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding
Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
•
Sep 29, 2024
•
2
2
Richtlinie: Eine modellagnostische Methode zur Steuerung der generierten Länge für große Sprachmodelle
Ruler: A Model-Agnostic Method to Control Generated Length for Large Language Models
Jiaming Li, Lei Zhang, Yunshui Li, Ziqiang Liu, yuelin bai, Run Luo, Longze Chen, Min Yang
•
Sep 27, 2024
•
30
2
Visuelle Fragezerlegung auf multimodalen großen Sprachmodellen
Visual Question Decomposition on Multimodal Large Language Models
Haowei Zhang, Jianzhe Liu, Zhen Han, Shuo Chen, Bailan He, Volker Tresp, Zhiqiang Xu, Jindong Gu
•
Sep 28, 2024
•
9
2
Abschnitt 1.5: Methoden, Analyse & Erkenntnisse aus dem Feinabstimmung von Multimodalen LLM
MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuning
Haotian Zhang, Mingfei Gao, Zhe Gan, Philipp Dufter, Nina Wenzel, Forrest Huang, Dhruti Shah, Xianzhi Du, Bowen Zhang, Yanghao Li, Sam Dodge, Keen You, Zhen Yang, Aleksei Timofeev, Mingze Xu, Hong-You Chen, Jean-Philippe Fauconnier, Zhengfeng Lai, Haoxuan You, Zirui Wang, Afshin Dehghan, Peter Grasch, Yinfei Yang
•
Sep 30, 2024
•
57
3
Coffee-Gym: Eine Umgebung zur Bewertung und Verbesserung von natürlich-sprachlichem Feedback zu fehlerhaftem Code.
Coffee-Gym: An Environment for Evaluating and Improving Natural Language Feedback on Erroneous Code
Hyungjoo Chae, Taeyoon Kwon, Seungjun Moon, Yongho Song, Dongjin Kang, Kai Tzu-iunn Ong, Beong-woo Kwak, Seonghyeon Bae, Seung-won Hwang, Jinyoung Yeo
•
Sep 29, 2024
•
10
3
Achtung: Lineare Transformer mit Cosinus-Aufmerksamkeit
Cottention: Linear Transformers With Cosine Attention
Gabriel Mongaras, Trevor Dohm, Eric C. Larson
•
Sep 27, 2024
•
17
5