ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
August 26th, 2024
Aufbau und besseres Verständnis von Bild-Sprach-Modellen: Erkenntnisse und zukünftige Richtungen
Building and better understanding vision-language models: insights and future directions
Hugo Laurençon, Andrés Marafioti, Victor Sanh, Léo Tronchon
•
Aug 22, 2024
•
131
5
CustomCrafter: Anpassbare Videogenerierung mit Erhaltung der Bewegung und Konzeptkompositions-Fähigkeiten
CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities
Tao Wu, Yong Zhang, Xintao Wang, Xianpan Zhou, Guangcong Zheng, Zhongang Qi, Ying Shan, Xi Li
•
Aug 23, 2024
•
12
2
Vertrauensvolle Bearbeitung gewöhnlicher Differentialgleichungen
CODE: Confident Ordinary Differential Editing
Bastien van Delft, Tommaso Martorella, Alexandre Alahi
•
Aug 22, 2024
•
4
2
T3M: Textgesteuerte 3D-Menschbewegungssynthese aus Sprache
T3M: Text Guided 3D Human Motion Synthesis from Speech
Wenshuo Peng, Kaipeng Zhang, Sai Qian Zhang
•
Aug 23, 2024
•
13
2
HiRED: Aufmerksamkeitsgesteuertes Token-Dropping zur effizienten Inferenz von hochauflösenden Vision-Language-Modellen in ressourcenbeschränkten Umgebungen
HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments
Kazi Hasan Ibn Arif, JinYi Yoon, Dimitrios S. Nikolopoulos, Hans Vandierendonck, Deepu John, Bo Ji
•
Aug 20, 2024
•
11
2
Eine webbasierte Lösung für Föderiertes Lernen mit LLM-basierter Automatisierung.
A Web-Based Solution for Federated Learning with LLM-Based Automation
Chamith Mawela, Chaouki Ben Issaid, Mehdi Bennis
•
Aug 23, 2024
•
10
1
MME-RealWorld: Könnte Ihre Multimodale LLM Herausfordernde Hochauflösende Real-World Szenarien Bewältigen, die Schwierig für Menschen sind?
MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans?
Yi-Fan Zhang, Huanyu Zhang, Haochen Tian, Chaoyou Fu, Shuangqing Zhang, Junfei Wu, Feng Li, Kun Wang, Qingsong Wen, Zhang Zhang, Liang Wang, Rong Jin, Tieniu Tan
•
Aug 23, 2024
•
27
4
Die Gradienten von Multi-Layer-Transformern können in nahezu linearer Zeit approximiert werden.
Multi-Layer Transformers Gradient Can be Approximated in Almost Linear Time
Yingyu Liang, Zhizhou Sha, Zhenmei Shi, Zhao Song, Yufa Zhou
•
Aug 23, 2024
•
25
4
LayerPano3D: Geschichtete 3D-Panorama für die Generierung hyperimmersiver Szenen
LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation
Shuai Yang, Jing Tan, Mengchen Zhang, Tong Wu, Yixuan Li, Gordon Wetzstein, Ziwei Liu, Dahua Lin
•
Aug 23, 2024
•
27
2
FLoD: Integration von flexibler Detailebene in die 3D-Gauß-Splatting für anpassbares Rendern
FLoD: Integrating Flexible Level of Detail into 3D Gaussian Splatting for Customizable Rendering
Yunji Seo, Young Sun Choi, Hyun Seung Son, Youngjung Uh
•
Aug 23, 2024
•
6
2
Speichereffizientes Training von LLM mit Online-Subspace-Abstieg
Memory-Efficient LLM Training with Online Subspace Descent
Kaizhao Liang, Bo Liu, Lizhang Chen, Qiang Liu
•
Aug 23, 2024
•
14
3
RoundTable: Nutzung eines dynamischen Schemas und kontextbezogener Autovervollständigung zur Verbesserung der Abfragegenauigkeit in der tabellarischen Fragebeantwortung.
RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering
Pratyush Kumar, Kuber Vijaykumar Bellad, Bharat Vadlamudi, Aman Chadha
•
Aug 22, 2024
•
5
1