ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
September 11th, 2024
LLaMA-Omni: Nahtlose Sprachinteraktion mit großen Sprachmodellen
LLaMA-Omni: Seamless Speech Interaction with Large Language Models
Qingkai Fang, Shoutao Guo, Yan Zhou, Zhengrui Ma, Shaolei Zhang, Yang Feng
•
Sep 10, 2024
•
58
5
GroUSE: Ein Benchmark zur Bewertung von Evaluatoren im Kontextbasierten Frage-Antworten.
GroUSE: A Benchmark to Evaluate Evaluators in Grounded Question Answering
Sacha Muller, António Loison, Bilel Omrani, Gautier Viaud
•
Sep 10, 2024
•
38
2
INTRA: Interaktionsbeziehungsorientierte schwach überwachte Affordanz-Verankerung
INTRA: Interaction Relationship-aware Weakly Supervised Affordance Grounding
Ji Ha Jang, Hoigi Seo, Se Young Chun
•
Sep 10, 2024
•
27
2
SongCreator: Textbasierte universelle Songgenerierung
SongCreator: Lyrics-based Universal Song Generation
Shun Lei, Yixuan Zhou, Boshi Tang, Max W. Y. Lam, Feng Liu, Hangyu Liu, Jingcheng Wu, Shiyin Kang, Zhiyong Wu, Helen Meng
•
Sep 9, 2024
•
23
2
Skizzieren einer Audio: Nutzung von Multi-Anweisungen für die Synthese von Video zu Audio
Draw an Audio: Leveraging Multi-Instruction for Video-to-Audio Synthesis
Qi Yang, Binjie Mao, Zili Wang, Xing Nie, Pengfei Gao, Ying Guo, Cheng Zhen, Pengfei Yan, Shiming Xiang
•
Sep 10, 2024
•
16
2
SaRA: Hoch effizientes Diffusionsmodell Feinabstimmung mit progressiver dünnbesetzter Niederrang-Anpassung.
SaRA: High-Efficient Diffusion Model Fine-tuning with Progressive Sparse Low-Rank Adaptation
Teng Hu, Jiangning Zhang, Ran Yi, Hongrui Huang, Yabiao Wang, Lizhuang Ma
•
Sep 10, 2024
•
15
2
LEIA: Latente ansichtsinvariante Einbettungen für implizite 3D-Gliederung
LEIA: Latent View-invariant Embeddings for Implicit 3D Articulation
Archana Swaminathan, Anubhav Gupta, Kamal Gupta, Shishira R. Maiya, Vatsal Agarwal, Abhinav Shrivastava
•
Sep 10, 2024
•
3
2