ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
August 12th, 2024
VITA: Auf dem Weg zu einem Open-Source Interaktiven Omni Multimodalen LLM
VITA: Towards Open-Source Interactive Omni Multimodal LLM
Chaoyou Fu, Haojia Lin, Zuwei Long, Yunhang Shen, Meng Zhao, Yifan Zhang, Xiong Wang, Di Yin, Long Ma, Xiawu Zheng, Ran He, Rongrong Ji, Yunsheng Wu, Caifeng Shan, Xing Sun
•
Aug 9, 2024
•
49
3
Gemma Scope: Öffnen Sie Sparse Autoencoders überall gleichzeitig auf Gemma 2.
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2
Tom Lieberum, Senthooran Rajamanoharan, Arthur Conmy, Lewis Smith, Nicolas Sonnerat, Vikrant Varma, János Kramár, Anca Dragan, Rohin Shah, Neel Nanda
•
Aug 9, 2024
•
40
2
mPLUG-Owl3: Auf dem Weg zum Verständnis langer Bildsequenzen in multimodalen großen Sprachmodellen
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models
Jiabo Ye, Haiyang Xu, Haowei Liu, Anwen Hu, Ming Yan, Qi Qian, Ji Zhang, Fei Huang, Jingren Zhou
•
Aug 9, 2024
•
35
2
UniBench: Visuelles Schlussfolgern erfordert ein Umdenken von Vision-Sprache jenseits der Skalierung.
UniBench: Visual Reasoning Requires Rethinking Vision-Language Beyond Scaling
Haider Al-Tahan, Quentin Garrido, Randall Balestriero, Diane Bouchacourt, Caner Hazirbas, Mark Ibrahim
•
Aug 9, 2024
•
25
2
ToolSandbox: Ein zustandsbehafteter, konversationsfähiger, interaktiver Evaluierungsbenchmark für die Fähigkeiten von LLM-Tools.
ToolSandbox: A Stateful, Conversational, Interactive Evaluation Benchmark for LLM Tool Use Capabilities
Jiarui Lu, Thomas Holleis, Yizhe Zhang, Bernhard Aumayer, Feng Nan, Felix Bai, Shuang Ma, Shen Ma, Mengyu Li, Guoli Yin, Zirui Wang, Ruoming Pang
•
Aug 8, 2024
•
18
4
Kalman-inspirierte Merkmalsausbreitung für die Superauflösung von Gesichtern in Videos.
Kalman-Inspired Feature Propagation for Video Face Super-Resolution
Ruicheng Feng, Chongyi Li, Chen Change Loy
•
Aug 9, 2024
•
10
3
BRAT: Bonus oRthogonales Token für Architekturagnostische Textumkehr
BRAT: Bonus oRthogonAl Token for Architecture Agnostic Textual Inversion
James Baker
•
Aug 8, 2024
•
9
2
MooER: LLM-basierte Spracherkennungs- und Übersetzungsmodelle von Moore Threads
MooER: LLM-based Speech Recognition and Translation Models from Moore Threads
Junhao Xu, Zhenlin Liang, Yi Liu, Yichao Hu, Jian Li, Yajun Zheng, Meng Cai, Hua Wang
•
Aug 9, 2024
•
8
2
MulliVC: Mehrsprachige Sprachkonvertierung mit Zykluskonsistenz
MulliVC: Multi-lingual Voice Conversion With Cycle Consistency
Jiawei Huang, Chen Zhang, Yi Ren, Ziyue Jiang, Zhenhui Ye, Jinglin Liu, Jinzheng He, Xiang Yin, Zhou Zhao
•
Aug 8, 2024
•
8
2
Generierung neuer experimenteller Hypothesen aus Sprachmodellen: Eine Fallstudie zur Kreuzdativverallgemeinerung
Generating novel experimental hypotheses from language models: A case study on cross-dative generalization
Kanishka Misra, Najoung Kim
•
Aug 9, 2024
•
6
1