ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
June 25th, 2024
Cambrian-1: Eine vollständig offene, visionäre Erforschung multimodaler LLMs.
Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs
Shengbang Tong, Ellis Brown, Penghao Wu, Sanghyun Woo, Manoj Middepogu, Sai Charitha Akula, Jihan Yang, Shusheng Yang, Adithya Iyer, Xichen Pan, Austin Wang, Rob Fergus, Yann LeCun, Saining Xie
•
Jun 24, 2024
•
61
4
DreamBench++: Ein an den Menschen ausgerichteter Benchmark für personalisierte Bildgenerierung
DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation
Yuang Peng, Yuxin Cui, Haomiao Tang, Zekun Qi, Runpei Dong, Jing Bai, Chunrui Han, Zheng Ge, Xiangyu Zhang, Shu-Tao Xia
•
Jun 24, 2024
•
57
4
BigCodeBench: Benchmarking der Codegenerierung mit vielfältigen Funktionsaufrufen und komplexen Anweisungen
BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions
Terry Yue Zhuo, Minh Chien Vu, Jenny Chim, Han Hu, Wenhao Yu, Ratnadira Widyasari, Imam Nur Bani Yusuf, Haolan Zhan, Junda He, Indraneil Paul, Simon Brunner, Chen Gong, Thong Hoang, Armel Randy Zebaze, Xiaoheng Hong, Wen-Ding Li, Jean Kaddour, Ming Xu, Zhihan Zhang, Prateek Yadav, Naman Jain, Alex Gu, Zhoujun Cheng, Jiawei Liu, Qian Liu, Zijian Wang, David Lo, Binyuan Hui, Niklas Muennighoff, Daniel Fried, Xiaoning Du, Harm de Vries, Leandro Von Werra
•
Jun 22, 2024
•
47
8
Bewertung von D-MERIT der teilweisen Annotation bei der Informationssuche
Evaluating D-MERIT of Partial-annotation on Information Retrieval
Royi Rassin, Yaron Fairstein, Oren Kalinsky, Guy Kushilevitz, Nachshon Cohen, Alexander Libov, Yoav Goldberg
•
Jun 23, 2024
•
36
2
Langzeitübertragung von Kontext von Sprache zu Vision
Long Context Transfer from Language to Vision
Peiyuan Zhang, Kaichen Zhang, Bo Li, Guangtao Zeng, Jingkang Yang, Yuanhan Zhang, Ziyue Wang, Haoran Tan, Chunyuan Li, Ziwei Liu
•
Jun 24, 2024
•
34
2
Video-Infinity: Verteilte Langvideoerstellung
Video-Infinity: Distributed Long Video Generation
Zhenxiong Tan, Xingyi Yang, Songhua Liu, Xinchao Wang
•
Jun 24, 2024
•
30
2
VideoHalluzinationen: Evaluierung intrinsischer und extrinsischer Halluzinationen in großen Video-Sprachmodellen
VideoHallucer: Evaluating Intrinsic and Extrinsic Hallucinations in Large Video-Language Models
Yuxuan Wang, Yueqian Wang, Dongyan Zhao, Cihang Xie, Zilong Zheng
•
Jun 24, 2024
•
27
2
WARP: Über die Vorteile von gewichteten durchschnittlichen belohnten Richtlinien
WARP: On the Benefits of Weight Averaged Rewarded Policies
Alexandre Ramé, Johan Ferret, Nino Vieillard, Robert Dadashi, Léonard Hussenot, Pierre-Louis Cedoz, Pier Giuseppe Sessa, Sertan Girgin, Arthur Douillard, Olivier Bachem
•
Jun 24, 2024
•
23
1
Skalierungsgesetze für Sprachmodelle mit linearer Komplexität
Scaling Laws for Linear Complexity Language Models
Xuyang Shen, Dong Li, Ruitao Leng, Zhen Qin, Weigao Sun, Yiran Zhong
•
Jun 24, 2024
•
23
4
Richtung schneller mehrsprachiger LLM-Inferenz: Spekulatives Decodieren und spezialisierte Entwürfe
Towards Fast Multilingual LLM Inference: Speculative Decoding and Specialized Drafters
Euiin Yi, Taehyeon Kim, Hongseok Jeung, Du-Seong Chang, Se-Young Yun
•
Jun 24, 2024
•
20
3
Effizientes kontinuierliches Vortraining durch Reduzierung des Stabilitätsunterschieds.
Efficient Continual Pre-training by Mitigating the Stability Gap
Yiduo Guo, Jie Fu, Huishuai Zhang, Dongyan Zhao, Yikang Shen
•
Jun 21, 2024
•
20
1
Sparser ist schneller und weniger ist mehr: Effiziente spärliche Aufmerksamkeit für weitreichende Transformer
Sparser is Faster and Less is More: Efficient Sparse Attention for Long-Range Transformers
Chao Lou, Zixia Jia, Zilong Zheng, Kewei Tu
•
Jun 24, 2024
•
19
1
Semantische Entropie-Sonden: Robuste und kostengünstige Halluzinationserkennung in LLMs
Semantic Entropy Probes: Robust and Cheap Hallucination Detection in LLMs
Jannik Kossen, Jiatong Han, Muhammed Razzak, Lisa Schut, Shreshth Malik, Yarin Gal
•
Jun 22, 2024
•
14
1
Jenseits des rundenbasierten Spiels: Ermöglichen von Echtzeitgesprächen mit Duplex-Modellen
Beyond the Turn-Based Game: Enabling Real-Time Conversations with Duplex Models
Xinrong Zhang, Yingfa Chen, Shengding Hu, Xu Han, Zihang Xu, Yuanwei Xu, Weilin Zhao, Maosong Sun, Zhiyuan Liu
•
Jun 22, 2024
•
14
2
Präferenzabstimmung zur Minderung von Toxizität generalisiert über Sprachen hinweg.
Preference Tuning For Toxicity Mitigation Generalizes Across Languages
Xiaochen Li, Zheng-Xin Yong, Stephen H. Bach
•
Jun 23, 2024
•
11
1
Automatische Erkennung: Auf dem Weg zu einem einheitlichen Rahmen für die automatisierte Schwachstellenentdeckung in großen Sprachmodellen
AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models
Jiale Cheng, Yida Lu, Xiaotao Gu, Pei Ke, Xiao Liu, Yuxiao Dong, Hongning Wang, Jie Tang, Minlie Huang
•
Jun 24, 2024
•
10
2
Vertrauensregulierungsneuronen in Sprachmodellen
Confidence Regulation Neurons in Language Models
Alessandro Stolfo, Ben Wu, Wes Gurnee, Yonatan Belinkov, Xingyi Song, Mrinmaya Sachan, Neel Nanda
•
Jun 24, 2024
•
10
1
Wie viele Parameter benötigt es, um eine Glühbirne zu wechseln? Bewertung der Leistung im Selbstspiel von Konversationspielen in Abhängigkeit von den Modellcharakteristika.
How Many Parameters Does it Take to Change a Light Bulb? Evaluating Performance in Self-Play of Conversational Games as a Function of Model Characteristics
Nidhir Bhavsar, Jonathan Jordan, Sherzod Hakimov, David Schlangen
•
Jun 20, 2024
•
9
1
KleidTraum: Textgesteuerte Kleidungserzeugung mit 3D-Gaußschen.
ClotheDreamer: Text-Guided Garment Generation with 3D Gaussians
Yufei Liu, Junshu Tang, Chu Zheng, Shijie Zhang, Jinkun Hao, Junwei Zhu, Dongjin Huang
•
Jun 24, 2024
•
7
1
In der Mitte gefunden: Die Kalibrierung des Positionsaufmerksamkeitsfehlers verbessert die Nutzung von langem Kontext.
Found in the Middle: Calibrating Positional Attention Bias Improves Long Context Utilization
Cheng-Yu Hsieh, Yung-Sung Chuang, Chun-Liang Li, Zifeng Wang, Long T. Le, Abhishek Kumar, James Glass, Alexander Ratner, Chen-Yu Lee, Ranjay Krishna, Tomas Pfister
•
Jun 23, 2024
•
6
1
IRASim: Lernen interaktiver Echtroboter-Aktionssimulatoren
IRASim: Learning Interactive Real-Robot Action Simulators
Fangqi Zhu, Hongtao Wu, Song Guo, Yuxiao Liu, Chilam Cheang, Tao Kong
•
Jun 20, 2024
•
6
1
video-SALMONN: Sprachverbesserte Audio-Visuelle Große Sprachmodelle
video-SALMONN: Speech-Enhanced Audio-Visual Large Language Models
Guangzhi Sun, Wenyi Yu, Changli Tang, Xianzhao Chen, Tian Tan, Wei Li, Lu Lu, Zejun Ma, Yuxuan Wang, Chao Zhang
•
Jun 22, 2024
•
5
1
Kann Few-shot in einem langen Kontext funktionieren? Das Wiederverwenden des Kontexts zur Generierung von Demonstrationen
Can Few-shot Work in Long-Context? Recycling the Context to Generate Demonstrations
Arie Cattan, Alon Jacovi, Alex Fabrikant, Jonathan Herzig, Roee Aharoni, Hannah Rashkin, Dror Marcus, Avinatan Hassidim, Yossi Matias, Idan Szpektor, Avi Caciularu
•
Jun 19, 2024
•
5
1
Abstoßungswert-Destillation zur vielfältigen Stichprobenahme von Diffusionsmodellen
Repulsive Score Distillation for Diverse Sampling of Diffusion Models
Nicolas Zilberstein, Morteza Mardani, Santiago Segarra
•
Jun 24, 2024
•
4
2
OlympicArena Medaillenrangliste: Wer ist bisher die intelligenteste KI?
OlympicArena Medal Ranks: Who Is the Most Intelligent AI So Far?
Zhen Huang, Zengzhi Wang, Shijie Xia, Pengfei Liu
•
Jun 24, 2024
•
2
2