ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
July 30th, 2024
SaulLM-54B & SaulLM-141B: Skalierung der Domänenanpassung für den Rechtsbereich
SaulLM-54B & SaulLM-141B: Scaling Up Domain Adaptation for the Legal Domain
Pierre Colombo, Telmo Pires, Malik Boudiaf, Rui Melo, Dominic Culver, Sofia Morgado, Etienne Malaboeuf, Gabriel Hautreux, Johanne Charpentier, Michael Desa
•
Jul 28, 2024
•
66
2
Integration von großen Sprachmodellen in eine Tri-Modale Architektur zur automatisierten Klassifizierung von Depressionen.
Integrating Large Language Models into a Tri-Modal Architecture for Automated Depression Classification
Santosh V. Patapati
•
Jul 27, 2024
•
59
9
SeaLLMs 3: Offene Grundlage und Chat Multilinguale Große Sprachmodelle für südostasiatische Sprachen
SeaLLMs 3: Open Foundation and Chat Multilingual Large Language Models for Southeast Asian Languages
Wenxuan Zhang, Hou Pong Chan, Yiran Zhao, Mahani Aljunied, Jianyu Wang, Chaoqun Liu, Yue Deng, Zhiqiang Hu, Weiwen Xu, Yew Ken Chia, Xin Li, Lidong Bing
•
Jul 29, 2024
•
58
6
FreeLong: Training-freie Langvideoerzeugung mit SpectralBlend Temporale Aufmerksamkeit
FreeLong: Training-Free Long Video Generation with SpectralBlend Temporal Attention
Yu Lu, Yuanzhi Liang, Linchao Zhu, Yi Yang
•
Jul 29, 2024
•
52
2
Theia: Destillierung verschiedener Vision-Grundlagenmodelle für das Lernen von Robotern
Theia: Distilling Diverse Vision Foundation Models for Robot Learning
Jinghuan Shang, Karl Schmeckpeper, Brandon B. May, Maria Vittoria Minniti, Tarik Kelestemur, David Watkins, Laura Herlant
•
Jul 29, 2024
•
48
3
MindSearch: Das Nachahmen menschlicher Denkweisen ruft einen tiefgründigen KI-Sucher hervor.
MindSearch: Mimicking Human Minds Elicits Deep AI Searcher
Zehui Chen, Kuikun Liu, Qiuchen Wang, Jiangning Liu, Wenwei Zhang, Kai Chen, Feng Zhao
•
Jul 29, 2024
•
44
4
MMAU: Ein ganzheitlicher Leistungsbenchmark von Agentenfähigkeiten in verschiedenen Bereichen
MMAU: A Holistic Benchmark of Agent Capabilities Across Diverse Domains
Guoli Yin, Haoping Bai, Shuang Ma, Feng Nan, Yanchao Sun, Zhaoyang Xu, Shen Ma, Jiarui Lu, Xiang Kong, Aonan Zhang, Dian Ang Yap, Yizhe zhang, Karsten Ahnert, Vik Kamath, Mathias Berglund, Dominic Walsh, Tobias Gindele, Juergen Wiest, Zhengfeng Lai, Xiaoming Wang, Jiulong Shan, Meng Cao, Ruoming Pang, Zirui Wang
•
Jul 18, 2024
•
41
4
Die Rückkopplung durch Diffusion hilft CLIP, besser zu sehen.
Diffusion Feedback Helps CLIP See Better
Wenxuan Wang, Quan Sun, Fan Zhang, Yepeng Tang, Jing Liu, Xinlong Wang
•
Jul 29, 2024
•
37
2
Mischung von verschachtelten Experten: Adaptive Verarbeitung von visuellen Token
Mixture of Nested Experts: Adaptive Processing of Visual Tokens
Gagan Jain, Nidhi Hegde, Aditya Kusupati, Arsha Nagrani, Shyamal Buch, Prateek Jain, Anurag Arnab, Sujoy Paul
•
Jul 29, 2024
•
37
4
Selbsttraining mit direkter Präferenzoptimierung verbessert das Denken in Gedankengängen.
Self-Training with Direct Preference Optimization Improves Chain-of-Thought Reasoning
Tianduo Wang, Shichen Li, Wei Lu
•
Jul 25, 2024
•
34
4
Cycle3D: Hochwertige und konsistente Bild-zu-3D-Generierung durch Generations-Rekonstruktionszyklus
Cycle3D: High-quality and Consistent Image-to-3D Generation via Generation-Reconstruction Cycle
Zhenyu Tang, Junwu Zhang, Xinhua Cheng, Wangbo Yu, Chaoran Feng, Yatian Pang, Bin Lin, Li Yuan
•
Jul 28, 2024
•
28
2
Visuelle Rätsel: Eine Herausforderung für Alltagsverstand und Weltwissen für große Bild- und Sprachmodelle
Visual Riddles: a Commonsense and World Knowledge Challenge for Large Vision and Language Models
Nitzan Bitton-Guetta, Aviv Slobodkin, Aviya Maimon, Eliya Habba, Royi Rassin, Yonatan Bitton, Idan Szpektor, Amir Globerson, Yuval Elovici
•
Jul 28, 2024
•
23
2
3D Frage-Antwort für das Verständnis städtischer Szenen
3D Question Answering for City Scene Understanding
Penglei Sun, Yaoxian Song, Xiang Liu, Xiaofei Yang, Qiang Wang, Tiefeng Li, Yang Yang, Xiaowen Chu
•
Jul 24, 2024
•
22
5
ATHAR: Ein hochwertiger und vielfältiger Datensatz für die Übersetzung von klassischem Arabisch ins Englische.
ATHAR: A High-Quality and Diverse Dataset for Classical Arabic to English Translation
Mohammed Khalil, Mohammed Sabry
•
Jul 29, 2024
•
21
1
Meta-Belohnende Sprachmodelle: Selbstverbessernde Ausrichtung mit LLM als Meta-Richter
Meta-Rewarding Language Models: Self-Improving Alignment with LLM-as-a-Meta-Judge
Tianhao Wu, Weizhe Yuan, Olga Golovneva, Jing Xu, Yuandong Tian, Jiantao Jiao, Jason Weston, Sainbayar Sukhbaatar
•
Jul 28, 2024
•
21
2
ImagiNet: Ein Multi-Content-Datensatz für generalisierbare synthetische Bilderkennung mittels kontrastivem Lernen
ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning
Delyan Boychev, Radostin Cholakov
•
Jul 29, 2024
•
20
2
Sentimentanalyse von litauischen Online-Bewertungen unter Verwendung großer Sprachmodelle
Sentiment Analysis of Lithuanian Online Reviews Using Large Language Models
Brigita Vileikytė, Mantas Lukoševičius, Lukas Stankevičius
•
Jul 29, 2024
•
12
1
Brücken schlagen: Studioähnliche Avatar-Erstellung aus einer monokularen Handy-Aufnahme
Bridging the Gap: Studio-like Avatar Creation from a Monocular Phone Capture
ShahRukh Athar, Shunsuke Saito, Zhengyu Yang, Stanislav Pidhorsky, Chen Cao
•
Jul 28, 2024
•
12
1
WalkTheDog: Kreuz-Morphologie-Bewegungsausrichtung über Phasen-Mannigfaltigkeiten
WalkTheDog: Cross-Morphology Motion Alignment via Phase Manifolds
Peizhuo Li, Sebastian Starke, Yuting Ye, Olga Sorkine-Hornung
•
Jul 11, 2024
•
12
2
VolDoGer: LLM-unterstützte Datensätze für die Domänengeneralisierung in Vision-Language-Aufgaben
VolDoGer: LLM-assisted Datasets for Domain Generalization in Vision-Language Tasks
Juhwan Choi, Junehyoung Kwon, JungMin Yun, Seunguk Yu, YoungBin Kim
•
Jul 29, 2024
•
11
3
TAPTRv2: Aufmerksamkeitsbasiertes Positionsupdate verbessert das Tracking beliebiger Punkte
TAPTRv2: Attention-based Position Update Improves Tracking Any Point
Hongyang Li, Hao Zhang, Shilong Liu, Zhaoyang Zeng, Feng Li, Tianhe Ren, Bohan Li, Lei Zhang
•
Jul 23, 2024
•
11
4