ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
arXiv
HuggingFace
Preise
Konto
Arbeitsbereich
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
June 21st, 2024
nabla^2DFT: Ein universeller Datensatz für quantenchemische Untersuchungen von medikamentenähnlichen Molekülen und ein Benchmark für neuronale Netzwerkpotenziale
nabla^2DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials
Kuzma Khrabrov, Anton Ber, Artem Tsypin, Konstantin Ushenin, Egor Rumiantsev, Alexander Telepov, Dmitry Protasov, Ilya Shenbin, Anton Alekseev, Mikhail Shirokikh, Sergey Nikolenko, Elena Tutubalina, Artur Kadurin
•
Jun 20, 2024
•
102
4
Anleitung zur Vorab-Trainierung: Sprachmodelle sind überwachte Multitask-Lerner.
Instruction Pre-Training: Language Models are Supervised Multitask Learners
Daixuan Cheng, Yuxian Gu, Shaohan Huang, Junyu Bi, Minlie Huang, Furu Wei
•
Jun 20, 2024
•
94
25
Der Teufel steckt im Detail: StyleFeatureEditor für detailreiche StyleGAN-Inversion und hochwertige Bildbearbeitung.
The Devil is in the Details: StyleFeatureEditor for Detail-Rich StyleGAN Inversion and High Quality Image Editing
Denis Bobkov, Vadim Titov, Aibek Alanov, Dmitry Vetrov
•
Jun 15, 2024
•
70
2
HARE: Humane Vorkenntnisse, ein Schlüssel zur Effizienz kleiner Sprachmodelle
HARE: HumAn pRiors, a key to small language model Efficiency
Lingyun Zhang, Bin jin, Gaojian Ge, Lunhui Liu, Xuewen Shen, Mingyong Wu, Houqian Zhang, Yongneng Jiang, Shiqi Chen, Shi Pu
•
Jun 17, 2024
•
40
1
Prism: Ein Rahmenwerk zur Entkopplung und Bewertung der Fähigkeiten von VLMs
Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs
Yuxuan Qiao, Haodong Duan, Xinyu Fang, Junming Yang, Lin Chen, Songyang Zhang, Jiaqi Wang, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
36
2
MMBench-Video: Ein Benchmark für ganzheitliches Videoverständnis mit langen Mehrfachaufnahmen
MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding
Xinyu Fang, Kangrui Mao, Haodong Duan, Xiangyu Zhao, Yining Li, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
34
1
Modellfusion und Sicherheitsabstimmung: Ein schlechtes Modell verdirbt die gesamte Gruppe.
Model Merging and Safety Alignment: One Bad Model Spoils the Bunch
Hasan Abed Al Kader Hammoud, Umberto Michieli, Fabio Pizzati, Philip Torr, Adel Bibi, Bernard Ghanem, Mete Ozay
•
Jun 20, 2024
•
31
1
Gedankentafel: Schrittweise Denken über Modalitäten hinweg
Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities
Sachit Menon, Richard Zemel, Carl Vondrick
•
Jun 20, 2024
•
29
1
Invertible Konsistenz-Destillation für textgesteuerte Bildbearbeitung in etwa 7 Schritten
Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps
Nikita Starodubcev, Mikhail Khoroshikh, Artem Babenko, Dmitry Baranchuk
•
Jun 20, 2024
•
28
1
GLiNER Multi-Task: Generalistisches Leichtgewichtsmodell für verschiedene Informationsextraktionsaufgaben
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks
Ihor Stepanov, Mykhailo Shtopko
•
Jun 14, 2024
•
26
3
PIN: Ein wissensintensiver Datensatz für gepaarte und verschachtelte multimodale Dokumente.
PIN: A Knowledge-Intensive Dataset for Paired and Interleaved Multimodal Documents
Junjie Wang, Yin Zhang, Yatai Ji, Yuxiang Zhang, Chunyang Jiang, Yubo Wang, Kang Zhu, Zekun Wang, Tiezhen Wang, Wenhao Huang, Jie Fu, Bei Chen, Qunshu Lin, Minghao Liu, Ge Zhang, Wenhu Chen
•
Jun 20, 2024
•
23
1
DigiRL: Training von Gerätesteuerungs-Agenten in freier Wildbahn mit autonomem Reinforcement Learning
DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning
Hao Bai, Yifei Zhou, Mert Cemri, Jiayi Pan, Alane Suhr, Sergey Levine, Aviral Kumar
•
Jun 14, 2024
•
20
1
Selbstspiel mit Ausführungsfeedback: Verbesserung der Anweisungsfolgefähigkeiten großer Sprachmodelle
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models
Guanting Dong, Keming Lu, Chengpeng Li, Tingyu Xia, Bowen Yu, Chang Zhou, Jingren Zhou
•
Jun 19, 2024
•
16
2
LiveMind: Große Sprachmodelle mit geringer Latenz und simultaner Inferenz
LiveMind: Low-latency Large Language Models with Simultaneous Inference
Chuangtao Chen, Grace Li Zhang, Xunzhao Yin, Cheng Zhuo, Ulf Schlichtmann, Bing Li
•
Jun 20, 2024
•
14
4
Verbesserung des visuellen gesunden Menschenverstands in Sprachmodellen durch die Erzeugung mehrerer Bilder
Improving Visual Commonsense in Language Models via Multiple Image Generation
Guy Yariv, Idan Schwartz, Yossi Adi, Sagie Benaim
•
Jun 19, 2024
•
13
2
Iterative Längenregulierung bei direkter Präferenzoptimierung: Eine Fallstudie zur Verbesserung von 7B-Sprachmodellen auf das Niveau von GPT-4.
Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level
Jie Liu, Zhanhui Zhou, Jiaheng Liu, Xingyuan Bu, Chao Yang, Han-Sen Zhong, Wanli Ouyang
•
Jun 17, 2024
•
13
1
REPOEXEC: Bewertung der Codegenerierung mit einem ausführbaren Benchmark auf Repository-Ebene
REPOEXEC: Evaluate Code Generation with a Repository-Level Executable Benchmark
Nam Le Hai, Dung Manh Nguyen, Nghi D. Q. Bui
•
Jun 17, 2024
•
11
1
ExVideo: Erweiterung von Videodiffusionsmodellen durch parameter-effizientes Feintuning
ExVideo: Extending Video Diffusion Models via Parameter-Efficient Post-Tuning
Zhongjie Duan, Wenmeng Zhou, Cen Chen, Yaliang Li, Weining Qian
•
Jun 20, 2024
•
10
3
τ-Bench: Ein Benchmark für die Interaktion von Werkzeugen, Agenten und Benutzern in realen Domänen
τ-bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains
Shunyu Yao, Noah Shinn, Pedram Razavi, Karthik Narasimhan
•
Jun 17, 2024
•
8
3
Modellinterne Antwortzuordnung zur Vertrauenswürdigen Retrieval-gestützten Generierung
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation
Jirui Qi, Gabriele Sarti, Raquel Fernández, Arianna Bisazza
•
Jun 19, 2024
•
7
1
StableSemantics: Ein synthetischer Sprach-Vision Datensatz semantischer Repräsentationen in naturalistischen Bildern
StableSemantics: A Synthetic Language-Vision Dataset of Semantic Representations in Naturalistic Images
Rushikesh Zawar, Shaurya Dewan, Andrew F. Luo, Margaret M. Henderson, Michael J. Tarr, Leila Wehbe
•
Jun 19, 2024
•
5
1
Von Erkenntnissen zu Handlungen: Die Auswirkungen von Interpretierbarkeit und Analyse Forschung im Bereich der natürlichen Sprachverarbeitung
From Insights to Actions: The Impact of Interpretability and Analysis Research on NLP
Marius Mosbach, Vagrant Gautam, Tomás Vergara-Browne, Dietrich Klakow, Mor Geva
•
Jun 18, 2024
•
5
1
Eine systematische Umfrage zur Textzusammenfassung: Von statistischen Methoden zu großen Sprachmodellen.
A Systematic Survey of Text Summarization: From Statistical Methods to Large Language Models
Haopeng Zhang, Philip S. Yu, Jiawei Zhang
•
Jun 17, 2024
•
5
2
Das Abtasten von 3D-Gaußszenen in Sekunden mit latenten Diffusionsmodellen
Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models
Paul Henderson, Melonie de Almeida, Daniela Ivanova, Titas Anciukevičius
•
Jun 18, 2024
•
4
1